4 Commits

Author SHA1 Message Date
c4037325ed feat: 实现基于LangExtract框架的MIMIC论文信息提取系统
- 新增info_extractor.py主文件,支持命令行参数和测试模式
- 实现src/extractor.py核心MIMICLangExtractBuilder类
- 集成vllm API服务(OpenAI兼容格式)进行结构化信息提取
- 支持5大模块提取:数据集、模型、训练、评估、环境配置
- 实现源文本定位和交互式HTML可视化
- 添加langextract和httpx[socks]依赖
- 支持个性化论文子目录结果保存
- 清理过时的experiment_runner.py和number_extraction_models.py文件
2025-08-25 20:51:30 +08:00
f7a06775ca feat: 实现基于Agno框架的SubAgent系统
- 新增SubAgent核心类,支持多LLM提供商
- 实现动态prompt模板构建功能
- 添加JSON结构化输出和零容错解析
- 集成配置管理和模型工厂模式
- 提供完整的错误处理和日志系统
- 支持阿里云、DeepSeek、OpenAI等主流LLM服务
2025-08-25 17:33:11 +08:00
27398dc890 feat: 实现论文爬取核心功能
- 新增src/crawler.py模块,实现PaperCrawler类
- 更新papers_crawler.py主文件,集成实际爬取逻辑
- 添加requests依赖支持HTTP请求
- 更新依赖锁定文件uv.lock
2025-08-23 16:33:36 +08:00
8213ae9a55 feat: 初始化MedResearcher项目
- 添加项目配置文件(pyproject.toml)
- 添加Python版本配置(.python-version)
- 添加项目文档(README.md, CLAUDE.md)
- 添加Git配置(.gitignore)
2025-08-23 00:20:41 +08:00