📝 变更概述 (Overview)
本次提交属于文档更新,主要归档了“灵枢(LingShu)”项目的最新开发日志(Log 02 - Log 04)。内容涵盖了官方反馈整理、数据集构建方案调整、系统 v0.1.0 原型脚手架初始化以及端到端流水线(Pipeline)的基础联调验证。
🔍 详细变更列表 (Changes)
1. 官方反馈整理与数据集方案调整 (Log 02 修正)
- 核心调整:结合赛题维护方维真老师的邮件与私信反馈,将数据策略明确为“官方 benchmark 优先 + 自构数据集补充”。
- 候选库确立:明确补丁候选集为 Linux upstream v3.10 之后的所有 commit(百万级规模),并规划了元数据过滤、Merge commit 剔除等清洗策略。
2. LingShu 项目原型脚手架初始化 (Log 03 新增)
- 项目定名:系统正式命名为 “灵枢(LingShu)”,定位于宕机上游补丁跨模态检索与分析系统。
-
工程结构建立:完成了 GitLab 项目工程目录树的初始化(划分
api/,extractors/,retrieval/,rerank/,advisor/模块)。 -
文档完善:编写了标准
README.md,规范了本地虚拟环境配置及 Milvus、Streamlit 的启动命令。
3. 原型系统基础联调与端到端流程验证 (Log 04 新增)
-
流水线打通:在
pipeline.py中实现了“特征提取占位 -> 样例检索 -> 规则重排 -> 诊断顾问输出 Top-3”的完整闭环。 -
接口验证:完成了 FastAPI 后端接口(
/healthz)与 Streamlit Web UI 的基础联调,验证了模块间数据流(Schemas)的稳定性。
📂 目录结构确认
所有日志文件均已严格按照规范统一放置在 docs/logs/ 目录下:
2026-05-16-log02-dataset-benchmark-strategy.md2026-05-19-log03-lingshu-scaffold.md2026-05-23-log04-pipeline-verification.md
注:请审查人注意,本次合并仅涉及 docs/ 目录下的 Markdown 开发日志,不包含任何业务逻辑代码修改。