Skip to content
GitLab
Projects Groups Topics Snippets
  • /
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
    • Contribute to GitLab
  • Sign in
  • P proj19-lingshu
  • Project information
    • Project information
    • Activity
    • Labels
    • Members
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributor statistics
    • Graph
    • Compare revisions
  • Issues 0
    • Issues 0
    • List
    • Boards
    • Service Desk
    • Milestones
  • Merge requests 0
    • Merge requests 0
  • CI/CD
    • CI/CD
    • Pipelines
    • Jobs
    • Schedules
  • Deployments
    • Deployments
    • Environments
    • Releases
  • Packages and registries
    • Packages and registries
    • Package Registry
    • Terraform modules
  • Monitor
    • Monitor
    • Metrics
    • Incidents
  • Analytics
    • Analytics
    • Value stream
    • CI/CD
    • Repository
  • Wiki
    • Wiki
  • Snippets
    • Snippets
  • Activity
  • Graph
  • Create a new issue
  • Jobs
  • Commits
  • Issue Boards
Collapse sidebar
  • Hustero_0
  • proj19-lingshu
  • Merge requests
  • !2

docs(logs): modify Log 02 and add Log 03, Log 04 for LingShu prototype and pipeline

  • Review changes

  • Download
  • Patches
  • Plain diff
Merged 赵烜熠 requested to merge zxy into main May 23, 2026
  • Overview 0
  • Commits 3
  • Pipelines 0
  • Changes 3

📝 变更概述 (Overview)

本次提交属于文档更新,主要归档了“灵枢(LingShu)”项目的最新开发日志(Log 02 - Log 04)。内容涵盖了官方反馈整理、数据集构建方案调整、系统 v0.1.0 原型脚手架初始化以及端到端流水线(Pipeline)的基础联调验证。

🔍 详细变更列表 (Changes)

1. 官方反馈整理与数据集方案调整 (Log 02 修正)

  • 核心调整:结合赛题维护方维真老师的邮件与私信反馈,将数据策略明确为“官方 benchmark 优先 + 自构数据集补充”。
  • 候选库确立:明确补丁候选集为 Linux upstream v3.10 之后的所有 commit(百万级规模),并规划了元数据过滤、Merge commit 剔除等清洗策略。

2. LingShu 项目原型脚手架初始化 (Log 03 新增)

  • 项目定名:系统正式命名为 “灵枢(LingShu)”,定位于宕机上游补丁跨模态检索与分析系统。
  • 工程结构建立:完成了 GitLab 项目工程目录树的初始化(划分 api/, extractors/, retrieval/, rerank/, advisor/ 模块)。
  • 文档完善:编写了标准 README.md,规范了本地虚拟环境配置及 Milvus、Streamlit 的启动命令。

3. 原型系统基础联调与端到端流程验证 (Log 04 新增)

  • 流水线打通:在 pipeline.py 中实现了“特征提取占位 -> 样例检索 -> 规则重排 -> 诊断顾问输出 Top-3”的完整闭环。
  • 接口验证:完成了 FastAPI 后端接口(/healthz)与 Streamlit Web UI 的基础联调,验证了模块间数据流(Schemas)的稳定性。

📂 目录结构确认

所有日志文件均已严格按照规范统一放置在 docs/logs/ 目录下:

  • 2026-05-16-log02-dataset-benchmark-strategy.md
  • 2026-05-19-log03-lingshu-scaffold.md
  • 2026-05-23-log04-pipeline-verification.md

注:请审查人注意,本次合并仅涉及 docs/ 目录下的 Markdown 开发日志,不包含任何业务逻辑代码修改。

Assignee
Assign to
Reviewers
Request review from
Time tracking
Source branch: zxy