知识管理Case Study
RAG 质量评估与迭代工作台
发布时间2025/07/20
行业知识管理
面向知识问答场景的检索评估工具链,用于持续优化召回与答案可用性。
RAGEvaluationWorkflow
业务背景
早期 RAG 系统上线后,团队缺少统一评估流程,问题修复和效果追踪依赖人工经验。
我的职责
负责评估体系设计与数据闭环实现。
技术方案
- A.建立标准化评测样本,覆盖事实问答、流程问答和模糊问答
- B.将检索参数实验结果可视化,支持版本级对比
- C.引入失败样本回流机制,形成持续改进闭环
项目成果
- •团队可以基于同一套指标进行讨论与发布决策
- •减少“凭感受调参”,提高优化过程可追踪性
PythonFastAPILLMRAGEmbeddingVector Database