Skip to content

Benchmark 与质量

当前我暂时不会把 benchmark 脚本与详细测试报告同步到 GitHub 仓库。

当前状态

  • 本地仍会持续维护 benchmark 与评测工作。
  • 公开文档暂时只保留轻量级能力说明。
  • 等基准测试流程适合开源后,这里会再同步对应脚本与测试报告。

说明

  • 当前 benchmark 方法论基于 RAGAS。
  • 仓库里出现的公开 benchmark 数字应视为阶段性快照,而不是持续更新的唯一事实来源。