首次解决率 │ ~70% │ ~95% │ +35% │
│ 对话轮次 │ 3-4 轮 │ 1-2 轮 │ -50% │
│ 用户验证时间 │ 需要查证 │ 可直接用 │ -80% │
训练数据外的知识 (2025-2026) │ 1/5 │ 5/5 │ +400% │
└──────────────────────────────┴────────┴───────────┴───────┘
合成数据的核心价值
1. 获取训练数据之后的知识 - 2025-2026 年的框架变更
2. 更准确的细节 - 具体版本号、弃用时间线
3. 更完整的上下文 - 生态系统变化、最佳实践
报告已保存到 /root/final_comparison_report.md