作品复盘:用 RAG 做了一个课程问答助手
把课程文档、字幕和 FAQ 接进检索,做了一个能引用来源的问答助手,踩了一些切分和召回坑。
精选作品#RAG#作品复盘#课程
VIP Member6月8日
231 浏览3 回复这周做完了一个课程问答助手 Demo。
数据源包括课程文稿、视频字幕、常见问题和更新说明。最大的坑不是模型,而是文档切分:按段落切会丢上下文,按章节切又太长。
目前方案是章节摘要 + 小段原文双路召回,回答时强制带引用。
把课程文档、字幕和 FAQ 接进检索,做了一个能引用来源的问答助手,踩了一些切分和召回坑。
这周做完了一个课程问答助手 Demo。
数据源包括课程文稿、视频字幕、常见问题和更新说明。最大的坑不是模型,而是文档切分:按段落切会丢上下文,按章节切又太长。
目前方案是章节摘要 + 小段原文双路召回,回答时强制带引用。
双路召回这个思路很好,章节摘要可以显著提高问题定位。
可以再加一个“无法确定”的阈值,避免助手硬答。
引用来源最好能跳回课程具体小节,这样学习体验会更顺。
登录后参与讨论。