背景
在使用 MaxKB 构建基于检索知识库的 AI 对话问答应用时,存在对话过程中图片无法正常显示的问题。接下来就这一个问题展开讨论。
一、显示图片的前提
-
确认知识库命中片段含图片,并将该片段作为已知信息嵌入 AI 对话提示词。
-
若命中片段有图片但 AI 未回复图片,需在提示词中补充 “输出图片” 的要求。
-
若补充提示词后 AI 仍不输出图片,或因模型理解能力限制,建议尝试更换其他模型。
二、提示词的修改
在 AI 对话场景中,若期望回答内容附带图片展示,需在提示词中明确加入相关要求,以确保输出结果符合预期。
已知信息: {{知识库检索.data}} 问题: {{开始.question}} 回答要求: 对于已知信息中的图片,必须要在答案中进行输出。回答时要确保图片与内容相关且清晰美观。同时,在输出图片时,要使用适当的 Markdown 语法。 若已知信息中不包含图片,答案内无需输出任何图片,也不得提及 “图片”“配图” 等与图片相关的表述。
三、常见问题
3.1 命中分段不包含图片
对话结束后,在查看执行详情时,需确认知识库检索节点所命中的分段内容中是否包含图片资源。
3.2 分段未正确引用
知识库检索操作完成后,检索结果未实现正确引用。
3.3 知识库 PDF 未显示图片
导入知识库过程中,发现各分段的知识库片段均未正常显示图片。
解决方案:
-
在线转换:直接通过 MinerU 在线平台操作,访问地址为:https://mineru.net/ 。
-
API 调用:MinerU 提供 API 接口支持程序化格式转换,但需注意:当前 API 暂不支持直接上传文件,需按接口规范的要求(如传入文件链接等)完成调用。
将 full 和 images 放在一个新的文件夹下,并将文件夹压缩为 zip 格式,选择通用型知识库上传。
3.4 本地图片在知识库中未显示
利用 MaxKB 支持通过 图片相对路径 识别文档内图片的特性,将图片统一存放于独立文件夹,与目标文档打包为 ZIP 压缩包,按 “问答对(QA)” 形式上传至 MaxKB 通用型知识库。同时,为适配 MaxKB 导出路径规则,在这里所有文件以 ./oss/file
路径结构存储演示。
下面以 Excel 文档格式为例:
图片显示路径书写如下:
知识库效果如下:
测试效果如下:
3.5 模型原因
若排除上述所有问题后图片仍无法正常显示,可考虑模型因素。建议选用 OpenAI 的 GPT-4o、Gemini、Qwen 等模型,这些模型在图片处理方面表现更优。
四、总结
上文已对相关问题进行系统梳理,并提供了对应的解决办法。若存在未覆盖的其他问题,欢迎随时补充反馈,以便进一步完善解决方案。