辅助视觉模型
辅助视觉模型通过为图片生成详细的视觉描述,自动为纯文本模型启用图像支持功能。
设置
你可以在 设置 > 扩展 > 辅助视觉模型 中配置辅助视觉模型。只有支持图像输入的模型可供选择:
如何使用?
像往常一样直接上传图片到聊天中。当你当前的模型不原生支持图像时,辅助视觉模型会自动处理它们:
[上传图片并询问关于图片的任何问题]
你在这张图片中看到了什么?
工作原理?
当你上传图片到聊天中时:
- 自动检测:系统检查你当前的模型是否支持图像输入
- 视觉处理:如果不支持,且已配置辅助视觉模型,则自动处理每张图片生成详细描述
- 无缝集成:在与纯文本模型通信时,使用视觉描述代替原始图片
- 缓存机制:生成的描述会被缓存,避免重复处理相同图片
辅助视觉模型生成综合性描述,重点关注视觉元素、物体、人物、文字内容、场景、颜色和构图。