Skip to content

辅助视觉模型

辅助视觉模型通过为图片生成详细的视觉描述,自动为纯文本模型启用图像支持功能。

设置

你可以在 设置 > 扩展 > 辅助视觉模型 中配置辅助视觉模型。只有支持图像输入的模型可供选择:

设置

如何使用?

像往常一样直接上传图片到聊天中。当你当前的模型不原生支持图像时,辅助视觉模型会自动处理它们:

[上传图片并询问关于图片的任何问题]
你在这张图片中看到了什么?

工作原理?

当你上传图片到聊天中时:

  1. 自动检测:系统检查你当前的模型是否支持图像输入
  2. 视觉处理:如果不支持,且已配置辅助视觉模型,则自动处理每张图片生成详细描述
  3. 无缝集成:在与纯文本模型通信时,使用视觉描述代替原始图片
  4. 缓存机制:生成的描述会被缓存,避免重复处理相同图片

辅助视觉模型生成综合性描述,重点关注视觉元素、物体、人物、文字内容、场景、颜色和构图。