辅助视觉模型

辅助视觉模型通过为图片生成详细的视觉描述，自动为纯文本模型启用图像支持功能。

设置

你可以在设置 > 扩展 > 辅助视觉模型中配置辅助视觉模型。只有支持图像输入的模型可供选择：

如何使用？

像往常一样直接上传图片到聊天中。当你当前的模型不原生支持图像时，辅助视觉模型会自动处理它们：

[上传图片并询问关于图片的任何问题]
你在这张图片中看到了什么？

工作原理？

当你上传图片到聊天中时：

自动检测：系统检查你当前的模型是否支持图像输入
视觉处理：如果不支持，且已配置辅助视觉模型，则自动处理每张图片生成详细描述
无缝集成：在与纯文本模型通信时，使用视觉描述代替原始图片
缓存机制：生成的描述会被缓存，避免重复处理相同图片

辅助视觉模型生成综合性描述，重点关注视觉元素、物体、人物、文字内容、场景、颜色和构图。