声明:本文来自于微信公众号头号AI玩家(ID:AIGCplayer),整理| 卷毛编辑| 张洁,授权站长之家转载发布。@LlamaIndex创始人Jerry Liu
如今,许多备受尊敬的科学家,都在各自的子领域中取得了进展。
CogAgent作为在CogVLM基础上改进的开源视觉语言模型,拥有更多的功能和性能优势。它支持更高分辨率的视觉输入和对话答题,能够处理超高分辨率图像输入。
多种配音角色选择: 提供多种配音角色,包括edgeTTS以及支持openai的TTS模型,用户可以根据需求选择最合适的配音风格。