第一手 | 快手自研的文生图大模型“可图”来了,已于近期开启内测

如题所述

快手近期在人工智能领域取得了显著进展,自研的文生图大模型“可图”(Kolors)已在内部全面开启内测,彰显了快手在大模型业务方面的持续发力。继上个月推出大语言模型“快意”(KwaiYii)之后,快手在“文生文”领域之后,又在“文生图”领域补上了重要一环。

“可图”(Kolors)大模型展现出三大显著特点:强大的文本理解能力、丰富的细节刻画和多样的风格转化。通过内部平台测试版的首页展示,我们可以看出,“可图”(Kolors)已经具备成熟的产品形态。

虽然“可图”(Kolors)尚未对外开启测试,但快手App中两天前上线的“AI玩评”功能已通过内部测试版提供技术支持,为用户提供了一项新体验。该功能将AI生成技术应用于评论区,使得用户在观看视频后,可以直接获得与评论内容相关的图像,极大地提升了评论的互动性和趣味性。

“AI玩评”功能在上线之初便吸引了不少用户的积极参与,用户通过“AI”按钮进入功能界面,输入文字描述,系统随即生成相应风格的图像。无论是常规描述,还是古诗意境,甚至是特定语境下的表达,“可图”(Kolors)大模型均能准确理解并生成符合预期的图像,展现了其强大的文本理解和图像生成能力。

快手在AI研究方面投入了大量资源,拥有数十亿的图文训练数据,这些数据覆盖了常见的三千万中文实体概念,为大模型的训练奠定了坚实基础。自研的中文LLM与融合CLIP的图文特征相结合,使得“可图”(Kolors)大模型能更好地理解中文特色概念,有效减少了常见问题,如复杂概念的混淆和属性混淆。

在评论场景下,“AI玩评”功能的表现同样令人印象深刻。无论是表达心情的描述还是特定口语化的表达,系统都能生成贴切且有趣的图像,极大地增强了用户的参与感和满意度。

快手在大模型应用上强调“落地”原则,将功能与社区紧密结合,旨在让用户真正能感受到技术带来的便利。通过推出“AI对话”功能,快手提供了一种基于搜索场景的解决方案,帮助用户更便捷地找到平台上的相关内容。而“AI玩评”功能的引入,进一步展示了快手在大模型应用方面的创新思考和实践。

随着“可图”(Kolors)大模型的推出,快手在全模态大模型AIGC解决方案的构建上迈出了重要一步。这一举措不仅体现了快手在人工智能领域的持续投入和探索,也为内容公司如何在大模型基础上探索新玩法提供了借鉴。随着国内各大公司陆续推出大模型产品,快手如何在竞争中脱颖而出,持续创新,无疑是行业关注的焦点。
温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜