新浪科技讯 2月18日下午消息,阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款Step 系列多模态大模型向全球开发者开源,其中包含开源视频生成模型阶跃Step-Video-T2V,以及语音交互大模型阶跃Step-Audio,即日起可在跃问APP内体验。
据悉,阶跃Step-Video-T2V 模型的参数量达到300亿,可以直接生成204帧、540P分辨率的高质量视频,这意味着能确保生成的视频内容具有极高的信息密度和强大的一致性。从生成效果来看,阶跃Step-Video-T2V在复杂运动、美感人物、视觉想象力、基础文字生成、原生中英双语输入和镜头语言等方面具备强大的生成能力,且语义理解和指令遵循能力突出,能够高效助力视频创作者实现精准创意呈现。
在 LlaMA Question、Web Questions等5大主流公开测试集中,阶跃Step-Audio模型性能超过了行业内同类型开源模型,位列第一。阶跃Step-Audio在HSK-6(汉语水平考试六级)评测中的表现尤为突出,是最懂中国话的开源语音交互大模型。(文猛)
责任编辑:尉旖涵
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/32503.html