进入人类语言的维度更接近人类的理解和思维方式
中科院自动化所研究员,武汉人工智能研究院院长王金桥首先在AI SHOW栏目发表演讲,展示了基于瑞星AI基础软硬件平台的全球首个大三模模型紫东台初紫东台初通过跨模态多任务自监督学习,实现了图像,文字,语音,视频等不同模态数据的统一表示和相互生成,形成了完整的智能表示,推理和生成能力
王闯在AI的SHOW栏目中告诉嘉宾:在传统的人工智能学习中,可以通过视觉模型实现人脸识别,但我们不知道机器如何代表每个人的特征差异我们只能从图像中间结果的特征图来解释机器学习的过程通过自动太初三模态模型,我们可以实现图像,声音等的跨模态统一进入人类语言的维度,更接近人类的理解和思维方式
细数紫东台初的四大突破
1.多任务多层次跨模态自我监督学习
提出了多任务多层次跨模态自监督学习的训练框架,支持入门级,模态级和样本级的训练,实现了跨模态理解和生成的统一建模。
2.以图制声,以声制图第一次成为现实。
紫动太初是数据智能领域的最新发展趋势,通过首次链接语音,图像,文本的信息,形成完整的智能表示,推理和生成能力,为探索人类智能的本质提供了一个极好的平台。
3.首个拥有千亿级参数的多模态预训练模型。
紫东台初作为全球首个拥有数千亿参数的三模态模型,标志着中国从有限领域弱人工智能到通用人工智能路径的重要探索。
4.一专多能向多专多能突破
紫东台初对很多算法的性能都是全球最高的让AI从一种特定能力走向多专多能,同时在多个下游任务上超越行业最佳表现,构建完全自主的人工智能技术体系
除了向线上线下的参与者展示紫东台初的技术优势,王闯还表示已经实现了基础模型的开源和大模型的服务开放在不久的将来,他将开放新版本的紫东台初服务平台,支持低代码人工智能模型的训练,微调和部署通过API调用的模式,他可以自动上传数据,自动标注模型,自动形成推理部署的工具,自动体验效果
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。