人工智能传来大消息!国际AI巨头要合作了!
9月24日-26日阿里巴巴一年一届的云栖大会正在进行,昨天阿里正式对外宣布将与人工智能芯片巨头英伟达开展Physical AI合作。
可能很多人还不理解什么是Physical AI?说通俗点就是:让机器能像人一样感知现实世界中的环境,以及理解物理规律,并能完成相应任务的人工智能技术,比如说让机器人自己在仓库里搬运和整理货物。
受此消息影响,昨天人工智能板块带头上攻,其中以多模态AI概念最为突出。原因也不难理解,要想机器人理解现实世界的环境和物理规律,必须要从软件系统上突破,这个软件系统指的就是大模型,且单一功能的大模型是不够的,必须是多模态AI模型。

什么是多模态AI模型?
所谓多模态,是指能同时处理文字、图像、音频、视频,甚至是嗅觉、触感信息的一种大模型,只有这样才能让机器人真正理解人类的现实世界,并完成人们交给他的任务。
阿里旗下的通义Qwen3是全球第一开源大模型,加上AI芯片龙头英伟达,两者强强联手,必将对多模态AI概念形成强势催化。
下文给大家梳理了4家最具技术实力的多模态AI企业,赶紧收藏吧。
第一家,云从科技
公司主营业务是人工智能解决方案及应用,聚焦视觉、语音及多模态领域,为智能网联提供智能大脑服务。
多模态AI业务亮点:云从科技研发了国内首个面向多模态人机交互的开放式AI操作系统(人机协同操作系统),该系统支持跨模态数据融合,已实现多模态场景落地。
第二家,当虹科技
公司主营业务是智能视频技术的算法研究及传媒文化产品,如超高清视频编解码技术。
多模态AI业务亮点:当虹科技拥有跨模态图像视频生成技术,发布了“跨模态体检视频AIGC”产品,可通过静态照片生成三维体积视频。同时,公司还参与了国家级核心标准制定,推动“百城千屏”超高清视音频传播系统。
第三家,万兴科技
公司的主营业务是数字创意软件,如视频编辑工具。
多模态AI业务亮点:万兴科技推出了国内首个视频创意为核心的百亿级参数多媒体大模型“天幕”,涵盖文本、图像、音频多模态生成能力,支持一键成片、AI美术设计、文生音乐等功能。
第四家,昆仑万维
公司主营业务是互联网平台(如Opera浏览器)及AI大模型的研发。
多模态AI业务亮点:昆仑万维在多模态AI的技术应用于内容创作、智能客服等领域,2025年海外收入占比达92.17%。
