据悉,在美国当地时间周四,微软旗下的Microsoft AI研究团队宣布了三项基础人工智能模型的研发进展,涵盖了文本、语音和图像生成等领域。

这一举措显示,尽管与OpenAI的合作关系密切,微软仍在积极构建自己的多模态人工智能技术栈,以应对行业内的竞争压力。
公告透露,MAI-Transcribe-1转录模型支持多达25种语言,并且速度是现有Azure Fast服务的两倍半;而音频生成器MAI-Voice-1每秒可生成60秒自定义语音,同样展现了技术上的优越性。此外,图像生成器MAI-Image-2也作为该系列的一部分被推出。
目前这三款模型已经通过Microsoft Foundry平台向公众开放,并且转录和语音合成模型已经在MAI Playground测试平台上上线。值得一提的是,MAI-Image-2已于3月19日率先在该平台上发布。
这些创新成果是由首席执行官穆斯塔法·苏莱曼带领的MAI超级智能团队研发完成的。据了解,这支团队于2025年11月份成立,并对外公开亮相。
苏莱曼在其官方博客文章中强调,“人文主义AI”是他们的核心理念,在开发过程中着重提高用户体验和实用性。他透露未来将有更多自主模型在Foundry平台以及微软的其他产品线中部署。
在当前大模型市场激烈竞争的情况下,微软采取了价格策略作为其竞争优势之一。官方指出,这三款模型的价格低于竞争对手谷歌和OpenAI相同功能的产品。
关于具体费用,MAI-Transcribe-1每小时最低0.36美元;MAI-Voice-1每百万字符起价22美元;而MAI-Image-2的文本输入与图像生成则分别按每百万词元5美元和33美元计算。
在加紧自主研发的同时,微软也没有忽视对外部合作伙伴关系的维护。苏莱曼在接受VentureBeat采访时重申了对OpenAI的合作承诺不会改变;而在与The Verge的对话中,则进一步透露了近期协议修订对其自身超级智能研究推进的重要意义。
截至目前为止,微软已经向OpenAI投入超过130亿美元,并通过长期合作关系将其模型无缝集成到自己的产品生态系统中。从基础算力支持到上层应用开发,微软的战略布局已清晰可见:就像在AI芯片领域采取自主研发和采购双轨并行的策略一样,在大型基础模型赛道上,微软同样选择了两条腿走路的方式。(易句)
(本文由AI翻译,网易编辑负责校对)
