![]() |
划重点:
微软正在自研人工智能推理模型,或与OpenAI竞争,并计划将这些模型出售给开发者。
微软已在Copilot中测试来自xAI、Meta和DeepSeek的模型,作为OpenAI模型的潜在替代品。
因OpenAI拒绝提供技术信息,微软AI负责人苏莱曼与该公司管理层发生冲突。
知情人士称,2024年秋季,苏莱曼在与OpenAI高层的视频会议中,针对双方技术协作机制提出了质疑。此次会议焦点集中于OpenAI最新研发的o1大模型底层逻辑透明度问题——苏莱曼要求OpenAI技术团队提供该模型“思维链”(Chain-of-Thought)的具体实现文档,但未能获得令其满意的结果。
根据微软之前与OpenAI达成的战略协议,微软130亿美元的战略投资不仅获得OpenAI技术成果的优先使用权,更包含核心算法的共享权益。此次会议因OpenAI未能履行协议中的技术透明条款而提前终止,直接暴露出双方在人工智能核心技术控制权上的深层矛盾。
作为微软人工智能战略的掌舵者,苏莱曼自2024年3月履职以来始终面临双重使命的平衡难题:微软既需要保持与OpenAI的深度协同,确保其技术红利持续反哺微软产品矩阵,同时又需加速自研AI技术的突破,减少对OpenAI的技术依赖。
自研模型
据知情人士透露,苏莱曼的副手卡伦・西蒙尼扬(Karén Simonyan)率领的团队,近期完成了微软内部代号MAI的系列模型的训练工作。在通用基准测试中,这些模型的表现几乎与OpenAI和Anthropic的先进模型不相上下。该团队同时还在训练推理模型,这些模型运用“思维链”技术来解决问题,未来极有可能与OpenAI的模型形成直接竞争态势。
苏莱曼团队已着手在微软的Copilot中尝试替换OpenAI的模型,转而采用性能更为强劲的MAI模型。据知情人士透露,微软计划于今年晚些时候将MAI模型作为应用程序接口(API)予以发布,让外部开发者能够将其集成至各自的应用程序中。这一计划此前从未被公开披露过,这意味着微软的模型将与OpenAI及其他人工智能实验室的API产品展开直面竞争。
在苏莱曼的统筹指导下,微软还通过测试OpenAI竞争对手的模型,进一步推进风险分散策略。这些模型涵盖了Anthropic和埃隆·马斯克(Elon Musk)的xAI,以及DeepSeek和Meta的开源模型。它们将被用于支持Copilot——微软内置于Windows、Edge浏览器及其他产品中的人工智能工具,而目前这些工具主要依赖OpenAI的技术。苏莱曼在一次采访中表示:“这是一个充满激烈竞争与强大创造力的时代。我们正在幕后测试几乎所有主要实验室的模型,包括全部开源模型。我们对它们进行测试与实验,这一情况并非此前任何人所预料到的。”
目前,尚无法确定苏莱曼这位人工智能领域的明星人物,能否成功助力微软实现人工智能领域的自给自足。尽管西蒙尼扬团队对MAI模型的性能颇为自信,但这些模型既未公开发布,也未在微软内部广泛应用,因此其实际质量难以评估。知情人士透露,MAI模型的训练历时近一年,期间遭遇了技术难题、战略调整以及核心人才流失等问题。部分核心人才的离职,源于他们对苏莱曼的管理方式和技术路线存在分歧。与此同时,OpenAI已完成多批尖端模型的训练与发布。
这些挫折致使一些外部人士对苏莱曼能否达成其宏伟战略持怀疑态度。风险投资家、专注于人工智能初创企业投资的纳撒尼尔・贝纳奇(Nathan Benaich)表示:“从外部视角来看,目前仍不清楚在苏莱曼领导下,这个团队过去一年取得了哪些实质性成果。他们需要让Copilot成为ChatGPT的有力竞争者,但我并不明晰他们将如何达成这一目标,也不清楚他们除了紧跟OpenAI的步伐外,是否还有其他独特策略。”
对微软而言,在人工智能领域的投入至关重要。微软在今年2月向股东披露,其所有业务中与人工智能相关的年化营收已超130亿美元,相较于3个月前100亿美元的年化营收有了显著增长。其中,大部分收入来自微软Azure云计算部门,包括OpenAI对Azure的大量使用,以及面向企业客户、基于OpenAI技术的Office 365产品和开发者工具(如 GitHub Copilot),而这些业务并不在苏莱曼的职责范围内。相反,他的职责范畴主要集中在微软的消费级应用领域,如必应和Windows。
不过苏莱曼认为,他的核心目标是为微软在未来十年实现人工智能自给自足奠定坚实基础,而非着眼于短期成果。尽管他所负责的业务在微软整体业务中占比较小,但其管理的产品可能对公司未来发展产生深远影响。苏莱曼指出:“我们在微软人工智能部门真正需要达成的,并非过度关注今明两年的业绩,而是要着眼于未来十年的长远发展。我们必须确保公司能够在内部构建出全球最卓越的模型,并与各界携手合作,共同推动技术进步。”
空降微软
2023年底,苏莱曼加入微软。在此之前,他与OpenAI曾有一段“惊险”的过往。彼时,OpenAI濒临崩溃边缘,其非营利性董事会解雇了首席执行官山姆・奥特曼(Sam Altman)。这一动荡局面令微软深感不安,毕竟微软在当年年初才刚推出基于OpenAI技术的必应聊天机器人,且对与OpenAI的后续合作有着宏伟规划。几周之后,OpenAI重新聘用奥特曼,大部分反对他的董事会成员也相继辞职,这才让微软稍稍松了一口气。
然而,微软董事会依旧对这种动荡状况心存忧虑,进而向微软首席执行官萨提亚・纳德拉(Satya Nadella)施压,要求其调整公司的人工智能战略,不能再完全依赖OpenAI。数月后,纳德拉聘请了苏莱曼。苏莱曼是人工智能领域的先驱人物,他是谷歌2014年收购的人工智能初创公司DeepMind的联合创始人。苏莱曼从自己创办的创业公司Inflection AI加入微软,入职时还带来了一份价值6.5亿美元的许可协议,使微软能够获取Inflection的技术。
苏莱曼迅速对微软内部的人工智能团队进行重组,将原本分散于不同项目的团队整合为一个全新的模型开发部门,由他的联合创始人、Inflection的首席科学官西蒙尼扬负责领导。他新组建的团队中,还包括时任必应首席执行官的米哈伊尔・巴拉金(Mikhail Parakhin),巴拉金此前负责将OpenAI的产品整合到搜索引擎中。
在纳德拉的支持下,苏莱曼从其他部门调配了多名工程师,其中就有之前负责微软小型语言模型Phi家族的研究团队成员。其他部门的高管,比如曾领导开发早期必应模型的索拉布・蒂瓦里(Saurabh Tiwary),以及负责Phi项目的Azure高管米沙・比伦科(Misha Bilenko),也开始向苏莱曼汇报工作。
不过,整合这些分散的人工智能团队并非易事。2024年3月底,苏莱曼加入微软仅仅几周后,巴拉金便因失去对必应业务的控制权而辞职。几周之后,巴拉金似乎在公开场合表达了对苏莱曼的不满。在苏莱曼发表关于人工智能对人类安全风险的TED演讲后,一些批评者对他的观点提出质疑,风险投资公司安德森・霍洛维茨基金的合伙人马丁・卡萨多(Martin Casado)便是其中之一,他在社交媒体平台X上称这些言论 “彻头彻尾的胡说八道”。
此后,微软持续出现人才流失现象。2024年8月,比伦科和蒂瓦里都离开微软,加入了谷歌的DeepMind部门。与此同时,一些必应工程师对苏莱曼的管理方式颇有微词,认为身为企业家和高管的苏莱曼,不像前任巴拉金那般关注人工智能开发的具体细节。巴拉金过去会定期与工程师开会审查代码,而苏莱曼采取了不同做法。
苏莱曼目前每月举行一次全员会议,向团队成员传达他设定的优先事项以及对人工智能行业的看法,并且每两周组织一次10到20人的小组讨论会。据知情人士透露,这些会议在制定组织整体议程方面颇有助益,但讨论内容常常涉及非技术性话题,例如员工的业余爱好。最近,苏莱曼开展了一系列引人注目的招聘行动,包括今年早些时候从谷歌DeepMind招募了四名前研究人员 。
挑战与进展
在苏莱曼加入微软之前,微软在开发自有人工智能模型方面已取得一定进展,这些模型未来有望取代OpenAI的模型。其中,Phi模型最为突出,它由侧重于学术研究领域的微软研究部门(Microsoft Research)于2023年首次开发。
微软的研究人员借助OpenAI的技术生成所谓的合成数据,以此来训练Phi模型。因而,Phi模型仅需消耗OpenAI技术所需算力和成本的一小部分,就能达到与OpenAI模型相近的性能。微软很快便开始在其Copilot产品中,用Phi模型替换部分OpenAI模型,以此节省成本,同时在Azure云计算平台上向开发者提供Phi模型。
苏莱曼加入微软后,Phi模型的主要研究员塞巴斯蒂安・布贝克(Sébastien Bubeck)开始直接向他汇报工作。在苏莱曼的指导下,布贝克着手将自己的AI训练方法应用于类似OpenAI的大模型,这些大模型旨在处理Phi模型及小模型难以胜任的更为复杂的任务。
据两位参与该项目的人士透露,在苏莱曼的领导下,Phi团队迅速获得了比在微软研究部门时规模更大的计算机集群,用于训练新模型。然而,更多的算力资源并未助力该团队取得预期成果。据参与项目的人士称,该团队至少有三次针对大模型的训练,每次耗费数百万美元,但结果均不理想。这些模型产生虚假或误导性结果(即幻觉)的比例颇高,且在提供简洁答案方面,不如OpenAI的模型可靠。苏莱曼和西蒙尼扬认为,这些问题源于布贝克运用AI生成数据训练Phi模型的方法;而布贝克认为问题出在训练过程的后期阶段。
到了2024年9月,布贝克离开了苏莱曼的团队,重回微软研究部门。他向同事表示,该团队计划继续训练比之前版本至少大五倍的Phi模型。此后,微软研究团队持续发布Phi模型的更新版本。到了10月,布贝克离开了微软,加入OpenAI。据两位参与相关项目的人士称,在OpenAI,他继续使用合成数据训练模型,还从微软挖走了多名前研究员。
布贝克离开微软前后,苏莱曼对OpenAI的不满日益加剧。后者开发出o1模型,能够通过较长时间的响应,更为精准地解决数学和逻辑问题。然而,OpenAI不允许微软查看o1推理过程中的 “思维链”,这使得苏莱曼及其团队难以在微软自身的AI模型中复制相关编程。
即便面临这样的阻碍,苏莱曼的AI团队在后续几个月中,仍成功复现了OpenAI的部分成果。由西蒙尼扬领导的模型训练团队开始运用 “思维链” 推理方法,以此提升输出质量,这一举措助力他们克服了模型训练数据所带来的挑战。
但OpenAI并未停止前进的脚步。其模型的发展速度超过了微软。在过去两个月里,OpenAI发布了o3的预览版,这是一款更为强大的推理模型,此外还推出了迄今为止规模最大的模型GPT-4.5。微软通过自主开发的模式能否追上OpenAI的步伐,仍有待进一步观察。
当前新闻共有0条评论 | 分享到: |
|
||||||||||
评论前需要先 登录 或者 注册 哦![]() |
24小时新闻排行榜 | 更多>> |
1 | 女面试官问:什么东西硬着进去 软着出来 |
2 | 这次跑得很彻底!李嘉诚又看到了什么 |
3 | 新闻周刊:川普这次大错特错了 |
4 | 白色石油问世 可满足全球数千年需求 |
5 | 对俄态度转弯!川普发文大变脸 |
48小时新闻排行榜 | 更多>> |
一周博客排行 | 更多>> |
1 | 赵晓:史无前例!白左+红左携 | 万维网友来 |
2 | 赵晓:茨威格的自杀与对川普的 | 万维网友来 |
3 | 小泽被正义带歪了 | 施化 |
4 | 川普超前布局 与俄联手应对未 | 胡亥 |
5 | 美国还需要盟友吗? | 阿妞不牛 |
6 | 高瞻:默茨的讲话和“欧洲政治 | 万维网友来 |
7 | 白宫闹剧撕脸大战剧透的剧梗 | 阿妞不牛 |
8 | 高瞻:欧洲编织了个谎言,却愚 | 万维网友来 |
9 | 白宫川泽会是个局 | 马黑 |
10 | 上海医院的天塌了/中国只有八 | 体育老师 |
一周博文回复排行榜 | 更多>> |
1 | 人民支持川总的每项政策.美国 | 木秀于林 |
2 | 白宫闹剧撕脸大战剧透的剧梗 | 阿妞不牛 |
3 | 一醉解千愁,一架解乱麻 | 倩影 |
4 | 美国还需要盟友吗? | 阿妞不牛 |
5 | 不知为何打起来,俄乌战争如何 | 不合群 |
6 | 答gugeren 兄的数学题 | Laober |
7 | 白宫川泽会是个局 | 马黑 |
8 | 川普 泽连斯基 -- 马戏团? | 远方的孤独 |
9 | 小泽被正义带歪了 | 施化 |
10 | 本来我十分同情小泽,但是~ | 山蛟龙 |