《AI Next》是微软亚洲研究院推出的一档利用 AI 技术制作的播客,内容聚焦 AI 前沿技术、科研趋势与社会影响。第一季主要围绕当今智能发展的核心议题,探索前沿趋势。
作为本季收官之作,第八期节目请到了微软亚洲研究院院长周礼栋博士,与大家深度探讨 AI 与底层系统的协同进化,一起拆解智能时代基础设施的重构逻辑。周院长将通过解析系统智能的核心内涵、技术路径与可信基石,带我们穿透技术表象,看见 AI 时代最底层的变革力量。
嘉宾介绍
周礼栋
周礼栋博士现任微软公司全球资深副总裁、微软亚太研发集团首席科学家、微软亚洲研究院院长。
在康奈尔大学获得计算机科学博士学位后,周礼栋博士于2002年加入微软公司。他的职业生涯中遍及微软多个研究院,包括在微软硅谷研究院担任研究员,在微软雷德蒙研究院担任系统研究组首席研究员,以及在微软亚洲研究院担任常务副院长,并于2021年升任微软亚洲研究院院长。
周礼栋博士是系统研究领域首屈一指的专家,多年来一直专注于推动可靠、可信及可扩展的分布式系统的理论研究和实践探索。他在ACM操作系统原理大会(SOSP)、USENIX操作系统设计与实现大会(OSDI)和USENIX年度技术大会(ATC)上均获得过最佳论文奖。作为微软在设计和开发大规模分布式系统方面的重要技术带头人,周礼栋博士主持设计和开发的系统支持着微软从搜索引擎、大数据基础设施、云系统到AI基础设施的主要产品和服务。
周礼栋博士是电气电子工程师学会会士(IEEE Fellow)和国际计算机学会会士(ACM Fellow)。他曾是ACM计算机系统会刊(ACM Transactions on Computer Systems)、ACM计算机存储会刊(ACM Transactions on Storage)、IEEE计算机会刊(IEEE Transactions on Computers)的编委会成员。周礼栋博士还曾担任2017年SOSP大会联合主席,以及2023年ACM软件系统奖项评选委员会(ACM Software System Award Committee)主席。目前,他是SOSP指导委员会(Steering Committee)主席,并将担任2025年OSDI大会的程序委员会联合主席。
欢迎大家订阅、收听、分享!

作为一档由 AI 合成的播客栏目,《AI Next》播客音频和宣传视频背后包含微软亚洲研究院在合成 AI 领域的三项关键技术:VibeVoice 具备自然、富有表现力的语音合成能力,能够为最多4位说话者合成长达90分钟的高质量对话语音,为用户带来更灵动的声音互动感受。VASA 可将静态肖像与音频信号结合,合成情感逼真且拥有细腻面部表情的说话头像,为内容创作及辅助教育提供了全新的呈现方式。TRELLIS 则是一个 3D 物品生成模型,能依据文本提示或图片信息构建相应的 3D 效果,让复杂的概念设计可以在立体空间中被“看见”。目前,VASA 和 TRELLIS 技术可在微软的 Copilot 产品中体验,VibeVoice 也已在 Hugging Face 上开源。三项技术的加持将为内容创造者和听众带来 AI 技术演进的真实体验。
如下是《AI Next》第八期播客内容的文字整理:
系统智能初现:从人工调优到协同优化的突破
主持人:人工智能的性能越来越好,计算机系统作为支撑AI的底层基础,是否也在变得智能?若支撑AI的系统具备自主智能,将带来哪些变化?
周礼栋:这确实是一个非常前沿的话题。举一个例子,在分布式人工智能系统中,“聚合通信”是一个关键组件,它的调度效率直接决定了系统的整体性能。
传统调度依赖人工,工程师需分析日志、检查配置、开展大量实验,再进行调优,整个过程往往需要两三周,甚至更长时间。对此,我们与微软Azure团队合作开发了OptiFlow项目,为系统引入智能调度能力。我们构建了可学习的调度抽象,AI依据系统反馈持续生成调度方案,而系统负责验证、编译、执行并回传结果,从而形成闭环优化。最终自动生成的调度策略,性能可达到甚至超越人工方案。
这只是系统智能化的一个例子,真正值得深思的是这种AI与系统协同优化的模式本身。
主持人:AI 的发展速度极快,不少人认为底层系统已难以匹配其节奏。能否通俗地说明二者的不匹配主要体现在哪些方面?
周礼栋:当我们把系统看作AI的基础设施时,它当前还面临着三个方面的挑战:
其一,系统规模适配难。AI遵循规模法则(scaling law),性能会随模型、数据、算力扩张而提升,所以系统每隔一段时间就需要向更大规模拓展。每次扩容均需重构系统、更新设计方法、重估假设条件,以支撑更大规模的AI应用,这非常有挑战性。
其二,全栈设计特性要求严苛。若想让系统发挥更好性能,就要深度剖析AI工作负载、模型架构、软件及底层硬件,并确保各组件高效适配,实现难度较大。
其三,创新时效性不足。AI的创新速度持续加快,底层的硬件技术不断更新,促使系统要同步加快创新速度,才能跟上AI的发展节奏。
系统与AI协同进化,从单向依赖到双向重塑
主持人:系统与AI正在从“依赖”走向“共生”,为此,你提出“协同进化”的观点。那么,过往数十年系统领域的技术积累,如何为今日的 AI 奠定基础?AI又如何重塑系统设计理念?
周礼栋:回顾发展历程,AI规模法则推动其能力指数级增长,同时将底层系统推向高压力区间。
为了支撑这种增长,系统需要在硬件层面强化算力、架构层面提升伸缩性与灵活性。更重要的是,系统并非只是GPU、云平台或工具链,更是一种思维方式,一种管理复杂性、构建秩序的方法论。
过去数十年,系统领域积累了大量深刻且持久的原则与方法,例如抽象分层、关注点分离、容错机制、资源隔离等。这些原则支撑了操作系统、云计算等基础设施发展,为 AI 崛起提供了关键的技术土壤。接下来,这些原则仍将深刻塑造未来的AI 系统,尤其是正在快速发展的Agent Systems(智能体系统)。面向AI时代的新型计算操作系统正逐步成型,虽形态异于传统操作系统,但系统核心原则仍是其可靠、可扩展、可管理演进的基础。
主持人:很多人认为AI是一种“颠覆“,但从系统研究的视角看,它其实建立在过去数十年计算体系持续演进的基础之上。
周礼栋:二者具有很强的延续性。但随着AI带来的计算复杂度与动态性不断提升,传统系统的设计方法已逼近极限。我们越来越难以依靠传统的经验法则来预判系统的整体行为。单纯堆砌资源、线性扩容也无法支撑量级跨越。这如同登山,并非顺势而上,而是需要回到起点,重构假设、架构与路径。每一次量级提升,本质上都是一次系统重构。
在此过程中,我们认识到,AI不仅是系统的负载与挑战,更能够成为协同伙伴。面对复杂与不确定,AI可辅助规划、优化决策、自动调参,甚至参与系统设计与实现。系统为AI提供运行基础,AI反向重塑系统设计理念,这种双向作用构成了更深层次的共生,也预示着计算机科学正在进入一个全新的阶段。
构建“系统智能”的新范式
主持人:系统智能被视为计算领域的下一次飞跃。系统与AI协同进化、深度融合后,我们是否将进入智能系统时代?如何定义系统智能?它与 “AI赋能系统” 有何区别?
周礼栋:未来计算的核心并非追求速度,而是实现智能。系统智能,是指AI从代码生成升级为系统全生命周期的设计、优化与管理。未来的系统架构将从静态转向动态,成为能够依据高层目标,持续实现自适应、自演化的基础设施。
当前的关键不只是简单地用AI解决系统问题,要找准适配接口以发挥双方优势。AI擅长在复杂数据与庞大解空间中快速探索、枚举并生成大量候选方案,但其输出具有随机性与不确定性;而系统的优势在于确定性、稳定性、可验证性,以及通过抽象、接口和约束来管理复杂性的能力。
因此,二者融合不应止于AI辅助开发,而将催生全新设计范式:AI负责开放空间的探索、归纳与方案生成;系统负责定义边界、施加约束、验证反馈与落地执行。在这个闭环中,AI拓展系统的探索能力,系统将AI的不确定输出转化为可靠行为。真正的价值在于双向赋能。
主持人:前面提到,智能系统将使架构从静态转向动态,成为可按目标自适应、自演化的基础设施。我们应如何推动这类动态演化智能系统的发展?
周礼栋:推动其发展,核心在于让AI与系统从相互依赖走向真正的协同进化。这需要摒弃“头痛医头、脚痛医脚”的单点优化思路,转向系统性、结构化、可验证的协同创新,既要让AI具备理解系统、探索设计空间、提出演化路径的能力,也要让系统具备约束AI、验证AI、反馈AI、并将其输出可靠落地的机制。
这不仅是技术整合,更是系统设计范式的变革。系统不再只是AI的承载平台,而是AI演进机制的组成部分,AI也不再仅仅是运行于系统之上的应用,更是推动系统优化、自适应与自演化的内在引擎。系统需为AI提供清晰的抽象、接口、约束与反馈闭环;AI则可在复杂目标、运行状态与历史经验中开展大规模探索,助力系统发现优化方向与演化路径。
但真正重要的是将演化纳入系统原则约束,避免不可控的变化。未来智能系统需在目标驱动下动态调整架构、资源配置与执行策略,同时保持可验证、可解释、可回滚、可隔离、可治理。
换句话说,我们需要建立一套新的系统方法论,让AI负责开放空间中的探索与生成,让系统负责边界、验证、编译、执行和反馈。只有这样,动态演化才不会变成复杂性的进一步失控,反而会成为系统能力提升的规范机制。推动智能系统向前发展,并不是简单地把AI叠加进现有系统,而是要重构系统的底层构造逻辑。
可信基石:约束AI不确定性,筑牢智能系统安全防线
主持人:系统智能使AI从自动化迈向自主化,但系统追求确定性,AI存在随机性。打造自主演化的智能系统,应如何构建信任基石,保障其可靠、安全、正确运行?
周礼栋:这触及了系统智能能否真正成立的核心。系统智能意味着AI的自主化程度提升,但系统强调确定性、可靠性与正确性,AI却具有随机性、不确定性,甚至可能输出错误结果。因此,可信是构建自主演化智能系统的根本前提。
我认为,关键不是要求AI完全可信,而是要将AI的能力纳入系统原则的约束框架中。AI可在开放设计空间中探索、生成、优化并提出演化方案,但系统需要定义清晰的边界、约束与验收标准,以决定方案的执行、拒绝或回滚。简言之,AI负责提出可能性,系统负责建立可信性。
系统领域长期遵循“最小可信计算基(Trusted Computing Base)”原则,将核心可信逻辑集中于简洁、可审查、可验证的组件中。这一原则在AI时代尤为重要:AI可以存在不确定性,但承载、约束、验证并执行其输出的系统框架,必须具备确定性、可审查性与可治理性。
形式化方法是核心支撑。例如,微软雷德蒙研究院基于Rust语言开发的Verus验证工具,通过逻辑规范自动校验程序正确性,为系统行为建立了可证明的边界。我们也正在探索结合Verus与AI生成的经过验证的代码(verified code),并已取得扎实进展:AI可辅助生成代码、规范与证明线索,大幅降低形式化验证的门槛。
未来AI要生成可验证、符合规范的系统构件,形成 “AI 生成-规范约束-验证校验-执行反馈” 的闭环。构建信任基石,并非让AI成为绝对可靠的黑盒,而是以系统原则约束其不确定性,依托规范、验证、隔离、审计、回滚与反馈机制,使系统智能成为有边界、可治理的可控演化能力。
打破算力垄断,迈向开放多元的计算生态
主持人:当前大模型高度依赖GPU。你提出模型架构与硬件解耦可推动系统智能,此举将带来哪些改变?未来将形成怎样的计算生态?
周礼栋:从系统思维看,“适当解耦”是一个重要原则。有些要素强绑定时会相互制约。当前GPU主导硬件生态,模型设计需优先适配GPU,限制了架构创新空间;新硬件必须兼容GPU优化模型,否则难以落地,阻碍硬件突破。
主流 AI 模型均为GPU优化,若要逼近效率极限,必须打破强绑定。通过构建新型抽象与中间表示,能够实现模型与硬件解耦:模型可探索更高效、更激进的架构,硬件可突破GPU范式开展创新。
解耦需要系统与AI研究者长期深度协作,共同定义接口、推动生态演进,最终形成开放/多元的计算生态,摆脱单一架构的垄断。
培养跨学科人才,拥抱系统智能未来
主持人:系统智能不仅改变技术,也将重塑人才标准。科研教育如何培养兼具 AI 与系统能力的跨学科人才?对有志入行的年轻人有何建议?
周礼栋:系统智能的发展会重新定义人才能力的结构。未来人才需要兼具AI探索能力与系统核心思维,融合二者以解决复杂问题。AI可以帮助在巨大解空间中挖掘机会、生成方案,而系统专业能力,可提供抽象定义、标准接口、规则约束、效果验证与闭环反馈,让方案能够真正可靠落地。
科研和教育需强化交叉能力培养。一方面,要打牢系统基本功,包括操作系统、分布式系统、体系结构、编程语言、安全与形式化方法等。另一方面,要深入理解 AI,包括模型、数据、推理、Agent、评估与对齐等技术。更重要的是,要注重实战训练,将知识应用于真实场景。
年轻人要兼顾专业深度与领域跨度。在深耕单一领域、夯实基础的同时,不要太早把自己限制在狭窄的方向里,因为未来很多突破都会发生在AI与系统、硬件与模型、形式化方法与自动化生成之间。
我特别鼓励年轻人尽可能多地获得第一手经验,亲身参与系统构建、模型训练、性能调试、故障处理、理解真实约束,培养独立判断力。既要大胆构想未来系统形态,又要传承系统领域严谨、可靠、守原则的特质,成为兼具创新力与工程落地能力的人才。
主持人:感谢周院长的精彩分享。从“更快的计算”走向“更智能的计算”,我们看到的不仅仅是技术的迭代,更是AI与系统之间一场深刻的协同进化。
至此,《AI Next》的第一季全部结束,感谢大家的陪伴与收听。我们正在筹备第二季的节目,你最想听到哪些话题?或者希望我们邀请哪位重磅嘉宾?欢迎在评论区留言告诉我们。我们第二季再见!
相关阅读:
- 署名文章:硅基世界的“缘分”——系统与人工智能携手进化
- 文章:LLM2CLIP:以大语言模型重塑跨模态表征学习的文本基石
- 文章:Ananke:快速、透明的文件系统微内核恢复技术
- 微软研究院播客:NeurIPS 2024: The co-evolution of AI and systems with Lidong Zhou
- 论文:Fast, Transparent Filesystem Microkernel Recovery with Ananke
- 论文:EEPO: Exploration-Enhanced Policy Optimization via Sample-Then-Forget (opens in new tab)
- 论文:WaferLLM: Large Language Model Inference at Wafer Scale (opens in new tab)
- 论文:Aeolia: A Fast and Secure Userspace Interrupt-Based Storage Stack
声明:
《AI Next》是微软亚洲研究院推出的一档利用 AI 技术制作的播客,旨在探索合成生成式技术在内容制作和传播中的新形式与可能性。节目中的语音均非真人录制,而是由研究技术原型合成。其中,嘉宾语音由 VibeVoice 技术基于既定文字内容以及嘉宾声音样本合成,宣传视频中的嘉宾人物头像由 VASA 技术基于音频内容以及卡通风格合成和渲染。
作为一项探索性播客节目,《AI Next》中涉及的相关技术仍处于研究阶段,生成内容的表现可能受多种输入因素的影响。节目制作及发布遵循人工智能、数据安全与隐私保护相关的法律法规。节目中所使用的语音、文字与图像均获得嘉宾授权,仅用于科研与科普展示。微软亚洲研究院将持续对相关技术进行优化,提升节目的收听体验。
随着人工智能技术的快速发展,确保相关技术能被人们信赖是一个亟需解决的问题。微软主动采取了一系列措施来预判和降低人工智能技术所带来的风险。微软致力于依照以人为本的伦理原则推动人工智能的发展,早在2018年就发布了“公平、包容、可靠与安全、透明、隐私与保障、负责”六个负责任的人工智能原则(Responsible AI Principles),随后又发布了负责任的人工智能标准(Responsible AI Standards)将各项原则实施落地,并设置了治理架构确保各团队把各项原则和标准落实到日常工作中。微软也持续与全球的研究人员和学术机构合作,不断推进负责任的人工智能的实践和技术。
所有使用或转载本节目的个人与机构,在引用与传播时需明确标注相关内容“由AI技术合成”或者不得移除已有的标识,并避免任何可能引发误导或侵犯他人权益的使用方式。若您发现本节目内容或相关技术被非法使用,请通过微软安全响应中心(Microsoft Security Response Center)网站 (opens in new tab)进行举报。