微软亚洲研究院

AI Next 播客 S1E8 | 对话周礼栋：当系统开始“思考”，AI如何走向自主进化

已发布 2026年7月1日

分享这个页面

《AI Next》是微软亚洲研究院推出的一档利用 AI 技术制作的播客，内容聚焦 AI 前沿技术、科研趋势与社会影响。第一季主要围绕当今智能发展的核心议题，探索前沿趋势。 

作为本季收官之作，第八期节目请到了微软亚洲研究院院长周礼栋博士，与大家深度探讨 AI 与底层系统的协同进化，一起拆解智能时代基础设施的重构逻辑。周院长将通过解析系统智能的核心内涵、技术路径与可信基石，带我们穿透技术表象，看见 AI 时代最底层的变革力量。

嘉宾介绍

周礼栋

周礼栋博士现任微软公司全球资深副总裁、微软亚太研发集团首席科学家、微软亚洲研究院院长。

在康奈尔大学获得计算机科学博士学位后，周礼栋博士于2002年加入微软公司。他的职业生涯中遍及微软多个研究院，包括在微软硅谷研究院担任研究员，在微软雷德蒙研究院担任系统研究组首席研究员，以及在微软亚洲研究院担任常务副院长，并于2021年升任微软亚洲研究院院长。

周礼栋博士是系统研究领域首屈一指的专家，多年来一直专注于推动可靠、可信及可扩展的分布式系统的理论研究和实践探索。他在ACM操作系统原理大会（SOSP）、USENIX操作系统设计与实现大会（OSDI）和USENIX年度技术大会（ATC）上均获得过最佳论文奖。作为微软在设计和开发大规模分布式系统方面的重要技术带头人，周礼栋博士主持设计和开发的系统支持着微软从搜索引擎、大数据基础设施、云系统到AI基础设施的主要产品和服务。

周礼栋博士是电气电子工程师学会会士（IEEE Fellow）和国际计算机学会会士（ACM Fellow）。他曾是ACM计算机系统会刊（ACM Transactions on Computer Systems）、ACM计算机存储会刊（ACM Transactions on Storage）、IEEE计算机会刊（IEEE Transactions on Computers）的编委会成员。周礼栋博士还曾担任2017年SOSP大会联合主席，以及2023年ACM软件系统奖项评选委员会（ACM Software System Award Committee）主席。目前，他是SOSP指导委员会（Steering Committee）主席，并将担任2025年OSDI大会的程序委员会联合主席。

欢迎大家订阅、收听、分享！ 

作为一档由 AI 合成的播客栏目，《AI Next》播客音频和宣传视频背后包含微软亚洲研究院在合成 AI 领域的三项关键技术：VibeVoice 具备自然、富有表现力的语音合成能力，能够为最多4位说话者合成长达90分钟的高质量对话语音，为用户带来更灵动的声音互动感受。VASA 可将静态肖像与音频信号结合，合成情感逼真且拥有细腻面部表情的说话头像，为内容创作及辅助教育提供了全新的呈现方式。TRELLIS 则是一个 3D 物品生成模型，能依据文本提示或图片信息构建相应的 3D 效果，让复杂的概念设计可以在立体空间中被“看见”。目前，VASA 和 TRELLIS 技术可在微软的 Copilot 产品中体验，VibeVoice 也已在 Hugging Face 上开源。三项技术的加持将为内容创造者和听众带来 AI 技术演进的真实体验。

如下是《AI Next》第八期播客内容的文字整理：

系统智能初现：从人工调优到协同优化的突破

主持人：人工智能的性能越来越好，计算机系统作为支撑AI的底层基础，是否也在变得智能？若支撑AI的系统具备自主智能，将带来哪些变化？

周礼栋：这确实是一个非常前沿的话题。举一个例子，在分布式人工智能系统中，“聚合通信”是一个关键组件，它的调度效率直接决定了系统的整体性能。

传统调度依赖人工，工程师需分析日志、检查配置、开展大量实验，再进行调优，整个过程往往需要两三周，甚至更长时间。对此，我们与微软Azure团队合作开发了OptiFlow项目，为系统引入智能调度能力。我们构建了可学习的调度抽象，AI依据系统反馈持续生成调度方案，而系统负责验证、编译、执行并回传结果，从而形成闭环优化。最终自动生成的调度策略，性能可达到甚至超越人工方案。

这只是系统智能化的一个例子，真正值得深思的是这种AI与系统协同优化的模式本身。

主持人：AI 的发展速度极快，不少人认为底层系统已难以匹配其节奏。能否通俗地说明二者的不匹配主要体现在哪些方面？

周礼栋：当我们把系统看作AI的基础设施时，它当前还面临着三个方面的挑战：

其一，系统规模适配难。AI遵循规模法则（scaling law），性能会随模型、数据、算力扩张而提升，所以系统每隔一段时间就需要向更大规模拓展。每次扩容均需重构系统、更新设计方法、重估假设条件，以支撑更大规模的AI应用，这非常有挑战性。

其二，全栈设计特性要求严苛。若想让系统发挥更好性能，就要深度剖析AI工作负载、模型架构、软件及底层硬件，并确保各组件高效适配，实现难度较大。

其三，创新时效性不足。AI的创新速度持续加快，底层的硬件技术不断更新，促使系统要同步加快创新速度，才能跟上AI的发展节奏。

系统与AI协同进化，从单向依赖到双向重塑

主持人：系统与AI正在从“依赖”走向“共生”，为此，你提出“协同进化”的观点。那么，过往数十年系统领域的技术积累，如何为今日的 AI 奠定基础？AI又如何重塑系统设计理念？

周礼栋：回顾发展历程，AI规模法则推动其能力指数级增长，同时将底层系统推向高压力区间。

为了支撑这种增长，系统需要在硬件层面强化算力、架构层面提升伸缩性与灵活性。更重要的是，系统并非只是GPU、云平台或工具链，更是一种思维方式，一种管理复杂性、构建秩序的方法论。

过去数十年，系统领域积累了大量深刻且持久的原则与方法，例如抽象分层、关注点分离、容错机制、资源隔离等。这些原则支撑了操作系统、云计算等基础设施发展，为 AI 崛起提供了关键的技术土壤。接下来，这些原则仍将深刻塑造未来的AI 系统，尤其是正在快速发展的Agent Systems（智能体系统）。面向AI时代的新型计算操作系统正逐步成型，虽形态异于传统操作系统，但系统核心原则仍是其可靠、可扩展、可管理演进的基础。

主持人：很多人认为AI是一种“颠覆“，但从系统研究的视角看，它其实建立在过去数十年计算体系持续演进的基础之上。

周礼栋：二者具有很强的延续性。但随着AI带来的计算复杂度与动态性不断提升，传统系统的设计方法已逼近极限。我们越来越难以依靠传统的经验法则来预判系统的整体行为。单纯堆砌资源、线性扩容也无法支撑量级跨越。这如同登山，并非顺势而上，而是需要回到起点，重构假设、架构与路径。每一次量级提升，本质上都是一次系统重构。

在此过程中，我们认识到，AI不仅是系统的负载与挑战，更能够成为协同伙伴。面对复杂与不确定，AI可辅助规划、优化决策、自动调参，甚至参与系统设计与实现。系统为AI提供运行基础，AI反向重塑系统设计理念，这种双向作用构成了更深层次的共生，也预示着计算机科学正在进入一个全新的阶段。

构建“系统智能”的新范式

主持人：系统智能被视为计算领域的下一次飞跃。系统与AI协同进化、深度融合后，我们是否将进入智能系统时代？如何定义系统智能？它与 “AI赋能系统” 有何区别？

周礼栋：未来计算的核心并非追求速度，而是实现智能。系统智能，是指AI从代码生成升级为系统全生命周期的设计、优化与管理。未来的系统架构将从静态转向动态，成为能够依据高层目标，持续实现自适应、自演化的基础设施。

当前的关键不只是简单地用AI解决系统问题，要找准适配接口以发挥双方优势。AI擅长在复杂数据与庞大解空间中快速探索、枚举并生成大量候选方案，但其输出具有随机性与不确定性；而系统的优势在于确定性、稳定性、可验证性，以及通过抽象、接口和约束来管理复杂性的能力。

因此，二者融合不应止于AI辅助开发，而将催生全新设计范式：AI负责开放空间的探索、归纳与方案生成；系统负责定义边界、施加约束、验证反馈与落地执行。在这个闭环中，AI拓展系统的探索能力，系统将AI的不确定输出转化为可靠行为。真正的价值在于双向赋能。

主持人：前面提到，智能系统将使架构从静态转向动态，成为可按目标自适应、自演化的基础设施。我们应如何推动这类动态演化智能系统的发展？

周礼栋：推动其发展，核心在于让AI与系统从相互依赖走向真正的协同进化。这需要摒弃“头痛医头、脚痛医脚”的单点优化思路，转向系统性、结构化、可验证的协同创新，既要让AI具备理解系统、探索设计空间、提出演化路径的能力，也要让系统具备约束AI、验证AI、反馈AI、并将其输出可靠落地的机制。

这不仅是技术整合，更是系统设计范式的变革。系统不再只是AI的承载平台，而是AI演进机制的组成部分，AI也不再仅仅是运行于系统之上的应用，更是推动系统优化、自适应与自演化的内在引擎。系统需为AI提供清晰的抽象、接口、约束与反馈闭环；AI则可在复杂目标、运行状态与历史经验中开展大规模探索，助力系统发现优化方向与演化路径。

但真正重要的是将演化纳入系统原则约束，避免不可控的变化。未来智能系统需在目标驱动下动态调整架构、资源配置与执行策略，同时保持可验证、可解释、可回滚、可隔离、可治理。

换句话说，我们需要建立一套新的系统方法论，让AI负责开放空间中的探索与生成，让系统负责边界、验证、编译、执行和反馈。只有这样，动态演化才不会变成复杂性的进一步失控，反而会成为系统能力提升的规范机制。推动智能系统向前发展，并不是简单地把AI叠加进现有系统，而是要重构系统的底层构造逻辑。

可信基石：约束AI不确定性，筑牢智能系统安全防线

主持人：系统智能使AI从自动化迈向自主化，但系统追求确定性，AI存在随机性。打造自主演化的智能系统，应如何构建信任基石，保障其可靠、安全、正确运行？

周礼栋：这触及了系统智能能否真正成立的核心。系统智能意味着AI的自主化程度提升，但系统强调确定性、可靠性与正确性，AI却具有随机性、不确定性，甚至可能输出错误结果。因此，可信是构建自主演化智能系统的根本前提。

我认为，关键不是要求AI完全可信，而是要将AI的能力纳入系统原则的约束框架中。AI可在开放设计空间中探索、生成、优化并提出演化方案，但系统需要定义清晰的边界、约束与验收标准，以决定方案的执行、拒绝或回滚。简言之，AI负责提出可能性，系统负责建立可信性。

系统领域长期遵循“最小可信计算基（Trusted Computing Base）”原则，将核心可信逻辑集中于简洁、可审查、可验证的组件中。这一原则在AI时代尤为重要：AI可以存在不确定性，但承载、约束、验证并执行其输出的系统框架，必须具备确定性、可审查性与可治理性。

形式化方法是核心支撑。例如，微软雷德蒙研究院基于Rust语言开发的Verus验证工具，通过逻辑规范自动校验程序正确性，为系统行为建立了可证明的边界。我们也正在探索结合Verus与AI生成的经过验证的代码（verified code），并已取得扎实进展：AI可辅助生成代码、规范与证明线索，大幅降低形式化验证的门槛。

未来AI要生成可验证、符合规范的系统构件，形成 “AI 生成-规范约束-验证校验-执行反馈” 的闭环。构建信任基石，并非让AI成为绝对可靠的黑盒，而是以系统原则约束其不确定性，依托规范、验证、隔离、审计、回滚与反馈机制，使系统智能成为有边界、可治理的可控演化能力。

打破算力垄断，迈向开放多元的计算生态

主持人：当前大模型高度依赖GPU。你提出模型架构与硬件解耦可推动系统智能，此举将带来哪些改变？未来将形成怎样的计算生态？

周礼栋：从系统思维看，“适当解耦”是一个重要原则。有些要素强绑定时会相互制约。当前GPU主导硬件生态，模型设计需优先适配GPU，限制了架构创新空间；新硬件必须兼容GPU优化模型，否则难以落地，阻碍硬件突破。

主流 AI 模型均为GPU优化，若要逼近效率极限，必须打破强绑定。通过构建新型抽象与中间表示，能够实现模型与硬件解耦：模型可探索更高效、更激进的架构，硬件可突破GPU范式开展创新。

解耦需要系统与AI研究者长期深度协作，共同定义接口、推动生态演进，最终形成开放/多元的计算生态，摆脱单一架构的垄断。

培养跨学科人才，拥抱系统智能未来

主持人：系统智能不仅改变技术，也将重塑人才标准。科研教育如何培养兼具 AI 与系统能力的跨学科人才？对有志入行的年轻人有何建议？

周礼栋：系统智能的发展会重新定义人才能力的结构。未来人才需要兼具AI探索能力与系统核心思维，融合二者以解决复杂问题。AI可以帮助在巨大解空间中挖掘机会、生成方案，而系统专业能力，可提供抽象定义、标准接口、规则约束、效果验证与闭环反馈，让方案能够真正可靠落地。

科研和教育需强化交叉能力培养。一方面，要打牢系统基本功，包括操作系统、分布式系统、体系结构、编程语言、安全与形式化方法等。另一方面，要深入理解 AI，包括模型、数据、推理、Agent、评估与对齐等技术。更重要的是，要注重实战训练，将知识应用于真实场景。

年轻人要兼顾专业深度与领域跨度。在深耕单一领域、夯实基础的同时，不要太早把自己限制在狭窄的方向里，因为未来很多突破都会发生在AI与系统、硬件与模型、形式化方法与自动化生成之间。

我特别鼓励年轻人尽可能多地获得第一手经验，亲身参与系统构建、模型训练、性能调试、故障处理、理解真实约束，培养独立判断力。既要大胆构想未来系统形态，又要传承系统领域严谨、可靠、守原则的特质，成为兼具创新力与工程落地能力的人才。

主持人：感谢周院长的精彩分享。从“更快的计算”走向“更智能的计算”，我们看到的不仅仅是技术的迭代，更是AI与系统之间一场深刻的协同进化。

至此，《AI Next》的第一季全部结束，感谢大家的陪伴与收听。我们正在筹备第二季的节目，你最想听到哪些话题？或者希望我们邀请哪位重磅嘉宾？欢迎在评论区留言告诉我们。我们第二季再见！

研究领域

Artificial intelligence

研究组

Systems Research Group | Asia