AI都能自己造AI了，下一个会造啥？

下一步，AI会先“造基础设施”：造高质数据和造编译器/算子。合成数据工厂把指令、代码、数学语料按需自动生成—筛—蒸馏—对齐一体化；并由智能体自动锻造与验证内核、并行与通信策略，让CUDA/Triton/TVM内核、显存规划与流水线调度按集群与任务深度定制。类似AlphaDev、AlphaTensor那样的算法搜索已证明这条路能换来真金白银的百分比级提速。中期会走向“造硬件、造机器、造实验”。AI把芯片从规格→RTL→版图联动搜索并做形式化验证，自动跑完EDA闭环；在具身智能里，AI协同设计机器人形态与控制器，驱动3D打印/装配，实现“AI造机→机造机”。科研端，AI将批量“造”可合成的新材料与药物，并直接下发到自动化实验室，形成假说—实验—发布的自驱动流水线，重写R&D速度常数。真正的门槛不是“能不能造”，而是“造得对不对”。下一战是把Harness升级为行业级验收：位级一致性、形式化证明、红队化安全评测三管齐下，把自造系统锁进可控边界。一旦解决这一点，迭代速度还会再翻倍。

“用完就扔”的代码，会是软件的未来吗？

会，但不是全部。用完就扔的代码会成为“任务型软件”的默认形态：数据清洗脚本、一次性的ETL/分析、A/B实验流水线、业务胶水、模型/硬件适配与内核优化这类高变场景，AI重写的边际成本已低于维护旧代码的总成本。再叠加无服务器/Agent编排与“按需算力”，从经济学上它更像一次性快照：快产、快验、快弃。但基础设施、金融、医疗、航空航天等高可靠领域仍需“长寿代码”。可预见的演化不是二选一，而是“可抛+可证”的混合范式：核心系统维持长期可维护，叶子节点由AI现场锻造，并用可执行规格与Harness约束；保留可审计工件（SBOM、哈希、运行轨迹、回放数据），配合沙箱、差分测试、属性测试、静态分析与可复现实验，确保一次性实现也可追溯、可回滚。这意味着研发组织的资产结构要换挡：沉淀的不再是代码本体，而是测试基线、数据治理、验证与观测链路。KPI从“代码行数/复用率”转向“回归通过率/故障间隔/单代迭代时长”。结论是：软件的未来将是“多数一次性，小部分长寿”，判断标准只有一个——验证与合规成本是否低于长期维护成本。

AI自我进化，我们正在见证新物种诞生吗？

还称不上“新物种”。我们看到的是人机协作范式的跃迁：研发被装进可评测、可回滚的工程闭环里，AI在既定目标、数据与算力配额下加速自我迭代。它不会自定目标、争取资源、也不会在无人监督下无限扩散——这与生物意义上的“物种”（具备自我复制与环境适应的开放式进化）相距甚远。但这确实像一次“相变”：从人写工具到AI写工具、再用工具造更强AI，形成自催化的创新引擎。类似迹象已在更广领域出现——AI已能发现更优算法、自动生成大规模系统代码并通过严苛测试。当迭代从“周”切到“小时”、训练框架能反超人写实现，竞争将转向谁能把评测、优化与部署的闭环做得更快更稳。判断是否逼近“自我进化”的临界点，不妨盯三件事：目标设定是否逐步由AI主导、AI生成改动在生产中的无人工批准占比是否上升、以及AI产出回流训练是否可控而不致模型退化。一旦这三者同时突破，物种的隐喻才真正有了技术学意义。

新知 - 大圆镜｜AI写的训练框架，比英伟达快了10%

对抗知识焦虑，从看懂这条开始

App 下载

从「通用成衣」到「专属定制」的框架革命

要理解这件事的分量，得先搞懂什么是「大模型预训练框架」——它就像AI训练的「生产线」，负责把海量数据喂给模型、调度计算资源、管理并行任务，是决定训练速度和成本的核心基础设施。过去的框架都走「通用成衣」路线：一套代码要适配所有模型、所有硬件、所有任务，就像一件均码T恤，谁都能穿但谁都穿不贴身。为了兼容各种情况，框架里塞满了冗余代码，真正用到的功能可能只占三成。

而这次AI写的框架，走的是「高级定制」路线——它不用兼顾所有场景，而是针对特定模型、特定硬件、特定任务，生成刚好够用的代码。你可以把AI想象成不知疲倦的工匠：拿到「给10亿参数模型做华为昇腾平台的训练框架」这个需求，它会先拆解任务需要的核心模块，比如张量并行策略、显存优化逻辑、硬件通信接口，然后直接生成最适配的代码，没有一丝多余的赘肉。

但AI写代码容易，怎么保证它写对？这里的关键是一个叫「Harness」的自动化测试系统——它像一个严格的考场，会自动生成各种测试用例，比如极端数据输入、高负载压力测试、硬件兼容性验证，让AI生成的代码反复跑测试，把错误反馈回去，再让AI迭代修改。这个闭环完全自动化，不用人类敲一行代码，就能把代码从「能用」优化到「好用」。

效率革命背后的产业逻辑

这套AI写的框架能比英伟达快10%，本质是把人类程序员的「经验优化」变成了AI的「穷尽式优化」。人类写代码时，会依赖过往经验选择「大概率最优」的方案，但AI可以在Harness的引导下，尝试几百种不同的实现方式，找到那个在特定场景下的绝对最优解——比如调整并行计算的颗粒度、优化显存的释放时机、减少硬件间的通信延迟，这些细节人类可能要花几周才能磨出来，AI只需要几个小时。

这种效率提升带来的不只是训练速度变快，更是产业逻辑的颠覆。过去大模型竞争拼的是「堆资源」：谁有更多GPU、更大的数据集、更多的研发人员。但当堆资源的边际效益越来越低，「提效率」就成了新的胜负手——同样的1000张GPU，用AI框架能比别人多训练出10%的模型版本，或者把训练周期从3个月压缩到2个月零20天。对烧钱的大模型行业来说，这10%的效率提升，就是真金白银的成本节省和迭代速度优势。

更值得注意的是，这种自动化框架给了国产硬件一个「弯道超车」的机会。过去国产芯片的短板之一是软件生态——没有足够的开发者为它优化代码。但AI写框架的成本极低，只要给它硬件的参数和需求，它就能快速生成适配的代码，相当于用AI的生产力填补了人力的缺口。这次的AI框架在华为昇腾平台上的加速效果，就是最好的证明。

开发者的角色，正在被重新定义

当然，AI写框架不意味着程序员要失业，反而会倒逼开发者的角色升级。过去程序员的核心能力是「写代码」，未来则会转向「定义需求、设计标准、监督AI」——就像从裁缝变成了时尚设计师，不用亲手缝衣服，但要告诉AI用户需要什么风格、什么尺寸、什么材质。

比如在这套AI框架的开发中，人类开发者做的是：定义训练框架的核心功能标准、设计Harness的测试逻辑、设定性能优化的目标，剩下的代码生成和迭代，全交给AI来做。这就要求开发者具备更高层次的能力：能看懂复杂系统的架构，能制定清晰的技术标准，能判断AI生成的代码是否符合需求。

但这里也有隐忧：AI生成的代码虽然高效，但可能缺乏可读性和可维护性。如果未来的系统全是AI写的黑箱代码，人类开发者可能会看不懂自己用的工具，一旦出了问题，很难排查和修复。这就像你买了一辆定制跑车，跑起来很快，但没人知道它的发动机是怎么装的，坏了只能找原厂修。所以，如何在AI自动化和人类可理解之间找到平衡，是接下来要解决的问题。

当AI开始搭建训练自己的生产线，我们看到的不只是一项技术突破，更是AI从「工具」向「合作者」转变的信号。过去我们说「AI制造AI」，还停留在调参数、写片段代码的阶段，现在AI已经能独立搭建核心基础设施了。

这背后的逻辑很简单：当AI的能力足够强，它就能把自己从「产品」变成「生产工具」，用更高的效率制造出更强的自己。效率，正在成为AI时代的核心竞争力。

未来的大模型行业，不会再是单纯的资源比拼，而是谁能把AI的自动化能力用到极致——用AI写框架、用AI调模型、用AI优化流程。这场效率革命的序幕，才刚刚拉开。

从「通用成衣」到「专属定制」的框架革命

效率革命背后的产业逻辑

开发者的角色，正在被重新定义

评论