AI 技术日报：基础模型、AI 政策与伦理、AI 智能体（2026-03-16）

2026年3月16日星期一 · 共 10 篇精选

编辑视角

2026年3月，AI 产业正经历一场从“语言幻觉”向“世界模型”的集体觉醒。AMI Labs 拿下的 10.3 亿美元种子轮融资不仅是一个惊人的数字，更是对当前“过度 LLM 化”现象的有力反击。谢赛宁和勒丘恩（Yann LeCun）的押注非常明确：如果 AI 无法理解物理世界的因果律与空间逻辑，它就永远只能是一个高水平的文字复读机。对于开发者而言，AMI Labs 的崛起预示着“世界模型”（World Models）将取代单纯的生成式技术，成为通向高级智能的新阶梯。我们正从预测下一个 Token 的时代，跨入理解物理实在的时代。

Niantic 的案例为这种转型提供了最真实的数据注脚。通过 140 万玩家收集的 300 亿张图像，Niantic 构建了一个厘米级的视觉定位系统（VPS）。这不仅仅是为了让机器人能送外卖，更是在为所有的物理 AI 提供一份“生存地图”。当传统 SaaS 公司还在为订阅增长乏力发愁时，拥有这种独占性、高精度空间数据的公司已经构筑了极深的竞争壁垒。这给工程师们的启示是：未来的竞争力不在于你会调用多少个闭源 API，而在于你如何构建一个能够感知、处理并反馈物理环境的闭环系统。

与此同时，开发者与 AI 的协作模式也正在发生质变。正如《智能体工程的八个等级》和 OpenAI 前 Codex 负责人 Michael Bolin 所言，现在的技术核心已经从“模型能力”转向了“环境工程（Harness Engineering）”。我们正在从简单的 Prompt 编写者，进化为复杂 Agent 环境的架构师。一个优秀的工程师不再纠结于模型能写多少行代码，而是关注如何构建沙盒环境、上下文聚合协议以及任务恢复机制。Bolin 提到的“Agent Inner Loop”揭示了残酷的现实：如果你的工程环境不支持自主规划与持续学习，那么再强的模型也只是空中楼阁。2026 年，平庸的编码工作将被彻底自动化，真正的机会属于那些能够构建“任务驱动型”Agent 系统的架构师。那些还停留在 Level 1 自动补全阶段的团队，将在这场 Agent 革命中迅速边缘化。

基础模型

基础模型作为生成式人工智能的核心引擎，正迎来新一轮的技术迭代与资本热潮。谢赛宁与杨立昆创办的AMI Labs近期获得逾10亿美元巨额融资，彰显了顶级人才与规模化算力在这一领域的决定性作用。我们将持续关注大模型架构的创新、多模态能力的演进，以及初创企业在竞争激烈的全球AI赛道中如何定义通用人工智能的未来。

谢赛宁与杨立昆创办AMI Labs：种子轮融资10.3亿美元，估值35亿

他们创立的AMI Labs（Advanced Machine Intelligence Labs），目前仅25人、在没有任何产品的情况下，完成10.3亿美元Seed轮融资，投前估值35亿美元。

“Silicon Valley is very LLM-pilled。”AMI联合创始人兼首席科学官谢赛宁说道，“硅谷已经深陷于LLM（大语言模型），完全被它催眠了。”

谢赛宁与图灵奖得主杨立昆共同创办的AMI Labs在仅有25人团队且无产品的情况下，完成了10.3亿美元的种子轮融资，投前估值达35亿美元。谢赛宁作为DiT共同作者，在访谈中尖锐指出硅谷已深陷于大语言模型（LLM）的“催眠”，忽视了更深层的人工智能演进路径。AMI Labs致力于研发“世界模型”，试图通过超越传统LLM的架构实现更高级的机器智能。谢赛宁还分享了其在Meta FAIR与Google DeepMind的研究经历，以及曾两次拒绝Ilya Sutskever邀请的细节。这一估值极高的创业项目反映了顶尖科学家对AI未来技术范式的全新布局。

来源: 张小珺Jùn｜商业访谈录

AI 政策与伦理

本栏目深入探讨人工智能领域的监管框架与道德准则，关注行业内法律诉讼与企业治理的最新动态。从 3.15 晚会曝光的 AI 投毒产业链到 Anthropic 对政府的法律挑战，我们解析政策变动如何影响技术研发与商业决策。通过追踪 Meta 和 xAI 等大厂的组织重组，本节旨在揭示全球 AI 政策走向及其对构建负责任技术生态的深远影响。

315晚会曝光AI投毒产业链，字节暂停Seedance 2.0发布，Meta传裁员20%

AI 大模型遭「投毒」：按照业内人士爆料，记者在多个网络平台查询搜索到了一项名为 GEO 的业务

字节跳动因陷入与好莱坞影视巨头的版权纠纷，已暂停其最新视频生成大模型 Seedance 2.0 的全球发布计划。

央视“3·15”晚会曝光了名为GEO的AI“投毒”产业链，服务商通过在互联网大量发稿操控大模型搜索结果以实现商业推广目的。由于涉及好莱坞版权纠纷及非法使用艺人肖像，字节跳动已暂停视频生成大模型Seedance 2.0的全球发布计划。与此同时，Meta被曝计划裁员约20%（超1.5万人），以应对高达6000亿美元的AI基础设施投入并利用AI提升的人效进行架构调整。数据显示，2025年中国人工智能家电渗透率将超50%，其中彩电已达70%。这些事件反映出AI技术在快速普及过程中，正面临严峻的伦理审查、版权法律及企业转型挑战。

来源: 爱范儿

Last Week in AI #338：Anthropic 起诉美政府；xAI 核心成员流失宣布重组

Anthropic 提起了两项诉讼——一项在加利福尼亚州北区，另一项在华盛顿特区巡回法院——辩称五角大楼新的“国家安全供应链风险”认定是非法的

本周又有两位联合创始人 Zihang Dai 和 Guodong Zhang（负责 Grok Code 和 Grok Imagine）离职，最初的 11 位创始人中仅剩下 Manuel Kroiss 和 Ross Nordeen

Anthropic 已针对特朗普政府和五角大楼提起两项诉讼，挑战将其列为“国家安全供应链风险”并禁止军方使用其技术的决定。该公司声称，在关于 Claude 使用限制（包括拒绝用于大规模监控和自主致命武器）的谈判破裂后，政府此举属于非法报复。国防部内部备忘录显示，军方已被要求在 180 天内从核武器及网络战等关键系统中移除 Anthropic AI。此外，OpenAI 和 Google DeepMind 的员工已提交法庭之友简报支持 Anthropic。与此同时，埃隆·马斯克宣布 xAI 正从底层重组，原 11 名联合创始人中仅剩 2 人在职。马斯克承认 Grok 在编程能力上落后于竞争对手，并正进行全面裁员和重组以期在年中实现追赶。

来源: Last Week in AI

AI 智能体

本栏目聚焦于 AI 智能体的前沿动态，涵盖从智能体工程的分级标准到 AI 驱动的测试驱动开发等核心议题。我们探讨如何通过构建严密的开发内环和线束工程，将大模型的潜力转化为实际生产力。随着智能体从简单的对话交互演变为具备自主任务处理能力的系统，这些技术范式的变革正在重新定义软件开发流程与人机协作的未来。

智能体工程的八个等级：缩小 AI 能力与实践的差距

AI 的编程能力正在超越我们驾驭它的能力。这就是为什么所有那些拼命刷 SWE-bench 分数的努力，并没有与工程领导层真正关心的生产力指标同步。

重心已经从过滤坏上下文转向确保正确的上下文在正确的时间出现。

AI 编程能力正迅速超越人类的驾驭能力，导致不同团队在使用相同模型时产生巨大的生产力差距。这一进阶之路被划分为八个等级，从基础的 Tab 补全和 Cursor 等智能 IDE 开始，逐步转向更复杂的工程实践。上下文工程通过提高 token 信息密度来优化模型输出，而复合工程则利用“计划、委派、评估、沉淀”的循环将经验固化。第五级引入了模型上下文协议（MCP）与自定义技能，使智能体能够直接操作数据库、API 及 CI 流水线。当智能体开始批量产出代码时，传统的代码审查将演变为自动化、技能驱动的审查模式，以消除人工审核带来的吞吐量瓶颈。

来源: 宝玉的分享

Simon Willison 谈智能体工程：AI 驱动的 TDD 转型与信任机制

我认为 Opus 4.5 是第一个赢得我信任的模型——我现在非常有信心，对于我以前见它处理过的问题类别，它不会做出任何愚蠢的事情。

所有优秀的编程智能体都知道什么是红绿 TDD，它们会开始反复尝试，如果你让它们先写测试，你得到可用代码的机会就会大大增加。

软件开发者在 AI 采纳过程中正经历从简单咨询到将大部分编码任务交给智能体的转变。Simon Willison 指出 Opus 4.5 是首个让他产生信任的模型，能够独立完成分页 JSON API 等任务而无需逐行审查代码。虽然 StrongDM 等公司提出了“不读代码”的极端模式，但 Willison 认为对于安全软件而言这种做法极其不负责任。他强调了在智能体工作流中应用“红绿 TDD”（测试驱动开发）的重要性，这种方法通过让 AI 先写测试再写逻辑，显著提升了输出的可靠性。开发者应像信任外部服务团队一样对待成熟的 AI 智能体，在享受自动化便利的同时保留调试能力。这种转向智能体工程的趋势正在重新定义现代软件开发的协作模式与质量标准。

来源: Simon Willison's Weblog

OpenAI Codex 负责人谈线束工程与 AI 代理开发新范式

线束工程是围绕模型设计的运行时层：工具接口、上下文组装与压缩、沙盒命令执行

模型提出行动方案；线束则对其进行约束、执行和验证。

线束工程（Harness Engineering）正在成为软件开发的重心，它通过构建运行时层来管理工具接口、上下文组装及沙盒化执行。OpenAI Codex 开源负责人 Michael Bolin 指出，工程领域的“内环”已从单纯依赖模型能力转向依赖模型周边的工具链、约束机制和反馈回路。为了提升 AI 代理的效能，开发者需要采用“代理优先”的仓库结构，例如引入 AGENTS.md 文件和显式规范来增强代码库的可读性。安全机制则依赖于操作系统级的沙盒隔离和策略执行，在模型提议操作时进行严密的约束与验证。随着开发者角色从编写代码转变为系统架构的塑造者，未来的交互界面将演变为管理多个并行代理线程的“任务控制中心”。

来源: Turing Post

AI 应用

本栏目聚焦人工智能在各领域的实际落地与创新应用，展示技术如何从实验室走向现实生活。通过分析如利用海量玩家数据训练机器人导航等前沿案例，我们深入探讨AI如何重塑空间计算与行业效率。这些报道揭示了数据驱动下智能化转型的最新进展，助力读者把握AI技术在实体世界中的巨大潜力与变革力量。

1.4亿玩家免费打工：Niantic利用300亿张宝可梦实景图训练机器人导航

累计贡献300亿高精图像数据集，已训练成机器人厘米级导航算法

1.4亿《精灵宝可梦Go》玩家在十年时间里开开心心拍照片，却不知不觉给AI收集了300亿张实景训练图像。

Niantic 通过《精灵宝可梦 Go》在十年间收集了由 1.4 亿玩家贡献的逾 300 亿张高精度实景图像。该数据集包含全球数百万个高价值点位，具备厘米级定位精度及多种天气和光照条件下的动态变化数据。Niantic 利用这些海量数据训练其视觉定位系统（VPS），使机器人能够在 GPS 失效的城市峡谷或室内场景中实现厘米级精准导航。目前，该技术已落地应用于 Coco Robotics 的配送机器人，辅助其在美欧地区完成超过 50 万次配送。这一案例展示了 Niantic 如何通过游戏化手段构建全球众包测绘网络，并将其转化为空间智能基础设施。

来源: 量子位

AI 商业

AI 商业版图正经历深刻变革，传统 SaaS 模式正加速向 AI 原生化及极致体验转型。本栏目聚焦全球巨头的战略布局，探讨人才培养与技术集成如何共同驱动区域经济增长。通过分析行业动态，我们揭示企业如何在智能化浪潮中通过创新投入重塑核心竞争力。

SaaS 增长放缓：市场正倒逼产品向 AI 化及“魔法”体验转型

企业软件的平均前瞻市盈率在四个月内从 39 倍跌至 21 倍——这是自 2002 年以来最剧烈的压缩。

HubSpot 的 NRR 降至 100%——这意味着他们需要增加 23% 的净新客户才能实现 23% 的增长。

企业软件的平均前瞻市盈率在四个月内从 39 倍暴跌至 21 倍，创下自 2002 年以来最剧烈的估值压缩。这一市场变化反映了用户对缺乏 AI 赋能的传统 SaaS 工具兴趣减退，这些工具已不再具备曾经的“魔法感”或增长动力。公有 SaaS 增长率自 2021 年见顶后持续下滑，HubSpot 等顶尖企业的净收入留存率（NRR）已降至 100%，意味着必须依靠大量获新才能维持增长。创始人必须反思产品是否仍具吸引力，并转向能够像 ChatGPT 或 Claude 一样通过自然语言交互并自主执行任务的 AI 原生体验。在所谓的“SaaS 大灾难”背景下，无法实现 AI 智能化转型的产品正面临被客户大幅削减预算或取消续费的风险。

来源: SaaStr

谷歌发布 AI Works for Europe 计划，拟投入 3000 万美元助力欧洲人才培养

我们今天宣布的首个‘AI Works for Europe’承诺，包括向 Google.org 的欧洲 AI 机会基金追加 3000 万美元的支持

广泛的 AI 采用有可能为欧洲的 GDP 带来 1.2 万亿欧元的增长

谷歌启动的“AI Works for Europe”计划向欧洲 AI 机会基金追加了 3000 万美元投入，并推出了全新的 AI 专业证书培训。自 2015 年以来，该公司已累计为超过 2100 万欧洲人提供了数字或 AI 技能培训，以适应不断变化的就业市场。研究显示，在英国和欧盟的 3100 万个初级职位招聘中，约 24% 的岗位明确要求具备 AI 相关技能。AI 技术的广泛应用预计将为欧洲 GDP 带来 1.2 万亿欧元的潜在增长。该计划将通过与 INCO 等非营利组织合作，免费为至少 50 所欧洲高校提供实用课程和职业支持。重点培训领域涵盖了信息通信技术、物流、市场营销和金融等高需求行业。

来源: The Keyword (blog.google)

AI 基础设施

本栏目聚焦支持 AI 应用的核心硬件与软件框架，涵盖向量数据库、边缘计算及云端协同方案。我们深入探讨如何构建高效、可扩展的基础架构，以实现实时视频分析与海量数据处理。通过解析 Qdrant 等前沿工具的实践案例，为企业部署高性能人工智能系统提供深度的技术指南与行业洞察。

Qdrant 与 Twelve Labs：从边缘到云端的视频异常检测方案

Qdrant Edge 直接在 NVIDIA Jetson 设备上运行，采用双分片架构

边缘到云端的升级机制使云端处理量减少了约 6 倍，同时捕捉到约 95% 的真实异常

该视频异常检测系统通过将检测任务转化为向量相似度搜索，实现了无需特定异常标签训练的实时监控。Qdrant Edge 在 NVIDIA Jetson 设备上直接运行，支持亚毫秒级的 kNN 向量距离计算，并能与云端同步基准数据。采用 Twelve Labs Marengo 3.0 模型后，系统在处理时间动态和场景上下文方面的 AUC-ROC 达到 0.97，远超传统的 CLIP 模型。这种边缘到云端的架构将云端处理量降低了约 6 倍，同时捕捉到了约 95% 的真实异常。系统不仅能提供实时异常评分，还能生成自然语言事件报告并支持跨摄像头的语义视频检索。这种方案在保证边缘端离线韧性的同时，利用 Vultr 云端 GPU 实现了高效的分析能力。

来源: Qdrant

本报告由 WindFlash AI 自动生成，内容基于过去 48 小时内的公开 AI 资讯。