【文章来源:techweb】
一、重磅工具:Claude 获 「技能」 加持,「瑞士军刀」 已上膛
新闻:Anthropic 公司为其 AI 模型 Claude 推出了名为 「技能」(Skills) 的新功能。这是一种可按需加载的自定义指令与工作流打包机制。Claude 可以在相关场景中动态调用 「技能」,无需冗长的上下文即可处理专业化任务。「技能」 新功能支持将代码规范、报告格式或分析等团队特定工作流程进行编码并存储,并通过设置界面和 SDK 统一管理。「技能」 具备可组合性与可移植性,开发者可将多个 「技能」 整合成定制化工作流,通过 Claude 应用、Claude Code 及其 API 无缝调用。
Anthropic 同步发布了实施指南与资源库,其中包含创建自定义 「技能」 的说明,并在相关资源库中提供可处理 Excel 和 PPT 等任务的预置 「技能」。这种新功能与 MCP(组件化模块协议) 相辅相成,有效扩展了 AI 模型的智能体能力。由于 「技能」 的资源库是开源的,有望像 MCP 一样获得广泛采用。
「技能」 功能现已作为功能预览版向 Pro、Max、Team 及 Enterprise 等订阅计划的用户开放。
锐评:等于给 Claude 配了把可随时换技能的瑞士军刀。
二、AI 技术与产品发布:从会拍片的 Sora 到会打工的 Haiku,软硬件多点爆发
1. 新闻:Anthropic 正式发布 Claude Haiku 4.5。这是一款面向大规模智能体系统与复杂思维链的高速低成本模型。在编码与智能体任务基准测试中,Haiku 4.5 表现突出,其在 SWE-bench 的通过率为 73.3%,Terminal-bench 得分 41%,综合表现直逼 Claude Sonnet 4。其卓越的性能、高速率与合理的成本定位,使其成为智能体 AI 应用的理想选择。Anthropic 强调:「Sonnet 4.5 擅长将复杂问题解构为多阶段计划,并能协调多个 Haiku 4.5 实例并行执行子任务。」
锐评:Haiku 4.5 貌似 「物美价廉」 的实习生,专门给 「项目经理」Sonnet 4.5 打下手。
2. 新闻:谷歌发布 Veo 3.1 及 Veo 3.1 Fast,新增原生音频增强、精准叙事控制、参考图像引导及长视频场景扩展功能。Veo 3.1 引入的首尾帧转场与 「素材融合」 特性支持将多张参考图像合成动态视频。业界评测认为,Veo 3.1 在音频质量、图像转视频的契合度以及画面一致性方面均有所提升。目前用户可通过 Gemini API 体验付费预览版,该模型兼容 AI Studio、Vertex AI、Gemini 应用及 Flow 平台。
锐评:谷歌这是铁了心要当 AI 界的 「全能导演」。
3. 新闻:OpenAI 发布 Sora 2 更新,默认视频时长延长至 15 秒,最长可生成 25 秒视频。Pro 订阅用户新增 「故事板」 功能,支持逐秒规划视频,实现更精细的生成过程控制。不过,Sora 2 近期因生成涉及公众人物的视频引发版权与伦理争议。OpenAI 强调公众人物及其家属应有权控制 AI 生成内容中的自身形象。
锐评:AI 造戏越来越溜,但千万不能随便把名人当角色。
4. 新闻:百度 MuseStreamer 现可生成 20 秒以上视频。该模型支持实时交互式长视频生成,用户可动态改写剧情或延长过渡。
锐评:时间加长还能随时改戏,国内视频 AI 也是卷起来了。
5. 新闻:World Labs 发布实时生成型世界模型 RTFM,可交互式渲染 3D 一致性场景。官方技术博客阐明该模型聚焦效率、可扩展性与时间一致性三大目标,并演示了如何用单张 H100 显卡部署密集型世界模型。公开演示版支持用户实时探索生成的世界。虽然 RTFM 现阶段仍属概念验证,但已趋近实用化。
锐评:RTFM 是想用一块 H100「装下全世界」。
6. 新闻:OpenAI 优化 ChatGPT 记忆管理机制,通过自动内存管理解决"存储已满"问题,旨在提升系统可靠性并降低用户侧的存储限制。
锐评:系统不再老是因为记忆满格而卡壳,用户体验要轻快不少。
7. 新闻:微软以 「让每台 Win11 电脑变身 AI PC」 为目标,推出操作系统级 Copilot 语音智能体。这项集成至系统底层的安全沙箱技术,支持后台语音驱动的任务执行,专为多任务并行场景下的智能工作流设计。该公司表示 「Copilot 语音与视觉功能的突破性价值在于交互的便捷性。用户通过唤醒词 『Hey Copilot』 即可用自然语言下达指令,视觉模块则可在获得授权后实时分析屏幕内容,提供应用教学、项目建议或操作指导。」
锐评:微软是铁了心推 Copilot 语音助手。
8. 新闻:Cognition 推出 SWE-grep 和 SWE-grep-mini 两款经强化学习训练的多轮上下文检索智能体,专精 AI 代码搜索。这些模型能快速呈现关联代码段,为 Windsurf Fast Context 子智能体提供核心动力,并通过高并行架构显著降低搜索延迟。
锐评:这次是给 AI 配了个 「代码搜索引擎」,程序员的 「工具箱」 快被 「一锅端」 了。
9. 新闻:Facebook 推出 AI 自动选片功能,帮助用户从相册中挑选最佳照片或视频以生成动态或帖子,有效简化了内容创作流程。
锐评:专治 「选择困难症」,以后发圈终于不用纠结。
10. 新闻:针对 AI 内容泛滥的舆论反馈,Pinterest 新增内容管控工具,允许用户在美容、艺术等特定板块限制生成式 AI 内容的显示,并强化了内容标签功能。这种用户主导的 AI 接触管理机制,值得其他社交媒体平台学习借鉴。
锐评:主打眼不见为净。
11. 新闻:谷歌为 Gemini API 引入 「谷歌地图数据关联」(Grounding with Google Maps) 功能,使模型可依托最新地理数据生成更准确的本地化回答。这一功能可与搜索引擎关联组合使用,进一步保障信息真实性,相关演示案例已在 AI Studio 开放测试。
锐评:Gemini 接上 「谷歌地图」,精准回答 「附近有啥好吃的」。
12. 新闻:谷歌升级 AI Studio,优化了开发者与用户体验。新版本推出集成 Gemini、生成式媒体模型、语音合成与实时模型的统一工作台 Playground,简化了模型切换流程并优化了聊天界面的一致性。
锐评:开发者少了来回切换的烦恼。
13. 新闻:针对通过 API 构建 Claude 智能体的开发者,AWS 已经在 Amazon Bedrock 上集成了最新的 Claude 模型 Opus 4.1、Sonnet 4.5、Haiku 4.5。其中 Haiku 4.5 的 API 定价为每百万输入/输出 token 1/5 美元。
锐评:云巨头的 AI 资源库主打一个 「我全都要」。
14. 新闻:英伟达开始出货 DGX Spark。这款桌面级 AI 超级工作站专为本地推理与原型开发设计,上市即售罄。LMSYS 的独立评测列出了其规格与性能亮点:GPU(GB10) 峰值性能达 1 PFLOP(FP4 张量),整体算力介于 RTX 5070 与 5070 Ti 之间;其革命性突破在于采用了 128GB 的统一内存架构,实现 CPU 与 GPU 内存池的无缝共享。这种统一架构使 DGX Spark 能直接加载运行大模型,彻底规避了系统内存与显存间的数据传输开销,让 DGX Spark 可运行的 AI 模型规模远超传统台式机。据悉,英伟达首席执行官黄仁勋在星舰第 11 次试飞前后,亲自向马斯克交付了 DGX Spark。
锐评:算得上 AI PC 中的爱马仕。
15. 新闻:OpenAI CEO 萨姆·奥特曼 (Sam Altman) 称将于今年 12 月份起放宽 ChatGPT 内容限制,向通过认证的成人用户开放成人向内容。此举旨在打造类似 GPT-4o 风格的可定制个性化体系,在保障安全的前提下实现不同年龄段用户的差异化服务。
锐评:兜兜转转还是没绕开人类本能。
三、AI 研究资讯:从 「解码癌症」 到 「掌控核聚变」,谷歌 「炼丹」 不止
1. 新闻:谷歌推出开源癌症变异分类模型 DeepSomatic。它能精准区分遗传变异与体细胞变异,在复杂样本测试中表现超越现有方案。
锐评:AI 在医学界又当起了显微镜和第二只眼。
2. 新闻:谷歌与耶鲁大学合作发布基于 Gemma 架构的癌症研究模型 Cell2Sentence-Scale 27B。该模型基于超 10 亿 token 的转录组与生物数据训练,能将 RNA 序列信息表示为文本式 「细胞句子」。研究人员运用 C2S-Scale 进行单细胞分析,成功识别出经湿实验验证的潜在癌症治疗路径。该研究的论文预印本与模型已经同步公开。
锐评:科研人员的解码器又升级了。
3. 新闻:谷歌 DeepMind 与 Commonwealth Fusion Systems 达成合作,通过深度学习实现等离子体控制以加速聚变能源研发。这一 AI 系统结合深度强化学习与 TORAX 模拟器,优化了等离子体控制与托卡马克装置的性能,推动清洁且无限的聚变能源迈向现实。
锐评:AI 不只能看天象,还想造星。
四、AI 商业与政策:大厂芯片狂飙,高盛高喊 「继续投」
1. 新闻:OpenAI 宣布与博通合作开发定制 AI 芯片。OpenAI 负责加速器与系统架构设计,博通将于 2026 年下半年启动量产部署。该项目目标是实现 10GW 算力规模,为下一代前沿模型与大规模推理提供基础支撑。此次合作标志着 OpenAI 向开放基础设施战略转型,通过博通以太网技术多元化其计算架构,也凸显出 AI 专用芯片在推理阶段的重要性。
锐评:算力界又要有新玩家和新规则。
2. 新闻:英伟达透露 Meta 与 Oracle 将在 AI 数据中心网络标准化中采用 Spectrum-X 以太网架构,训练效率与扩展性是选择这一开放加速方案的主因。
锐评:老黄不仅卖 「算力」,还要插手 「网线」 生意。
3. 新闻:苹果发布 M5 芯片,宣称峰值 AI 性能较 M4 提升 4 倍,专为下一代设备端 AI 负载打造。M5 将率先用在新款 MacBook Pro、iPad 及 Vision Pro 上,预计数周内上市。
锐评:如果 Siri 还是那个智障,这 4 倍性能大概也只能用来 P 图。
4. 新闻:英特尔公布一款搭载 160GB 内存、具备高能效的数据中心 GPU,并将其加入该公司的 AI 加速器组合,旨在推动英特尔以开放系统与软件架构为核心的新 AI 战略。这款 GPU 代号为 「Crescent Island(新月岛)」,根据英特尔介绍,它专为运行推理工作负载的风冷企业级服务器而设计,强调 「功耗与成本优化」。Crescent Island 采用 Xe3P 微架构,配备 160GB LPDDR5X 内存,并支持多种数据类型,为大语言模型提供充足运行空间。
锐评:英特尔想用 「性价比推理」 从英伟达 「虎口夺食」。
5. 新闻:Spotify 与主流唱片公司达成协议,共同开发 「负责任」 的 AI 产品体系,确保持续尊重版权、保障艺术家收益,并为音乐人保留自主选择是否授权 AI 工具使用自己作品的权利。该公司还同步设立 AI 研究实验室,集中精力研发以艺术家权益为核心的技术方案。
锐评:Spotify 先下手为强,拉着唱片公司 「拜山头」。
6. 新闻:谷歌母公司 Alphabet 计划在印度南部投资超 100 亿美元,两年内于安得拉邦港口城市维沙卡帕特南建设一座 1 吉瓦级数据中心。这标志着谷歌在全球扩张战略中押注印度市场。
锐评:「三哥」 的电网扛得住吗?
7. 新闻:中国工程院院刊 《Engineering》 评选的 「2025 全球十大工程成就」 在 「2025 年世界工程组织联合会全体大会暨全球工程大会」 上正式发布。其中英伟达 Blackwell GPU 架构和 DeepSeek 开源大语言模型上榜。
锐评:大厂技术上榜,当之无愧。
8. 新闻:苹果公司正进行重大战略调整:暂停开发更轻便、低价的 Vision 头显 (内部代号或为 「Vision Air」),将资源集中于智能眼镜的研发。据长期跟踪苹果动态的资深分析师马克·古尔曼 (Mark Gurman) 透露,在亲身体验了竞争对手 Meta 新推出的内置显示屏智能眼镜后,他确信苹果的这一转向是明智之举。
锐评:库克明白过来,没人想顶着个 「滑雪镜」 出门。
9. 新闻:近期 AI 领域的巨额资本开支引发了市场对其可持续性的担忧。高盛最新研报明确揭示,当前 AI 投资规模远未过热,这一投资水平具备可持续性,这意味着 AI 基础设施建设的宏观叙事依然稳健。该研究表示,AI 相关投资占美国 GDP 的比例目前远低于历史上其他技术周期。
锐评:哪有泡沫?高盛说不存在的。
10. 新闻:中国互联网络信息中心 (CNNIC) 正式发布 《生成式人工智能应用发展报告 (2025)》。《报告》 显示,截至 2025 年 6 月,我国生成式人工智能用户规模达 5.15 亿人,较 2024 年 12 月增长 2.66 亿人,用户规模半年翻番;普及率为 36.5%。主要应用场景包括回答问题、日常办公、休闲娱乐、创作内容等。其中,利用生成式人工智能产品回答问题的用户最为广泛,达 80.9%。
锐评:我国人工智能正在从 「可用」 走向 「好用」、从 「试用」 走向 「常用」。
11. 新闻:加州颁布 AI 在线安全法规,强制要求聊天机器人在与未成年人互动时明确披露 AI 身份。加州州长纽森签署了 SB243 法案,该法案规定,在用户可能误以为与人类对话的场景中,AI 必须主动说明身份。此外,加州的 《AI 透明度法案》 也将生效,主要规定了企业层面的合规义务。
锐评:加州要求 「AI 陪聊」 也得 「持证上岗」。
五、AI 观点与文章:微软定义 「人机协作」,你的同事可能不是人
新闻:微软 AI 业务首席营销官贾里德·斯帕塔罗 (Jared Spataro) 在 《AI 正在重塑商业》 一文中,阐释了领先企业正迈向 「人主导、AI 驱动」 的新组织形态。
他总结了三大趋势:
获取专业知识的成本骤降:「企业可快速部署基于产品、市场或专有知识的智能体,直接嵌入组织数据、系统与安全防护体系。」
人机协作带来的工作重构:「当数字员工融入各业务环节,组织从 『为人设计信息流程』 转向 『为智能体优化执行效率』。」
知识复利效应:「智能体以人类系统无法企及的速度创造新型知识循环。」
斯帕塔罗早前发表的文章 《CEO 前沿企业建设指南》 进一步阐释了 AI 为先的含义。这些论述共同勾勒出企业级 AI 应用引发的根本性组织变革图景,其预见性值得肯定。
锐评:说白了就是你的同事可能不是人,但老板一定还是人。(辰辰)
【文章来源:techweb】
一、重磅工具:Claude 获 「技能」 加持,「瑞士军刀」 已上膛
新闻:Anthropic 公司为其 AI 模型 Claude 推出了名为 「技能」(Skills) 的新功能。这是一种可按需加载的自定义指令与工作流打包机制。Claude 可以在相关场景中动态调用 「技能」,无需冗长的上下文即可处理专业化任务。「技能」 新功能支持将代码规范、报告格式或分析等团队特定工作流程进行编码并存储,并通过设置界面和 SDK 统一管理。「技能」 具备可组合性与可移植性,开发者可将多个 「技能」 整合成定制化工作流,通过 Claude 应用、Claude Code 及其 API 无缝调用。
Anthropic 同步发布了实施指南与资源库,其中包含创建自定义 「技能」 的说明,并在相关资源库中提供可处理 Excel 和 PPT 等任务的预置 「技能」。这种新功能与 MCP(组件化模块协议) 相辅相成,有效扩展了 AI 模型的智能体能力。由于 「技能」 的资源库是开源的,有望像 MCP 一样获得广泛采用。
「技能」 功能现已作为功能预览版向 Pro、Max、Team 及 Enterprise 等订阅计划的用户开放。
锐评:等于给 Claude 配了把可随时换技能的瑞士军刀。
二、AI 技术与产品发布:从会拍片的 Sora 到会打工的 Haiku,软硬件多点爆发
1. 新闻:Anthropic 正式发布 Claude Haiku 4.5。这是一款面向大规模智能体系统与复杂思维链的高速低成本模型。在编码与智能体任务基准测试中,Haiku 4.5 表现突出,其在 SWE-bench 的通过率为 73.3%,Terminal-bench 得分 41%,综合表现直逼 Claude Sonnet 4。其卓越的性能、高速率与合理的成本定位,使其成为智能体 AI 应用的理想选择。Anthropic 强调:「Sonnet 4.5 擅长将复杂问题解构为多阶段计划,并能协调多个 Haiku 4.5 实例并行执行子任务。」
锐评:Haiku 4.5 貌似 「物美价廉」 的实习生,专门给 「项目经理」Sonnet 4.5 打下手。
2. 新闻:谷歌发布 Veo 3.1 及 Veo 3.1 Fast,新增原生音频增强、精准叙事控制、参考图像引导及长视频场景扩展功能。Veo 3.1 引入的首尾帧转场与 「素材融合」 特性支持将多张参考图像合成动态视频。业界评测认为,Veo 3.1 在音频质量、图像转视频的契合度以及画面一致性方面均有所提升。目前用户可通过 Gemini API 体验付费预览版,该模型兼容 AI Studio、Vertex AI、Gemini 应用及 Flow 平台。
锐评:谷歌这是铁了心要当 AI 界的 「全能导演」。
3. 新闻:OpenAI 发布 Sora 2 更新,默认视频时长延长至 15 秒,最长可生成 25 秒视频。Pro 订阅用户新增 「故事板」 功能,支持逐秒规划视频,实现更精细的生成过程控制。不过,Sora 2 近期因生成涉及公众人物的视频引发版权与伦理争议。OpenAI 强调公众人物及其家属应有权控制 AI 生成内容中的自身形象。
锐评:AI 造戏越来越溜,但千万不能随便把名人当角色。
4. 新闻:百度 MuseStreamer 现可生成 20 秒以上视频。该模型支持实时交互式长视频生成,用户可动态改写剧情或延长过渡。
锐评:时间加长还能随时改戏,国内视频 AI 也是卷起来了。
5. 新闻:World Labs 发布实时生成型世界模型 RTFM,可交互式渲染 3D 一致性场景。官方技术博客阐明该模型聚焦效率、可扩展性与时间一致性三大目标,并演示了如何用单张 H100 显卡部署密集型世界模型。公开演示版支持用户实时探索生成的世界。虽然 RTFM 现阶段仍属概念验证,但已趋近实用化。
锐评:RTFM 是想用一块 H100「装下全世界」。
6. 新闻:OpenAI 优化 ChatGPT 记忆管理机制,通过自动内存管理解决"存储已满"问题,旨在提升系统可靠性并降低用户侧的存储限制。
锐评:系统不再老是因为记忆满格而卡壳,用户体验要轻快不少。
7. 新闻:微软以 「让每台 Win11 电脑变身 AI PC」 为目标,推出操作系统级 Copilot 语音智能体。这项集成至系统底层的安全沙箱技术,支持后台语音驱动的任务执行,专为多任务并行场景下的智能工作流设计。该公司表示 「Copilot 语音与视觉功能的突破性价值在于交互的便捷性。用户通过唤醒词 『Hey Copilot』 即可用自然语言下达指令,视觉模块则可在获得授权后实时分析屏幕内容,提供应用教学、项目建议或操作指导。」
锐评:微软是铁了心推 Copilot 语音助手。
8. 新闻:Cognition 推出 SWE-grep 和 SWE-grep-mini 两款经强化学习训练的多轮上下文检索智能体,专精 AI 代码搜索。这些模型能快速呈现关联代码段,为 Windsurf Fast Context 子智能体提供核心动力,并通过高并行架构显著降低搜索延迟。
锐评:这次是给 AI 配了个 「代码搜索引擎」,程序员的 「工具箱」 快被 「一锅端」 了。
9. 新闻:Facebook 推出 AI 自动选片功能,帮助用户从相册中挑选最佳照片或视频以生成动态或帖子,有效简化了内容创作流程。
锐评:专治 「选择困难症」,以后发圈终于不用纠结。
10. 新闻:针对 AI 内容泛滥的舆论反馈,Pinterest 新增内容管控工具,允许用户在美容、艺术等特定板块限制生成式 AI 内容的显示,并强化了内容标签功能。这种用户主导的 AI 接触管理机制,值得其他社交媒体平台学习借鉴。
锐评:主打眼不见为净。
11. 新闻:谷歌为 Gemini API 引入 「谷歌地图数据关联」(Grounding with Google Maps) 功能,使模型可依托最新地理数据生成更准确的本地化回答。这一功能可与搜索引擎关联组合使用,进一步保障信息真实性,相关演示案例已在 AI Studio 开放测试。
锐评:Gemini 接上 「谷歌地图」,精准回答 「附近有啥好吃的」。
12. 新闻:谷歌升级 AI Studio,优化了开发者与用户体验。新版本推出集成 Gemini、生成式媒体模型、语音合成与实时模型的统一工作台 Playground,简化了模型切换流程并优化了聊天界面的一致性。
锐评:开发者少了来回切换的烦恼。
13. 新闻:针对通过 API 构建 Claude 智能体的开发者,AWS 已经在 Amazon Bedrock 上集成了最新的 Claude 模型 Opus 4.1、Sonnet 4.5、Haiku 4.5。其中 Haiku 4.5 的 API 定价为每百万输入/输出 token 1/5 美元。
锐评:云巨头的 AI 资源库主打一个 「我全都要」。
14. 新闻:英伟达开始出货 DGX Spark。这款桌面级 AI 超级工作站专为本地推理与原型开发设计,上市即售罄。LMSYS 的独立评测列出了其规格与性能亮点:GPU(GB10) 峰值性能达 1 PFLOP(FP4 张量),整体算力介于 RTX 5070 与 5070 Ti 之间;其革命性突破在于采用了 128GB 的统一内存架构,实现 CPU 与 GPU 内存池的无缝共享。这种统一架构使 DGX Spark 能直接加载运行大模型,彻底规避了系统内存与显存间的数据传输开销,让 DGX Spark 可运行的 AI 模型规模远超传统台式机。据悉,英伟达首席执行官黄仁勋在星舰第 11 次试飞前后,亲自向马斯克交付了 DGX Spark。
锐评:算得上 AI PC 中的爱马仕。
15. 新闻:OpenAI CEO 萨姆·奥特曼 (Sam Altman) 称将于今年 12 月份起放宽 ChatGPT 内容限制,向通过认证的成人用户开放成人向内容。此举旨在打造类似 GPT-4o 风格的可定制个性化体系,在保障安全的前提下实现不同年龄段用户的差异化服务。
锐评:兜兜转转还是没绕开人类本能。
三、AI 研究资讯:从 「解码癌症」 到 「掌控核聚变」,谷歌 「炼丹」 不止
1. 新闻:谷歌推出开源癌症变异分类模型 DeepSomatic。它能精准区分遗传变异与体细胞变异,在复杂样本测试中表现超越现有方案。
锐评:AI 在医学界又当起了显微镜和第二只眼。
2. 新闻:谷歌与耶鲁大学合作发布基于 Gemma 架构的癌症研究模型 Cell2Sentence-Scale 27B。该模型基于超 10 亿 token 的转录组与生物数据训练,能将 RNA 序列信息表示为文本式 「细胞句子」。研究人员运用 C2S-Scale 进行单细胞分析,成功识别出经湿实验验证的潜在癌症治疗路径。该研究的论文预印本与模型已经同步公开。
锐评:科研人员的解码器又升级了。
3. 新闻:谷歌 DeepMind 与 Commonwealth Fusion Systems 达成合作,通过深度学习实现等离子体控制以加速聚变能源研发。这一 AI 系统结合深度强化学习与 TORAX 模拟器,优化了等离子体控制与托卡马克装置的性能,推动清洁且无限的聚变能源迈向现实。
锐评:AI 不只能看天象,还想造星。
四、AI 商业与政策:大厂芯片狂飙,高盛高喊 「继续投」
1. 新闻:OpenAI 宣布与博通合作开发定制 AI 芯片。OpenAI 负责加速器与系统架构设计,博通将于 2026 年下半年启动量产部署。该项目目标是实现 10GW 算力规模,为下一代前沿模型与大规模推理提供基础支撑。此次合作标志着 OpenAI 向开放基础设施战略转型,通过博通以太网技术多元化其计算架构,也凸显出 AI 专用芯片在推理阶段的重要性。
锐评:算力界又要有新玩家和新规则。
2. 新闻:英伟达透露 Meta 与 Oracle 将在 AI 数据中心网络标准化中采用 Spectrum-X 以太网架构,训练效率与扩展性是选择这一开放加速方案的主因。
锐评:老黄不仅卖 「算力」,还要插手 「网线」 生意。
3. 新闻:苹果发布 M5 芯片,宣称峰值 AI 性能较 M4 提升 4 倍,专为下一代设备端 AI 负载打造。M5 将率先用在新款 MacBook Pro、iPad 及 Vision Pro 上,预计数周内上市。
锐评:如果 Siri 还是那个智障,这 4 倍性能大概也只能用来 P 图。
4. 新闻:英特尔公布一款搭载 160GB 内存、具备高能效的数据中心 GPU,并将其加入该公司的 AI 加速器组合,旨在推动英特尔以开放系统与软件架构为核心的新 AI 战略。这款 GPU 代号为 「Crescent Island(新月岛)」,根据英特尔介绍,它专为运行推理工作负载的风冷企业级服务器而设计,强调 「功耗与成本优化」。Crescent Island 采用 Xe3P 微架构,配备 160GB LPDDR5X 内存,并支持多种数据类型,为大语言模型提供充足运行空间。
锐评:英特尔想用 「性价比推理」 从英伟达 「虎口夺食」。
5. 新闻:Spotify 与主流唱片公司达成协议,共同开发 「负责任」 的 AI 产品体系,确保持续尊重版权、保障艺术家收益,并为音乐人保留自主选择是否授权 AI 工具使用自己作品的权利。该公司还同步设立 AI 研究实验室,集中精力研发以艺术家权益为核心的技术方案。
锐评:Spotify 先下手为强,拉着唱片公司 「拜山头」。
6. 新闻:谷歌母公司 Alphabet 计划在印度南部投资超 100 亿美元,两年内于安得拉邦港口城市维沙卡帕特南建设一座 1 吉瓦级数据中心。这标志着谷歌在全球扩张战略中押注印度市场。
锐评:「三哥」 的电网扛得住吗?
7. 新闻:中国工程院院刊 《Engineering》 评选的 「2025 全球十大工程成就」 在 「2025 年世界工程组织联合会全体大会暨全球工程大会」 上正式发布。其中英伟达 Blackwell GPU 架构和 DeepSeek 开源大语言模型上榜。
锐评:大厂技术上榜,当之无愧。
8. 新闻:苹果公司正进行重大战略调整:暂停开发更轻便、低价的 Vision 头显 (内部代号或为 「Vision Air」),将资源集中于智能眼镜的研发。据长期跟踪苹果动态的资深分析师马克·古尔曼 (Mark Gurman) 透露,在亲身体验了竞争对手 Meta 新推出的内置显示屏智能眼镜后,他确信苹果的这一转向是明智之举。
锐评:库克明白过来,没人想顶着个 「滑雪镜」 出门。
9. 新闻:近期 AI 领域的巨额资本开支引发了市场对其可持续性的担忧。高盛最新研报明确揭示,当前 AI 投资规模远未过热,这一投资水平具备可持续性,这意味着 AI 基础设施建设的宏观叙事依然稳健。该研究表示,AI 相关投资占美国 GDP 的比例目前远低于历史上其他技术周期。
锐评:哪有泡沫?高盛说不存在的。
10. 新闻:中国互联网络信息中心 (CNNIC) 正式发布 《生成式人工智能应用发展报告 (2025)》。《报告》 显示,截至 2025 年 6 月,我国生成式人工智能用户规模达 5.15 亿人,较 2024 年 12 月增长 2.66 亿人,用户规模半年翻番;普及率为 36.5%。主要应用场景包括回答问题、日常办公、休闲娱乐、创作内容等。其中,利用生成式人工智能产品回答问题的用户最为广泛,达 80.9%。
锐评:我国人工智能正在从 「可用」 走向 「好用」、从 「试用」 走向 「常用」。
11. 新闻:加州颁布 AI 在线安全法规,强制要求聊天机器人在与未成年人互动时明确披露 AI 身份。加州州长纽森签署了 SB243 法案,该法案规定,在用户可能误以为与人类对话的场景中,AI 必须主动说明身份。此外,加州的 《AI 透明度法案》 也将生效,主要规定了企业层面的合规义务。
锐评:加州要求 「AI 陪聊」 也得 「持证上岗」。
五、AI 观点与文章:微软定义 「人机协作」,你的同事可能不是人
新闻:微软 AI 业务首席营销官贾里德·斯帕塔罗 (Jared Spataro) 在 《AI 正在重塑商业》 一文中,阐释了领先企业正迈向 「人主导、AI 驱动」 的新组织形态。
他总结了三大趋势:
获取专业知识的成本骤降:「企业可快速部署基于产品、市场或专有知识的智能体,直接嵌入组织数据、系统与安全防护体系。」
人机协作带来的工作重构:「当数字员工融入各业务环节,组织从 『为人设计信息流程』 转向 『为智能体优化执行效率』。」
知识复利效应:「智能体以人类系统无法企及的速度创造新型知识循环。」
斯帕塔罗早前发表的文章 《CEO 前沿企业建设指南》 进一步阐释了 AI 为先的含义。这些论述共同勾勒出企业级 AI 应用引发的根本性组织变革图景,其预见性值得肯定。
锐评:说白了就是你的同事可能不是人,但老板一定还是人。(辰辰)
【文章来源:techweb】
一、重磅工具:Claude 获 「技能」 加持,「瑞士军刀」 已上膛
新闻:Anthropic 公司为其 AI 模型 Claude 推出了名为 「技能」(Skills) 的新功能。这是一种可按需加载的自定义指令与工作流打包机制。Claude 可以在相关场景中动态调用 「技能」,无需冗长的上下文即可处理专业化任务。「技能」 新功能支持将代码规范、报告格式或分析等团队特定工作流程进行编码并存储,并通过设置界面和 SDK 统一管理。「技能」 具备可组合性与可移植性,开发者可将多个 「技能」 整合成定制化工作流,通过 Claude 应用、Claude Code 及其 API 无缝调用。
Anthropic 同步发布了实施指南与资源库,其中包含创建自定义 「技能」 的说明,并在相关资源库中提供可处理 Excel 和 PPT 等任务的预置 「技能」。这种新功能与 MCP(组件化模块协议) 相辅相成,有效扩展了 AI 模型的智能体能力。由于 「技能」 的资源库是开源的,有望像 MCP 一样获得广泛采用。
「技能」 功能现已作为功能预览版向 Pro、Max、Team 及 Enterprise 等订阅计划的用户开放。
锐评:等于给 Claude 配了把可随时换技能的瑞士军刀。
二、AI 技术与产品发布:从会拍片的 Sora 到会打工的 Haiku,软硬件多点爆发
1. 新闻:Anthropic 正式发布 Claude Haiku 4.5。这是一款面向大规模智能体系统与复杂思维链的高速低成本模型。在编码与智能体任务基准测试中,Haiku 4.5 表现突出,其在 SWE-bench 的通过率为 73.3%,Terminal-bench 得分 41%,综合表现直逼 Claude Sonnet 4。其卓越的性能、高速率与合理的成本定位,使其成为智能体 AI 应用的理想选择。Anthropic 强调:「Sonnet 4.5 擅长将复杂问题解构为多阶段计划,并能协调多个 Haiku 4.5 实例并行执行子任务。」
锐评:Haiku 4.5 貌似 「物美价廉」 的实习生,专门给 「项目经理」Sonnet 4.5 打下手。
2. 新闻:谷歌发布 Veo 3.1 及 Veo 3.1 Fast,新增原生音频增强、精准叙事控制、参考图像引导及长视频场景扩展功能。Veo 3.1 引入的首尾帧转场与 「素材融合」 特性支持将多张参考图像合成动态视频。业界评测认为,Veo 3.1 在音频质量、图像转视频的契合度以及画面一致性方面均有所提升。目前用户可通过 Gemini API 体验付费预览版,该模型兼容 AI Studio、Vertex AI、Gemini 应用及 Flow 平台。
锐评:谷歌这是铁了心要当 AI 界的 「全能导演」。
3. 新闻:OpenAI 发布 Sora 2 更新,默认视频时长延长至 15 秒,最长可生成 25 秒视频。Pro 订阅用户新增 「故事板」 功能,支持逐秒规划视频,实现更精细的生成过程控制。不过,Sora 2 近期因生成涉及公众人物的视频引发版权与伦理争议。OpenAI 强调公众人物及其家属应有权控制 AI 生成内容中的自身形象。
锐评:AI 造戏越来越溜,但千万不能随便把名人当角色。
4. 新闻:百度 MuseStreamer 现可生成 20 秒以上视频。该模型支持实时交互式长视频生成,用户可动态改写剧情或延长过渡。
锐评:时间加长还能随时改戏,国内视频 AI 也是卷起来了。
5. 新闻:World Labs 发布实时生成型世界模型 RTFM,可交互式渲染 3D 一致性场景。官方技术博客阐明该模型聚焦效率、可扩展性与时间一致性三大目标,并演示了如何用单张 H100 显卡部署密集型世界模型。公开演示版支持用户实时探索生成的世界。虽然 RTFM 现阶段仍属概念验证,但已趋近实用化。
锐评:RTFM 是想用一块 H100「装下全世界」。
6. 新闻:OpenAI 优化 ChatGPT 记忆管理机制,通过自动内存管理解决"存储已满"问题,旨在提升系统可靠性并降低用户侧的存储限制。
锐评:系统不再老是因为记忆满格而卡壳,用户体验要轻快不少。
7. 新闻:微软以 「让每台 Win11 电脑变身 AI PC」 为目标,推出操作系统级 Copilot 语音智能体。这项集成至系统底层的安全沙箱技术,支持后台语音驱动的任务执行,专为多任务并行场景下的智能工作流设计。该公司表示 「Copilot 语音与视觉功能的突破性价值在于交互的便捷性。用户通过唤醒词 『Hey Copilot』 即可用自然语言下达指令,视觉模块则可在获得授权后实时分析屏幕内容,提供应用教学、项目建议或操作指导。」
锐评:微软是铁了心推 Copilot 语音助手。
8. 新闻:Cognition 推出 SWE-grep 和 SWE-grep-mini 两款经强化学习训练的多轮上下文检索智能体,专精 AI 代码搜索。这些模型能快速呈现关联代码段,为 Windsurf Fast Context 子智能体提供核心动力,并通过高并行架构显著降低搜索延迟。
锐评:这次是给 AI 配了个 「代码搜索引擎」,程序员的 「工具箱」 快被 「一锅端」 了。
9. 新闻:Facebook 推出 AI 自动选片功能,帮助用户从相册中挑选最佳照片或视频以生成动态或帖子,有效简化了内容创作流程。
锐评:专治 「选择困难症」,以后发圈终于不用纠结。
10. 新闻:针对 AI 内容泛滥的舆论反馈,Pinterest 新增内容管控工具,允许用户在美容、艺术等特定板块限制生成式 AI 内容的显示,并强化了内容标签功能。这种用户主导的 AI 接触管理机制,值得其他社交媒体平台学习借鉴。
锐评:主打眼不见为净。
11. 新闻:谷歌为 Gemini API 引入 「谷歌地图数据关联」(Grounding with Google Maps) 功能,使模型可依托最新地理数据生成更准确的本地化回答。这一功能可与搜索引擎关联组合使用,进一步保障信息真实性,相关演示案例已在 AI Studio 开放测试。
锐评:Gemini 接上 「谷歌地图」,精准回答 「附近有啥好吃的」。
12. 新闻:谷歌升级 AI Studio,优化了开发者与用户体验。新版本推出集成 Gemini、生成式媒体模型、语音合成与实时模型的统一工作台 Playground,简化了模型切换流程并优化了聊天界面的一致性。
锐评:开发者少了来回切换的烦恼。
13. 新闻:针对通过 API 构建 Claude 智能体的开发者,AWS 已经在 Amazon Bedrock 上集成了最新的 Claude 模型 Opus 4.1、Sonnet 4.5、Haiku 4.5。其中 Haiku 4.5 的 API 定价为每百万输入/输出 token 1/5 美元。
锐评:云巨头的 AI 资源库主打一个 「我全都要」。
14. 新闻:英伟达开始出货 DGX Spark。这款桌面级 AI 超级工作站专为本地推理与原型开发设计,上市即售罄。LMSYS 的独立评测列出了其规格与性能亮点:GPU(GB10) 峰值性能达 1 PFLOP(FP4 张量),整体算力介于 RTX 5070 与 5070 Ti 之间;其革命性突破在于采用了 128GB 的统一内存架构,实现 CPU 与 GPU 内存池的无缝共享。这种统一架构使 DGX Spark 能直接加载运行大模型,彻底规避了系统内存与显存间的数据传输开销,让 DGX Spark 可运行的 AI 模型规模远超传统台式机。据悉,英伟达首席执行官黄仁勋在星舰第 11 次试飞前后,亲自向马斯克交付了 DGX Spark。
锐评:算得上 AI PC 中的爱马仕。
15. 新闻:OpenAI CEO 萨姆·奥特曼 (Sam Altman) 称将于今年 12 月份起放宽 ChatGPT 内容限制,向通过认证的成人用户开放成人向内容。此举旨在打造类似 GPT-4o 风格的可定制个性化体系,在保障安全的前提下实现不同年龄段用户的差异化服务。
锐评:兜兜转转还是没绕开人类本能。
三、AI 研究资讯:从 「解码癌症」 到 「掌控核聚变」,谷歌 「炼丹」 不止
1. 新闻:谷歌推出开源癌症变异分类模型 DeepSomatic。它能精准区分遗传变异与体细胞变异,在复杂样本测试中表现超越现有方案。
锐评:AI 在医学界又当起了显微镜和第二只眼。
2. 新闻:谷歌与耶鲁大学合作发布基于 Gemma 架构的癌症研究模型 Cell2Sentence-Scale 27B。该模型基于超 10 亿 token 的转录组与生物数据训练,能将 RNA 序列信息表示为文本式 「细胞句子」。研究人员运用 C2S-Scale 进行单细胞分析,成功识别出经湿实验验证的潜在癌症治疗路径。该研究的论文预印本与模型已经同步公开。
锐评:科研人员的解码器又升级了。
3. 新闻:谷歌 DeepMind 与 Commonwealth Fusion Systems 达成合作,通过深度学习实现等离子体控制以加速聚变能源研发。这一 AI 系统结合深度强化学习与 TORAX 模拟器,优化了等离子体控制与托卡马克装置的性能,推动清洁且无限的聚变能源迈向现实。
锐评:AI 不只能看天象,还想造星。
四、AI 商业与政策:大厂芯片狂飙,高盛高喊 「继续投」
1. 新闻:OpenAI 宣布与博通合作开发定制 AI 芯片。OpenAI 负责加速器与系统架构设计,博通将于 2026 年下半年启动量产部署。该项目目标是实现 10GW 算力规模,为下一代前沿模型与大规模推理提供基础支撑。此次合作标志着 OpenAI 向开放基础设施战略转型,通过博通以太网技术多元化其计算架构,也凸显出 AI 专用芯片在推理阶段的重要性。
锐评:算力界又要有新玩家和新规则。
2. 新闻:英伟达透露 Meta 与 Oracle 将在 AI 数据中心网络标准化中采用 Spectrum-X 以太网架构,训练效率与扩展性是选择这一开放加速方案的主因。
锐评:老黄不仅卖 「算力」,还要插手 「网线」 生意。
3. 新闻:苹果发布 M5 芯片,宣称峰值 AI 性能较 M4 提升 4 倍,专为下一代设备端 AI 负载打造。M5 将率先用在新款 MacBook Pro、iPad 及 Vision Pro 上,预计数周内上市。
锐评:如果 Siri 还是那个智障,这 4 倍性能大概也只能用来 P 图。
4. 新闻:英特尔公布一款搭载 160GB 内存、具备高能效的数据中心 GPU,并将其加入该公司的 AI 加速器组合,旨在推动英特尔以开放系统与软件架构为核心的新 AI 战略。这款 GPU 代号为 「Crescent Island(新月岛)」,根据英特尔介绍,它专为运行推理工作负载的风冷企业级服务器而设计,强调 「功耗与成本优化」。Crescent Island 采用 Xe3P 微架构,配备 160GB LPDDR5X 内存,并支持多种数据类型,为大语言模型提供充足运行空间。
锐评:英特尔想用 「性价比推理」 从英伟达 「虎口夺食」。
5. 新闻:Spotify 与主流唱片公司达成协议,共同开发 「负责任」 的 AI 产品体系,确保持续尊重版权、保障艺术家收益,并为音乐人保留自主选择是否授权 AI 工具使用自己作品的权利。该公司还同步设立 AI 研究实验室,集中精力研发以艺术家权益为核心的技术方案。
锐评:Spotify 先下手为强,拉着唱片公司 「拜山头」。
6. 新闻:谷歌母公司 Alphabet 计划在印度南部投资超 100 亿美元,两年内于安得拉邦港口城市维沙卡帕特南建设一座 1 吉瓦级数据中心。这标志着谷歌在全球扩张战略中押注印度市场。
锐评:「三哥」 的电网扛得住吗?
7. 新闻:中国工程院院刊 《Engineering》 评选的 「2025 全球十大工程成就」 在 「2025 年世界工程组织联合会全体大会暨全球工程大会」 上正式发布。其中英伟达 Blackwell GPU 架构和 DeepSeek 开源大语言模型上榜。
锐评:大厂技术上榜,当之无愧。
8. 新闻:苹果公司正进行重大战略调整:暂停开发更轻便、低价的 Vision 头显 (内部代号或为 「Vision Air」),将资源集中于智能眼镜的研发。据长期跟踪苹果动态的资深分析师马克·古尔曼 (Mark Gurman) 透露,在亲身体验了竞争对手 Meta 新推出的内置显示屏智能眼镜后,他确信苹果的这一转向是明智之举。
锐评:库克明白过来,没人想顶着个 「滑雪镜」 出门。
9. 新闻:近期 AI 领域的巨额资本开支引发了市场对其可持续性的担忧。高盛最新研报明确揭示,当前 AI 投资规模远未过热,这一投资水平具备可持续性,这意味着 AI 基础设施建设的宏观叙事依然稳健。该研究表示,AI 相关投资占美国 GDP 的比例目前远低于历史上其他技术周期。
锐评:哪有泡沫?高盛说不存在的。
10. 新闻:中国互联网络信息中心 (CNNIC) 正式发布 《生成式人工智能应用发展报告 (2025)》。《报告》 显示,截至 2025 年 6 月,我国生成式人工智能用户规模达 5.15 亿人,较 2024 年 12 月增长 2.66 亿人,用户规模半年翻番;普及率为 36.5%。主要应用场景包括回答问题、日常办公、休闲娱乐、创作内容等。其中,利用生成式人工智能产品回答问题的用户最为广泛,达 80.9%。
锐评:我国人工智能正在从 「可用」 走向 「好用」、从 「试用」 走向 「常用」。
11. 新闻:加州颁布 AI 在线安全法规,强制要求聊天机器人在与未成年人互动时明确披露 AI 身份。加州州长纽森签署了 SB243 法案,该法案规定,在用户可能误以为与人类对话的场景中,AI 必须主动说明身份。此外,加州的 《AI 透明度法案》 也将生效,主要规定了企业层面的合规义务。
锐评:加州要求 「AI 陪聊」 也得 「持证上岗」。
五、AI 观点与文章:微软定义 「人机协作」,你的同事可能不是人
新闻:微软 AI 业务首席营销官贾里德·斯帕塔罗 (Jared Spataro) 在 《AI 正在重塑商业》 一文中,阐释了领先企业正迈向 「人主导、AI 驱动」 的新组织形态。
他总结了三大趋势:
获取专业知识的成本骤降:「企业可快速部署基于产品、市场或专有知识的智能体,直接嵌入组织数据、系统与安全防护体系。」
人机协作带来的工作重构:「当数字员工融入各业务环节,组织从 『为人设计信息流程』 转向 『为智能体优化执行效率』。」
知识复利效应:「智能体以人类系统无法企及的速度创造新型知识循环。」
斯帕塔罗早前发表的文章 《CEO 前沿企业建设指南》 进一步阐释了 AI 为先的含义。这些论述共同勾勒出企业级 AI 应用引发的根本性组织变革图景,其预见性值得肯定。
锐评:说白了就是你的同事可能不是人,但老板一定还是人。(辰辰)
【文章来源:techweb】
一、重磅工具:Claude 获 「技能」 加持,「瑞士军刀」 已上膛
新闻:Anthropic 公司为其 AI 模型 Claude 推出了名为 「技能」(Skills) 的新功能。这是一种可按需加载的自定义指令与工作流打包机制。Claude 可以在相关场景中动态调用 「技能」,无需冗长的上下文即可处理专业化任务。「技能」 新功能支持将代码规范、报告格式或分析等团队特定工作流程进行编码并存储,并通过设置界面和 SDK 统一管理。「技能」 具备可组合性与可移植性,开发者可将多个 「技能」 整合成定制化工作流,通过 Claude 应用、Claude Code 及其 API 无缝调用。
Anthropic 同步发布了实施指南与资源库,其中包含创建自定义 「技能」 的说明,并在相关资源库中提供可处理 Excel 和 PPT 等任务的预置 「技能」。这种新功能与 MCP(组件化模块协议) 相辅相成,有效扩展了 AI 模型的智能体能力。由于 「技能」 的资源库是开源的,有望像 MCP 一样获得广泛采用。
「技能」 功能现已作为功能预览版向 Pro、Max、Team 及 Enterprise 等订阅计划的用户开放。
锐评:等于给 Claude 配了把可随时换技能的瑞士军刀。
二、AI 技术与产品发布:从会拍片的 Sora 到会打工的 Haiku,软硬件多点爆发
1. 新闻:Anthropic 正式发布 Claude Haiku 4.5。这是一款面向大规模智能体系统与复杂思维链的高速低成本模型。在编码与智能体任务基准测试中,Haiku 4.5 表现突出,其在 SWE-bench 的通过率为 73.3%,Terminal-bench 得分 41%,综合表现直逼 Claude Sonnet 4。其卓越的性能、高速率与合理的成本定位,使其成为智能体 AI 应用的理想选择。Anthropic 强调:「Sonnet 4.5 擅长将复杂问题解构为多阶段计划,并能协调多个 Haiku 4.5 实例并行执行子任务。」
锐评:Haiku 4.5 貌似 「物美价廉」 的实习生,专门给 「项目经理」Sonnet 4.5 打下手。
2. 新闻:谷歌发布 Veo 3.1 及 Veo 3.1 Fast,新增原生音频增强、精准叙事控制、参考图像引导及长视频场景扩展功能。Veo 3.1 引入的首尾帧转场与 「素材融合」 特性支持将多张参考图像合成动态视频。业界评测认为,Veo 3.1 在音频质量、图像转视频的契合度以及画面一致性方面均有所提升。目前用户可通过 Gemini API 体验付费预览版,该模型兼容 AI Studio、Vertex AI、Gemini 应用及 Flow 平台。
锐评:谷歌这是铁了心要当 AI 界的 「全能导演」。
3. 新闻:OpenAI 发布 Sora 2 更新,默认视频时长延长至 15 秒,最长可生成 25 秒视频。Pro 订阅用户新增 「故事板」 功能,支持逐秒规划视频,实现更精细的生成过程控制。不过,Sora 2 近期因生成涉及公众人物的视频引发版权与伦理争议。OpenAI 强调公众人物及其家属应有权控制 AI 生成内容中的自身形象。
锐评:AI 造戏越来越溜,但千万不能随便把名人当角色。
4. 新闻:百度 MuseStreamer 现可生成 20 秒以上视频。该模型支持实时交互式长视频生成,用户可动态改写剧情或延长过渡。
锐评:时间加长还能随时改戏,国内视频 AI 也是卷起来了。
5. 新闻:World Labs 发布实时生成型世界模型 RTFM,可交互式渲染 3D 一致性场景。官方技术博客阐明该模型聚焦效率、可扩展性与时间一致性三大目标,并演示了如何用单张 H100 显卡部署密集型世界模型。公开演示版支持用户实时探索生成的世界。虽然 RTFM 现阶段仍属概念验证,但已趋近实用化。
锐评:RTFM 是想用一块 H100「装下全世界」。
6. 新闻:OpenAI 优化 ChatGPT 记忆管理机制,通过自动内存管理解决"存储已满"问题,旨在提升系统可靠性并降低用户侧的存储限制。
锐评:系统不再老是因为记忆满格而卡壳,用户体验要轻快不少。
7. 新闻:微软以 「让每台 Win11 电脑变身 AI PC」 为目标,推出操作系统级 Copilot 语音智能体。这项集成至系统底层的安全沙箱技术,支持后台语音驱动的任务执行,专为多任务并行场景下的智能工作流设计。该公司表示 「Copilot 语音与视觉功能的突破性价值在于交互的便捷性。用户通过唤醒词 『Hey Copilot』 即可用自然语言下达指令,视觉模块则可在获得授权后实时分析屏幕内容,提供应用教学、项目建议或操作指导。」
锐评:微软是铁了心推 Copilot 语音助手。
8. 新闻:Cognition 推出 SWE-grep 和 SWE-grep-mini 两款经强化学习训练的多轮上下文检索智能体,专精 AI 代码搜索。这些模型能快速呈现关联代码段,为 Windsurf Fast Context 子智能体提供核心动力,并通过高并行架构显著降低搜索延迟。
锐评:这次是给 AI 配了个 「代码搜索引擎」,程序员的 「工具箱」 快被 「一锅端」 了。
9. 新闻:Facebook 推出 AI 自动选片功能,帮助用户从相册中挑选最佳照片或视频以生成动态或帖子,有效简化了内容创作流程。
锐评:专治 「选择困难症」,以后发圈终于不用纠结。
10. 新闻:针对 AI 内容泛滥的舆论反馈,Pinterest 新增内容管控工具,允许用户在美容、艺术等特定板块限制生成式 AI 内容的显示,并强化了内容标签功能。这种用户主导的 AI 接触管理机制,值得其他社交媒体平台学习借鉴。
锐评:主打眼不见为净。
11. 新闻:谷歌为 Gemini API 引入 「谷歌地图数据关联」(Grounding with Google Maps) 功能,使模型可依托最新地理数据生成更准确的本地化回答。这一功能可与搜索引擎关联组合使用,进一步保障信息真实性,相关演示案例已在 AI Studio 开放测试。
锐评:Gemini 接上 「谷歌地图」,精准回答 「附近有啥好吃的」。
12. 新闻:谷歌升级 AI Studio,优化了开发者与用户体验。新版本推出集成 Gemini、生成式媒体模型、语音合成与实时模型的统一工作台 Playground,简化了模型切换流程并优化了聊天界面的一致性。
锐评:开发者少了来回切换的烦恼。
13. 新闻:针对通过 API 构建 Claude 智能体的开发者,AWS 已经在 Amazon Bedrock 上集成了最新的 Claude 模型 Opus 4.1、Sonnet 4.5、Haiku 4.5。其中 Haiku 4.5 的 API 定价为每百万输入/输出 token 1/5 美元。
锐评:云巨头的 AI 资源库主打一个 「我全都要」。
14. 新闻:英伟达开始出货 DGX Spark。这款桌面级 AI 超级工作站专为本地推理与原型开发设计,上市即售罄。LMSYS 的独立评测列出了其规格与性能亮点:GPU(GB10) 峰值性能达 1 PFLOP(FP4 张量),整体算力介于 RTX 5070 与 5070 Ti 之间;其革命性突破在于采用了 128GB 的统一内存架构,实现 CPU 与 GPU 内存池的无缝共享。这种统一架构使 DGX Spark 能直接加载运行大模型,彻底规避了系统内存与显存间的数据传输开销,让 DGX Spark 可运行的 AI 模型规模远超传统台式机。据悉,英伟达首席执行官黄仁勋在星舰第 11 次试飞前后,亲自向马斯克交付了 DGX Spark。
锐评:算得上 AI PC 中的爱马仕。
15. 新闻:OpenAI CEO 萨姆·奥特曼 (Sam Altman) 称将于今年 12 月份起放宽 ChatGPT 内容限制,向通过认证的成人用户开放成人向内容。此举旨在打造类似 GPT-4o 风格的可定制个性化体系,在保障安全的前提下实现不同年龄段用户的差异化服务。
锐评:兜兜转转还是没绕开人类本能。
三、AI 研究资讯:从 「解码癌症」 到 「掌控核聚变」,谷歌 「炼丹」 不止
1. 新闻:谷歌推出开源癌症变异分类模型 DeepSomatic。它能精准区分遗传变异与体细胞变异,在复杂样本测试中表现超越现有方案。
锐评:AI 在医学界又当起了显微镜和第二只眼。
2. 新闻:谷歌与耶鲁大学合作发布基于 Gemma 架构的癌症研究模型 Cell2Sentence-Scale 27B。该模型基于超 10 亿 token 的转录组与生物数据训练,能将 RNA 序列信息表示为文本式 「细胞句子」。研究人员运用 C2S-Scale 进行单细胞分析,成功识别出经湿实验验证的潜在癌症治疗路径。该研究的论文预印本与模型已经同步公开。
锐评:科研人员的解码器又升级了。
3. 新闻:谷歌 DeepMind 与 Commonwealth Fusion Systems 达成合作,通过深度学习实现等离子体控制以加速聚变能源研发。这一 AI 系统结合深度强化学习与 TORAX 模拟器,优化了等离子体控制与托卡马克装置的性能,推动清洁且无限的聚变能源迈向现实。
锐评:AI 不只能看天象,还想造星。
四、AI 商业与政策:大厂芯片狂飙,高盛高喊 「继续投」
1. 新闻:OpenAI 宣布与博通合作开发定制 AI 芯片。OpenAI 负责加速器与系统架构设计,博通将于 2026 年下半年启动量产部署。该项目目标是实现 10GW 算力规模,为下一代前沿模型与大规模推理提供基础支撑。此次合作标志着 OpenAI 向开放基础设施战略转型,通过博通以太网技术多元化其计算架构,也凸显出 AI 专用芯片在推理阶段的重要性。
锐评:算力界又要有新玩家和新规则。
2. 新闻:英伟达透露 Meta 与 Oracle 将在 AI 数据中心网络标准化中采用 Spectrum-X 以太网架构,训练效率与扩展性是选择这一开放加速方案的主因。
锐评:老黄不仅卖 「算力」,还要插手 「网线」 生意。
3. 新闻:苹果发布 M5 芯片,宣称峰值 AI 性能较 M4 提升 4 倍,专为下一代设备端 AI 负载打造。M5 将率先用在新款 MacBook Pro、iPad 及 Vision Pro 上,预计数周内上市。
锐评:如果 Siri 还是那个智障,这 4 倍性能大概也只能用来 P 图。
4. 新闻:英特尔公布一款搭载 160GB 内存、具备高能效的数据中心 GPU,并将其加入该公司的 AI 加速器组合,旨在推动英特尔以开放系统与软件架构为核心的新 AI 战略。这款 GPU 代号为 「Crescent Island(新月岛)」,根据英特尔介绍,它专为运行推理工作负载的风冷企业级服务器而设计,强调 「功耗与成本优化」。Crescent Island 采用 Xe3P 微架构,配备 160GB LPDDR5X 内存,并支持多种数据类型,为大语言模型提供充足运行空间。
锐评:英特尔想用 「性价比推理」 从英伟达 「虎口夺食」。
5. 新闻:Spotify 与主流唱片公司达成协议,共同开发 「负责任」 的 AI 产品体系,确保持续尊重版权、保障艺术家收益,并为音乐人保留自主选择是否授权 AI 工具使用自己作品的权利。该公司还同步设立 AI 研究实验室,集中精力研发以艺术家权益为核心的技术方案。
锐评:Spotify 先下手为强,拉着唱片公司 「拜山头」。
6. 新闻:谷歌母公司 Alphabet 计划在印度南部投资超 100 亿美元,两年内于安得拉邦港口城市维沙卡帕特南建设一座 1 吉瓦级数据中心。这标志着谷歌在全球扩张战略中押注印度市场。
锐评:「三哥」 的电网扛得住吗?
7. 新闻:中国工程院院刊 《Engineering》 评选的 「2025 全球十大工程成就」 在 「2025 年世界工程组织联合会全体大会暨全球工程大会」 上正式发布。其中英伟达 Blackwell GPU 架构和 DeepSeek 开源大语言模型上榜。
锐评:大厂技术上榜,当之无愧。
8. 新闻:苹果公司正进行重大战略调整:暂停开发更轻便、低价的 Vision 头显 (内部代号或为 「Vision Air」),将资源集中于智能眼镜的研发。据长期跟踪苹果动态的资深分析师马克·古尔曼 (Mark Gurman) 透露,在亲身体验了竞争对手 Meta 新推出的内置显示屏智能眼镜后,他确信苹果的这一转向是明智之举。
锐评:库克明白过来,没人想顶着个 「滑雪镜」 出门。
9. 新闻:近期 AI 领域的巨额资本开支引发了市场对其可持续性的担忧。高盛最新研报明确揭示,当前 AI 投资规模远未过热,这一投资水平具备可持续性,这意味着 AI 基础设施建设的宏观叙事依然稳健。该研究表示,AI 相关投资占美国 GDP 的比例目前远低于历史上其他技术周期。
锐评:哪有泡沫?高盛说不存在的。
10. 新闻:中国互联网络信息中心 (CNNIC) 正式发布 《生成式人工智能应用发展报告 (2025)》。《报告》 显示,截至 2025 年 6 月,我国生成式人工智能用户规模达 5.15 亿人,较 2024 年 12 月增长 2.66 亿人,用户规模半年翻番;普及率为 36.5%。主要应用场景包括回答问题、日常办公、休闲娱乐、创作内容等。其中,利用生成式人工智能产品回答问题的用户最为广泛,达 80.9%。
锐评:我国人工智能正在从 「可用」 走向 「好用」、从 「试用」 走向 「常用」。
11. 新闻:加州颁布 AI 在线安全法规,强制要求聊天机器人在与未成年人互动时明确披露 AI 身份。加州州长纽森签署了 SB243 法案,该法案规定,在用户可能误以为与人类对话的场景中,AI 必须主动说明身份。此外,加州的 《AI 透明度法案》 也将生效,主要规定了企业层面的合规义务。
锐评:加州要求 「AI 陪聊」 也得 「持证上岗」。
五、AI 观点与文章:微软定义 「人机协作」,你的同事可能不是人
新闻:微软 AI 业务首席营销官贾里德·斯帕塔罗 (Jared Spataro) 在 《AI 正在重塑商业》 一文中,阐释了领先企业正迈向 「人主导、AI 驱动」 的新组织形态。
他总结了三大趋势:
获取专业知识的成本骤降:「企业可快速部署基于产品、市场或专有知识的智能体,直接嵌入组织数据、系统与安全防护体系。」
人机协作带来的工作重构:「当数字员工融入各业务环节,组织从 『为人设计信息流程』 转向 『为智能体优化执行效率』。」
知识复利效应:「智能体以人类系统无法企及的速度创造新型知识循环。」
斯帕塔罗早前发表的文章 《CEO 前沿企业建设指南》 进一步阐释了 AI 为先的含义。这些论述共同勾勒出企业级 AI 应用引发的根本性组织变革图景,其预见性值得肯定。
锐评:说白了就是你的同事可能不是人,但老板一定还是人。(辰辰)