金算生电子报79集

全球资本流向大变局

最近的全球市场，用“风起云涌”来形容都显得保守了。各种“几十年一遇”的巨变接连上演，从特朗普在乌克兰问题上的立场转变，到马斯克大闹华盛顿，再到德国“不惜一切”的决心，以及股市的“东升西落”。如何理解这一切？今天我们来深度剖析这场大变局背后的核心逻辑，并且试着给出预测：接下去还会发生什么？

评：从不断借钱到持续化债

大模型和论文

谷歌重磅推出全新 Scaling Law，抢救Transformer，3万亿美元AI面临岔路

AI自我纠错，Diffusion超越自回归，质量提升55%，已达理论证据下界

爆火 Block Diffusion引发LLM架构变革？自回归+扩散模型完美结合

三位数学家改写经典牛顿法，300年前算法一夜更新，收敛速度更快函数范围更广

刚刚，OpenAI 一口气发布三个新模型，还为此做了一个新网站

OpenAI史上最贵模型来了，比DeepSeek贵270倍，100万输出token 600美元

DeepSeek V3开源升级震撼能力，DeepSeek正在实现Meta承诺做到的事

OpenAI和Google同日地震级更新：人间一夜，AGI 临近

硅谷投资人爆料：AI爆炸或将率先发生在中国

如果AI系统能自己设计出更强大的AI，智能爆炸可能很快就要到来了！而人类，会被AI迅速甩在后面。最近，硅谷投资人、EverFi CEO兼创始人Tom Davidson等人发表了一篇长文硬核博客，详细讨论了智能爆炸（Intelligence explosion， IE）的类型以及对应的发生概率。

评：智能爆炸的推演进程

一文看懂多模态思维链

不仅阐释了与该领域相关的基本概念和定义，还包括详细的分类法、对不同应用中现有方法的分析、对当前挑战的洞察以及促进多模态推理发展的未来研究方向。当下，传统思维链（CoT）已经让AI在文字推理上变得更聪明，比如一步步推导数学题的答案。但现实世界远比单一文字复杂得多——我们看图说话、听声辨情、摸物识形。

评：多模态思维链综述

Claude深度“开盒”，看大模型的“大脑”到底如何运作

近日，Claude 大模型团队发布了一篇文章《Tracing the thoughts of a large language model》（追踪大型语言模型的思维），深入剖析大模型在回答问题时的内部机制，揭示它如何“思考”、如何推理，以及为何有时会偏离事实。

评：了解大模型内部运作机制

揭秘老黄演讲中关键技术：PD分离，UCSD华人团队力作，LLM吞吐量跃升4倍

老黄GTC重点展示的PD分离技术为何成兵家必争之地？UCSD全华人团队力作，创新性地提出预填充-解码分离技术。在严格的延迟约束下，相比现有最先进的服务系统，可实现高达4.48倍的有效产出率或10.2倍更严格的SLO达成率。现在，PD分离已经成为兵家必争之地。前有Mooncake/DeepSeek等公司采用这种技术来优化大模型的推理服务，后有Nvidia/PyTorch基于该技术孵化下一代LLM服务系统。

评：新的大模型推理加速框架

华人科学家登上 Nature：几行代码，优化复合AI系统

人工智能（AI）领域的突破越来越多地由协调多个大语言模型（LLM）和其他专业工具（如搜索引擎和模拟器）的系统驱动。迄今为止，这些系统主要由领域专家手工制作，并通过启发式方法进行调整，而不是自动优化。人工神经网络的发展也面临着类似的挑战，直到反向传播和自动分化技术的出现，才使优化工作变得简单易行，从而改变了这一领域。受此启发，华人学者、斯坦福大学副教授 James Zou 领导的团队提出了 TextGrad ，通过文本自动化“微分”反向传播大语言模型（LLM）文本反馈来优化 AI 系统。

评：自动优化生成式人工智能系统

英伟达开源自适应多模态「世界生成」模型，开启机器人、自动驾驶训练革命

Nvidia刚刚发布了「世界生成」模型Cosmos-Transfer1，可以根据多种模态的空间控制输入（如分割、深度和边缘）生成世界模拟，使得世界生成具有高度可控性。开发者使用模型能够创建高度逼真的模拟环境，用于训练机器人和自动驾驶车辆。

评：模拟训练环境逼近真实环境

AMD跑DeepSeek性能超H200，128并发Token间延迟不超50ms，吞吐量达H200五倍

DeepSeek-R1掀起新一轮购卡潮的同时，AMD的含金量也上升了。在AMD的MI300X上跑FP8满血R1，性能全面超越了英伟达H200——相同延迟下吞吐量最高可达H200的5倍，相同并发下则比H200高出75%。

评：Nvidia的平替

专为 DeepSeek类强推理加速，老黄拿出Blackwell Ultra，下代架构性能还要翻倍

因为 AI 技术爆发，GTC 大会的规模每年都在扩大，以前人们说 GTC 是 AI 的伍德斯托克音乐节，今年我们搬进了体育场，我觉得 GTC 已经成了 AI 的超级碗，」英伟达 CEO 黄仁勋说道。唯一的不同在于每个人都是『超级碗』的赢家。北京时间 3 月 19 日凌晨，全世界的目光都汇聚在加州圣何塞 SAP 中心，期待英伟达给出的下一个 AI 大方向。

评：能看到不能够到

Nature：你的大脑衰老速度受这64个基因影响

根据Nature最新报道，科学家们通过利用AI模型分析大量脑部扫描和遗传数据，确定了64个影响大脑衰老速度的基因，并指出了13种潜在的抗衰老药物。相关研究发表在最新一期Science子刊《Science Advances》上。

评：人类解开大脑衰老又近了一步

大脑抗衰手册：如何让你的脑力保持巅峰

今天的文章，我想跟你分享：如何更好地帮助大脑抵抗衰老，让我们的脑力能够长时间维持年轻和健康状态。

评：大脑抗衰办法

其他

从谷子到 AI玩具，情绪价值收割Z世代的千亿孤独税

2025做内容还有机会吗？答案藏在这7个趋势里

头部教育公司 AI 战局：教育场景迎来显著变革

1条评论

Forum说道：

6月 10, 2025 2:06 上午

最近全球市场的动荡真是让人目不暇接，从政治到科技，再到经济，似乎每个领域都在经历前所未有的巨变。智能爆炸的概念令人既兴奋又担忧，AI的迅速发展似乎要超越人类的控制范围。多模态思维链的研究展现了AI在处理复杂现实问题时的潜力，但同时也暴露了它的局限性。PD分离技术的出现无疑是大模型推理服务的一大突破，但我们是否高估了它的长期影响？TextGrad的提出为解决AI系统优化问题提供了新思路，但它能真正实现自动化吗？Nvidia的Cosmos-Transfer1模型在模拟环境生成中的应用令人印象深刻，但这是否会带来新的伦理问题？最后，GTC大会的规模不断膨胀，是否也意味着AI领域的泡沫正在形成？我们该如何理性看待这一系列的技术突破？

回复

1条评论

发表评论 取消回复

发表评论取消回复