金算生电子报79集

  1. 全球资本流向大变局

最近的全球市场,用“风起云涌”来形容都显得保守了。各种“几十年一遇”的巨变接连上演,从特朗普在乌克兰问题上的立场转变,到马斯克大闹华盛顿,再到德国“不惜一切”的决心,以及股市的“东升西落”。如何理解这一切?今天我们来深度剖析这场大变局背后的核心逻辑,并且试着给出预测:接下去还会发生什么?


评:从不断借钱到持续化债

  1. 大模型和论文

谷歌重磅推出全新Scaling Law,抢救Transformer,3万亿美元AI面临岔路

AI自我纠错,Diffusion超越自回归,质量提升55%,已达理论证据下界

爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合

三位数学家改写经典牛顿法,300年前算法一夜更新,收敛速度更快函数范围更广

刚刚,OpenAI 一口气发布三个新模型,还为此做了一个新网站

OpenAI史上最贵模型来了,比DeepSeek贵270倍,100万输出token 600美元

DeepSeek V3开源升级震撼能力,DeepSeek正在实现Meta承诺做到的事

OpenAI和Google同日地震级更新:人间一夜,AGI 临近

  1. 硅谷投资人爆料:AI爆炸或将率先发生在中国

如果AI系统能自己设计出更强大的AI,智能爆炸可能很快就要到来了!而人类,会被AI迅速甩在后面。最近,硅谷投资人、EverFi CEO兼创始人Tom Davidson等人发表了一篇长文硬核博客,详细讨论了智能爆炸(Intelligence explosion, IE)的类型以及对应的发生概率。

评:智能爆炸的推演进程

  1. 一文看懂多模态思维链

不仅阐释了与该领域相关的基本概念和定义,还包括详细的分类法、对不同应用中现有方法的分析、对当前挑战的洞察以及促进多模态推理发展的未来研究方向。当下,传统思维链(CoT)已经让AI在文字推理上变得更聪明,比如一步步推导数学题的答案。但现实世界远比单一文字复杂得多——我们看图说话、听声辨情、摸物识形。

评:多模态思维链综述

  1. Claude深度“开盒”,看大模型的“大脑”到底如何运作

近日,Claude 大模型团队发布了一篇文章《Tracing the thoughts of a large language model》(追踪大型语言模型的思维),深入剖析大模型在回答问题时的内部机制,揭示它如何“思考”、如何推理,以及为何有时会偏离事实。

评:了解大模型内部运作机制

  1. 揭秘老黄演讲中关键技术:PD分离,UCSD华人团队力作,LLM吞吐量跃升4倍

老黄GTC重点展示的PD分离技术为何成兵家必争之地?UCSD全华人团队力作,创新性地提出预填充-解码分离技术。在严格的延迟约束下,相比现有最先进的服务系统,可实现高达4.48倍的有效产出率或10.2倍更严格的SLO达成率。现在,PD分离已经成为兵家必争之地。前有Mooncake/DeepSeek等公司采用这种技术来优化大模型的推理服务,后有Nvidia/PyTorch基于该技术孵化下一代LLM服务系统。

评:新的大模型推理加速框架

  1. 华人科学家登上Nature:几行代码,优化复合AI系统

人工智能(AI)领域的突破越来越多地由协调多个大语言模型(LLM)和其他专业工具(如搜索引擎和模拟器)的系统驱动。迄今为止,这些系统主要由领域专家手工制作,并通过启发式方法进行调整,而不是自动优化。人工神经网络的发展也面临着类似的挑战,直到反向传播和自动分化技术的出现,才使优化工作变得简单易行,从而改变了这一领域。受此启发,华人学者、斯坦福大学副教授 James Zou 领导的团队提出了 TextGrad ,通过文本自动化“微分”反向传播大语言模型(LLM)文本反馈来优化 AI 系统。

评:自动优化生成式人工智能系统

  1. 英伟达开源自适应多模态「世界生成」模型,开启机器人、自动驾驶训练革命

Nvidia刚刚发布了「世界生成」模型Cosmos-Transfer1,可以根据多种模态的空间控制输入(如分割、深度和边缘)生成世界模拟,使得世界生成具有高度可控性。开发者使用模型能够创建高度逼真的模拟环境,用于训练机器人和自动驾驶车辆。

评:模拟训练环境逼近真实环境

  1. AMD跑DeepSeek性能超H200,128并发Token间延迟不超50ms,吞吐量达H200五倍

DeepSeek-R1掀起新一轮购卡潮的同时,AMD的含金量也上升了。在AMD的MI300X上跑FP8满血R1,性能全面超越了英伟达H200——相同延迟下吞吐量最高可达H200的5倍,相同并发下则比H200高出75%。

评:Nvidia的平替

  1. 专为DeepSeek类强推理加速,老黄拿出Blackwell Ultra,下代架构性能还要翻倍

因为 AI 技术爆发,GTC 大会的规模每年都在扩大,以前人们说 GTC 是 AI 的伍德斯托克音乐节,今年我们搬进了体育场,我觉得 GTC 已经成了 AI 的超级碗,」英伟达 CEO 黄仁勋说道。唯一的不同在于每个人都是『超级碗』的赢家。北京时间 3 月 19 日凌晨,全世界的目光都汇聚在加州圣何塞 SAP 中心,期待英伟达给出的下一个 AI 大方向。

评:能看到不能够到

  1. Nature:你的大脑衰老速度受这64个基因影响

根据Nature最新报道,科学家们通过利用AI模型分析大量脑部扫描和遗传数据,确定了64个影响大脑衰老速度的基因,并指出了13种潜在的抗衰老药物相关研究发表在最新一期Science子刊《Science Advances》上。

评:人类解开大脑衰老又近了一步

  1. 大脑抗衰手册:如何让你的脑力保持巅峰

今天的文章,我想跟你分享:如何更好地帮助大脑抵抗衰老,让我们的脑力能够长时间维持年轻和健康状态。

评:大脑抗衰办法

  1. 其他

从谷子到AI玩具,情绪价值收割Z世代的千亿孤独税

2025做内容还有机会吗?答案藏在这7个趋势里

头部教育公司 AI 战局:教育场景迎来显著变革

发表评论

您的电子邮箱地址不会被公开。