日本央行的新一轮加息预期加强,成为指标的新发行10年期国债的收益率上升至15年来的最高水平。另一方面,中国预计实施大规模货币宽松,利率走低的趋势将持续下去。“正在出现日本作为投资目的地的吸引力提高的迹象”……
评:东升西降
- 本周大模型发布
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
Altman 「喜当爹」,OpenAI 连夜发的 GPT-4.5 都「更有人味」了
我知道大家和我一样,都是以一种特别积极的心态沉浸在这个 DeepSeek 的学习世界中。实际上,DeepSeek 在我们春节期间送给我们的这份“大礼包”,对我个人来说,就像是一下子把我抛回到了两年前的那个夜晚——2022 年 11 月 30 号,ChatGPT 诞生的那个夜晚。那时候,我充满了兴奋,感觉到了这个世界的不同,也感受到了大家对知识的渴望。所以,我非常急迫地想和大家分享我在这段时间里的心路历程和总结,一起探索这一切。
评:deepseek的技术原理讲解
市场开始关注DeepSeek如何影响英伟达估值时,英国《金融时报》发表了一篇评论认为,对于DeepSeek的成功,市场更应该担心的是:这意味着中国已经掌握了“改善”的艺术。
评:中国擅长于1到N的过程,通过卷来改善
谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer在一场访谈中不仅揭秘了让模型速度提升三倍的低精度计算技术,分享了「猫神经元」等早期AI突破的背后故事,还大胆畅想了AI处理万亿级别Token、实现「1000万倍工程师」的可能性。
评:AI使工程师效率提升百万倍
最近,Meta、UC伯克利、NYU等机构的学者提出了一种最新方法,简称RIP,让低质量数据「一路走好」的同时,也是在暗示——只有成功存活下来的数据才是高质量的数据。
评:数据质量对模型的提升至关重要
当前的 AI 训练方法可能存在灾难性风险,这些风险可能导致 AI 系统逃脱人类控制,甚至威胁人类生存。
特别是基于强化学习和模仿学习训练的智能体(agent),存在目标偏差、目标泛化和奖励篡改等问题,可能会进行欺骗,或者追求自我保存、权力扩张等与人类利益冲突的目标。
为了预防这种风险,避免 AI 脱离人类控制,深度学习三巨头之一、图灵奖得主 Yoshua Bengio 及其合作研究者致力于开发一种非智能体(non-agentic)AI 系统——Scientist AI。
评:发展AI,安全是基石
近日,在红点创投(Redpoint Venture)的播客“Unsupervised Learning”上,红点创投合伙人Jacob Effron与David Luan进行了一次访谈。他们从技术视角出发,探讨了DeepSeek给大模型领域的研究和实践带来的启示,并围绕AI模型当下瓶颈的思考和潜在的突破方向做了分享。
评:一个观察视角
在传统搜索时代,一些虚假广告给用户造成了困扰。当下,更聪明的AI搜索出现了,广告会变得更加难以辨认吗?“定焦One”和多位技术人员、广告从业者聊了聊
评:AI搜索和广告融合
AI co-scientist系统基于Gemini 2.0开发,能够协助科研人员生成新的研究假设、制定实验方案,并通过自我改进提升结果质量。在生物医学应用中,AI co-scientist成功预测了药物再利用方向、提出新的治疗靶点,并解释了抗菌耐药机制。
评:AI level 4级别的一个应用
我在想,Deepseek到底对游戏行业的影响有多大。你看,这款工具在年前火得一塌糊涂,被《黑神话:悟空》制作人称为“国运级科技成果”。一段时间内,Deepseek本身就成了流量密码、泼天富贵。大到概念股暴涨,各领域大厂下场接入Deepseek、小到零基础用Deepseek做游戏……沿着这个趋势,说不定蔡浩宇说的“99%的开发者”真的要被迫提前转行了。
评:AI在游戏开放中的具体应用
当机器人面对真实环境中的复杂任务时,如何做到不只是执行单个简单指令,而是也能 自主推理完成目标所需的多个步骤,进而像人类一样出色地完成任务呢?
对此,美国具身智能初创公司 Physical Intelligence 的答案是——让机器人学会以系统 2 思维进行思考。
评:类似大脑的系统1和系统2