金算生电子报27集

  1. 苹果Vision Pro开启新时代,计算机从2D到3D,三维内容生态迎万亿蓝海

苹果首款设备Vision Pro发布,意味着基于空间计算的三维计算机生态开始商业化。苹果2023年发布的首款头显,是从芯片、集成电路,到计算机硬件、操作系统、软件工具等,完全以空间三维建立的一套全新的三维计算机系统,进而帮助人类在现实世界中构建起一套平行的三维计算机世界,从而实现三维内容交互,让人类工作、生活更加富有效率,这是新一轮人机交互变革,也是新一轮信息技术产业革命。

评:Vision Pro开启3D时代

  1. 3D系列第二篇:3D内容生产-全球科技竞争战略高地

3D内容的生产—又称3D数字化、3D建模,是指通过机器扫描、计算机软件、人工处理等构建出具有三维立体数据、色彩、纹理、各种几何面的3D数据模型。其涉及到多视图立体几何、深度图估计、点云处理、网格重建和优化、纹理贴图、马尔科夫随机场、图割等技术。目前,3D内容生产主要有人工建模、机器扫描两种方式,其中机器扫描又分为激光、结构光和图像建模。

评:降低3D内容生产的门槛

  1. ChatGPT重磅上新,教练、营养师人格任你选,自定义指令秒变“高级个人AI助理”

ChatGPT又一波王炸来了,继Code Interpreter后,ChatGPT又迎来重磅升级。新功能「自定义指令」让你的ChatGPT秒变个人助理,教练、营养师、各种Cosplay任你玩。

ChatGPT又一波王炸来了。

今天,OpenAI官宣了「自定义指令」(Custom instructions)新功能。这意味着,人人都可以打造一个独一无二的回复,能够很好控制ChatGPT响应方式、偏好等。

评:打造私人助理的时代

  1. AI智能体联手GPT-4淘汰人类导演,模仿斯坦福西部世界拍出《南方公园》

AI Agent要淘汰人类导演了!初创公司Fable利用AI智能体,直接拍出了一集《南方公园》,AI的脑洞,真的不输原作。

AI Agent,又给我们带来了亿点点震撼——AI智能体直接晋升导演,拍出了一集《南方公园》!

没错,编剧、动画、导演、语音、编辑……剧集制作的全流程,都是由AI完成。

初创公司Fable新发布的节目统筹智能体(Showrunner),如同一声惊雷炸响。

项目的灵感,就来自于此前斯坦福爆火的西部世界虚拟小镇论文,其中25个AI智能体居住在包含学校、医院、家庭的沙盒虚拟城镇中。而在这次的《南方公园》中,同样是一群AI角色通过复杂的社交互动来推动自己的日常生活,每个人都有自己独特的背景故事、个性和动机。

评:游戏自动自主开发

  1. 硅谷大佬都在聊的AI Agents,是真热还是虚火?

AI Agents注定是一场马拉松。ChatGPT获得巨大成功后,OpenAI已然奔向下一个目标——AI Agents(智能体)。“如果一篇论文提出了某种不同的训练方法,OpenAI内部会嗤之以鼻,认为都是我们玩剩下的。但是当新的AI Agents论文出来的时候,我们会十分认真且兴奋地讨论。普通人、创业者和极客在构建AI Agents方面相比OpenAI这样的公司更有优势。” OpenAI联合创始人,前TeslaAI总监Andrej Karpathy说道。Karpathy的公开发言为AI Agents添了不少热度。但他的判断并非一家之言。

早在3月份,AutoGPT就在GitHub上获得7.4万星,并快速成为史上Star数量增长最快的开源项目;而后发布的BabyAGI、AgentGPT更如雨后春笋般涌现:订购披萨、整理邮箱、创建博客,甚至举办一场情人节派对……

越来越多的AI Agents出现在人们生活的各个场景下,热潮迅速开始从硅谷蔓延。

自主执行、独立运作,AI Agents被科技人士给予极高的期待,认为其是“变革社会的生产力工具”。更有人将其视作“通往通用人工智能(AGI)时代的开始”。但呼声并不能掩盖现存的问题。

“大模型是AI Agents的前提,有了足够好的硬件基础后,才能去发展AI Agents。”真格基金管理合伙人戴雨森对「甲子光年」表示。严格来说,市面上只有ChatGPT一个“合格”的大模型底座。受制于模型算力,国内仍然缺乏AI Agents的开发土壤。未来美好,现实残酷。技术研发与创业投资等都在摇摆中进行。AI Agents的红利期何时真的伴随大模型浪潮而来,谁都不得而知。但可以肯定的是,改变已悄然开始。

评:下一个AI目标: 智能体

  1. AI大模型崛起,向量数据库终得“出头之日”?

大模型的火热,不仅让生成式AI的创业公司成为全球的关注对象,也带动了一个曾经沉寂行业的崛起。

截至6月,2023年全生成式 AI 模型初创公司的平均估值已经接近 1 亿美元,是2022年的两倍以上;仅在中国,截至6月,参数规模在10亿以上的大模型总数量就已经达到79个。当众多从业者都急切投身于这个改变时代的机遇,自然也会底层基础设施也提出更高要求。

因此,作为大模型创业公司、AIGC创业公司的基础设施——向量数据库——经历了此前几年的“门前冷落鞍马稀”,如今面对来自资本、客户的关注,似乎终于迎来“出头之日”。

评:向量数据库迎来风口

  1. 机器人ChatGPT来了,谷歌发布又一AI大模型黑科技

RT-2相当于机器人版ChatGPT,被Google DeepMind称作是其视觉-语言-动作 (VLA)模型的新版本。该模型可以教会机器人更好地识别视觉和语言模态,能够解释人类用自然语言发出的指令,并推断出如何做出相应的行动。它还可以理解英语以外的语言的指示。

结合思维链推理,RT-2可以执行多阶段语义推理。即便是一些抽象概念,RT-2也能理解并指挥机械臂做出正确的动作。比如让它找一把临时用的简易锤子,它会抓起石头;让它给疲惫的人选一款饮料,它会选择红牛;让它把可乐罐移到泰勒·斯威夫特的照片上,它也能顺利完成。

评:又一个大型语言模型应用场景

  1. Anyscale:Databricks 创始人再下场,ML 领域最值得期待的公司?

Anyscale 是一个机器学习分布式计算平台,基于开源框架 Ray 进行设计。Ray 同样出自 Anyscale 团队之手,Anyscale 与 Ray 的关系就像 Databricks 与 Spark,最近大火的 ChatGPT 就是基于 Ray 的框架训练。Ray 目前在 Github 上有 2.3 万个 stars,4 千多次 forks,以及 760 多位 contributors。


评:Anyscale市场前景分析

  1. 下一个董宇辉,可能正在玩播客

曾几何时,电台节目凭借“电话互动”等优势成为人们喜闻乐见的娱乐休闲形式。但伴随着视觉媒介的发展,越来越多的观众开始被电视、网络所吸引,电台节目因此退出都市文化舞台。但如今,播客这种带有年代感的内容形式,又将音频节目重新带回到大众视野。对比短视频的如日中天,眼下的播客或许仍然只是一种流行在小众圈层的内容形式。但听众、播客频道主以及品牌的集体涌入,正在将播客从小众乌托邦打造成为新的内容潮流,并持续挖掘其背后的商业价值。

评:自己也在做播客节目,不过还是希望行业能慢慢健康发展

  1. 诺华、百济“割席”背后:TIGIT是一条怎样的赛道

诺华的退出,不是TIGIT的失败。从百济神州引进TIGIT抑制剂欧司珀利单抗一年半后,诺华最终决定放弃了这款潜力产品。

诺华当初为了得到欧司珀利单抗在北美、欧洲和日本的权益,不惜给出3亿美元首付款,最高18.95亿美元里程碑款,以及20%-25%分级许可费的高价。在TIGIT靶点这条潜力赛道上,诺华可谓是一掷千金。

在放弃欧司珀利单抗后,诺华将不再向百济神州支付后续款项,而百济神州也自然而然地收回了这款药物的海外权益。那么当时诺华为何如此看重欧司珀利单抗?它所放弃的TIGIT靶点又是一条怎样的赛道?

评:TIGIT靶点存在很多不确定性和发展机遇

发表评论

您的电子邮箱地址不会被公开。