🔥 Search Hot Tweets
Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.

当ai可以越来越快实现人们的想法时 缺少的并不是“就差一个程序员了” 而是“做什么,怎么做”的上下文 去开闲鱼 去做淘宝 去找外包 去reddit翻帖子 看看谁还在寻找程序员 在你不知道做什么的时候 重要的是接触客户 去多和别人谈一谈 并询问对方支付定金 在接单的过程里你就会知道 对方是谁 遇到了什么问题 当下是怎么解决的 是否愿意花钱提高效率 这些上下文是开发的基础 当你3-4个窗口同时并行4个付费需求时 你独立开发的成功机会就悄悄地被放大了

Claude Skills 系统看起来真的太完美了 每个 Skill 都是一个文件夹,只需要 Markdown 即可编写 而将文件夹系统作为 Context,正是 Claude 最核心的产品理念。 这是一个智能可插拔的技能系统,再也不用在系统prompt里塞垃圾了。 不仅可以加载记忆,还可以加载技能,这是目前最美妙最优雅的 Agent 架构。 每个人也可以分享自己的 Skill,一套开放的生态系统。 未来的想象空间没有上限。

特别认同陶哲轩的观点:现阶段 AI 最合适的用法不是直接把最强大的 AI 模型用来攻克最难的数学难题,更广泛、更实用的用法,或许是利用那些性能适中的 AI 工具,来帮数学家们加速完成那些日常繁琐但又必不可少的基础研究任务。 前些天听个 CVS 的人分享,说 CVS 药房很忙,但是大部分时间是浪费一些繁琐的事情上,比如说数药片,因为每个病人的药片数量都不一样,需要两个专业的药剂师,一个负责将指定数量的药片装到药瓶,一个负责将瓶子的药片数一遍验证对不对,一群高学历受过专业训练的药剂师每天要花很多时间在这些事情上。所以他们最近用 AI + 机器人的方式,将这个过程自动化,让药剂师们解放出来去做更重要的事情。 我自己日常用 AI 也是类似的,它不一定能帮我解决很多技术难题,但是我可以借助 AI 开发一些小工具,或者直接借助特定的提示词,就能帮我做很多繁琐的工作,这样已经可以极大的提升我的整体效率了。 --- 原文翻译见评论

HeyGen的Founder分享了他们团队内部的管理和产品方法论,摘取部分我最受益的六个观点: 1. AI产品要适配底层AI模型平均每两月一次的迭代周期,所以核心的产品功能向前规划两个月,但是也要时刻思考着接下来6-12个月的大突破可能会是在哪个方向。产品要和模型突破一起向前,不要被模型突破覆盖掉。 2. AI时代创业团队最大的错误就是速度太慢。不要怕犯错,要怕学习太慢。速度不仅仅是执行力,也是一个mindset - 如果任何时候你想到 - 周一再发这个功能而非现在,都意味着你不重视速度。 3. 团队每个角色最重要的责任: - PM要每天使用市面上所有的常用AI工具和竞品产品,理解为什么做某个功能和划分其优先级; - Engineer要给出PM可能会miss的技术视角同时用最快的速度把功能做出来; - Designer要把所有的复杂功能和用户需求简化成老奶奶都可以用的简单操作; - Data Scientist要能够配合PM找到最核心的数据和构建核心看板和分析工具,通过数据做出决策。 - Growth 对业务指标负责,同时要确保构建每一个功能和阶段的用户行为与喜好学习循环。 4. Everyone agrees = no one cares 每一个人都同意常常意味着大家其实不在乎。Disagree and commit。避免Decision Paralysis,即使有不同意见,选择一个之后就commit,通过用户反馈再来学习和调整。 5. 别憋大招。攒了六个月的重大更新发出来之后发现竞品其实早就发了这个功能且获客了,又或者构建了一个可以服务巨大用户量的框架但是事实上只来了100个用户。 6. 什么时候必须要慢下来: - 最重要的事情是学习用户需求,任何影响我们学习用户反馈的数据和功能缺陷都必须要修复; - 影响到用户核心体验、安全的bug。

宝玉
当机器开始“思考”:OpenAI解构语言模型推理的底层逻辑 ——从驯狗的比喻,看懂强化学习如何为AI注入“灵魂” 我们与AI的对话,早已越过答案的边界 当你向 ChatGPT 提出一个复杂问题时,你是否曾留意过那个闪烁的光标,以及它逐字逐句生成回答的过程?我们习惯性地将这个过程称为“思考”。但在这层表象之下,究竟发生了什么?它仅仅是在一个无限庞大的数据库中进行了一次极速检索,然后将结果呈现给你吗?或者,一种远比这更深刻、更接近我们人类认知方式的活动正在悄然发生? 这一切的起点在于一个根本性的区分:知道答案与找到答案。传统的计算模式,更像是前者——一个完美的、无所不知的图书馆员,能瞬间从浩瀚书海中为你提取所需信息。然而,我们今天所见的 AI,尤其是以 OpenAI 的模型为代表的先进大语言模型(LLM),正在向后者演进。它不再仅仅是一个知识的搬运工,而更像一个探索者,面对未知的问题,它需要通过一系列计算、推理和探索,才能最终抵达答案的彼岸。这趟从未知到已知的旅程,便是我们所说的“推理”(Reasoning)。而理解这一过程,不仅是理解 AI 的关键,更是洞察未来智能形态的一扇窗。 从“一步到位”到“步步为营”:推理的本质是时间的艺术 人类在面对难题时,鲜少能瞬间得出答案。我们会分解问题,寻找线索,进行推演,甚至会自我纠错。这个过程,本质上是用时间换取更高质量的思考结果。一个颠覆性的认知是,对于大语言模型而言,这条规律同样适用。 要理解这背后的逻辑,我们首先需要认识一个名为“思维链”(Chain of Thought)的概念。这并非某种固化的程序代码,而是模型从海量人类文本中学到的一种“模仿人类思考”的能力。早期研究者发现,面对一个复杂的数学题,如果直接要求模型给出答案,它往往会失败。然而,若在指令中加入一句简单的咒语——“让我们一步一步地解决这个问题”(Let's solve it step by step)——模型的表现会发生质的飞跃。 它会开始像一个学生在草稿纸上演算一样,将思考过程“说”出来:先做什么,再做什么,最后如何整合。每一个生成的词语,既是上一步思考的结果,也构成了下一步思考的上下文。这串看似“啰嗦”的文字,实际上是模型为自己搭建的逻辑脚手架,一个将复杂计算过程在语言维度上展开的“思维草稿”。 这引出了一个核心洞察:推理的深度,与模型被允许投入的“思考时间”——即计算资源——正相关。 时间越长,它能生成的“思维草稿”就越长,探索的逻辑路径就越深,最终答案的质量也就越高。因此,当我们看到模型“正在思考”时,那不仅仅是用户体验的界面设计,其背后是 OpenAI 在模型质量与用户耐心之间做出的精妙权衡。它在动态地判断,为了给出一个更值得信赖的答案,这次探索值得花费多长时间。 驯服“巨兽”:预训练与强化学习的优雅共舞 如果说“思维链”为 AI 的思考提供了方法论,那么真正塑造其行为、使其从一个博学但混乱的“知识巨兽”变为一个可靠、对齐人类意图的伙伴,则需要两种力量的共同作用:预训练(Pre-training)与强化学习(Reinforcement Learning)。这正是 OpenAI 自 2019 年起就确立的核心蓝图。 预训练,就像是让一个新生儿阅读完人类有史以来所有的书籍、对话和代码。通过这种“野蛮”的知识灌输,模型获得了对世界的基本认知,学会了语言的规则、事实的关联以及隐藏在文本背后的无数种模式。然而,这样一个“知识巨兽”虽然学识渊博,但其行为却是不可预测的,它可能会生成任何内容,无论好坏。就像 GPT-4 的早期内部版本,尽管潜力巨大,却被研究员们评价为“相当愚蠢”和“语无伦次”。 真正的魔法发生在第二步:强化学习。OpenAI 研究副总裁 Jerry Tworek 用了一个极其生动的比喻来解释这个过程:训练 AI,就像训练一只狗。 想象一下,你口袋里装满了零食。当你的爱犬做出正确的行为(比如坐下),你立刻给予它一颗零食和微笑作为“奖励”;当它做出不当行为时,你则收回注意力,表现出失望,这便是一种“惩罚”。日复一日,狗的行为模式就会被你所期望的方向塑造。 强化学习正是如此。研究员们(或被称为“AI 训练师”)会观察模型的输出。如果输出的内容优质、有帮助且无害,模型就会得到一个正向的“奖励”信号;反之,如果输出是错误的、有偏见的或有害的,它就会收到一个负向的“惩罚”信号。这个过程,特别是加入了人类反馈的强化学习(RLHF),就如同一个精密的行为矫正器,不断地对模型的内部权重进行微调。正是通过这个“驯服”过程,那个原始的、混乱的 GPT-4 才被雕琢成我们今天所见的、能够进行流畅且高质量对话的智能体。预训练赋予了它广阔的知识,而强化学习则为它注入了“灵魂”,教会了它如何以一种对人类有益的方式去运用这些知识。 “信念飞轮”:OpenAI内部的创新引擎 能够在短短几年内,以前所未有的速度持续推出震撼世界的产品,OpenAI 的成功绝非偶然。在其惊人的迭代速度背后,隐藏着一个强大而独特的内部创新引擎,我们可以将其抽象为一个“信念飞轮”模型。这个飞轮由三个相互啮合、彼此驱动的齿轮构成。 第一个齿轮是“宏大叙事下的极致聚焦”。OpenAI 从未掩饰其最终目标——构建通用人工智能(AGI)。这个宏大的愿景像一座灯塔,为所有研究提供了统一的方向。然而,在具体执行上,他们又表现出惊人的克制,整个组织只专注于三到四个核心项目。这种策略避免了资源的分散和内部的无谓消耗,确保了最顶尖的人才可以集中力量,在最重要的战线上取得突破。 第二个齿轮是“绝对透明驱动的集体智慧”。在 OpenAI 的研究部门,一个令人惊讶的原则是“每个人都知道每件事”(Everyone knows everything)。这听起来似乎有悖于传统科技公司对知识产权(IP)的保护逻辑,但其背后是对研究效率的深刻理解。他们认为,因信息壁垒导致最聪明的人无法做出最优化决策的风险,远大于 IP 泄露的风险。这种激进的内部透明,打破了部门墙,让思想能够自由碰撞,从而最大化地激发了集体智慧的潜能。 第三个齿轮是“动能与信念的相互加强”。快速地发布产品,会创造出巨大的市场动能和行业影响力。这种势能,又会吸引全世界最顶尖的人才慕名而来。而这些顶级人才,在极致聚焦和绝对透明的文化中,又能以更高的效率协同工作,从而更快地推出下一代产品。每一次成功的产品发布,都在验证并强化着团队最初的那个宏大信念,形成了一个不断加速的正向循环。这便是 OpenAI 能够持续引领行业变革的核心动力。 通往AGI的地图,仍在被绘制 从最初只能解决谜题的技术演示,到如今能够辅助科学家进行复杂计算、甚至在世界顶级编程竞赛中夺魁的强大工具,AI 的进化轨迹令人惊叹。然而,我们必须清醒地认识到,通往通用人工智能(AGI)的道路,没有单一的终极算法,也没有一蹴而就的捷径。 我们今天所见证的,是一个不断演进、层层叠加的构建过程。预训练是基石,强化学习是塑造,而未来,必然还会有更多我们尚未知晓的模块被添加进来。这幅宏伟蓝图的绘制,依赖于对智能本质的持续探索。 当我们孜孜不倦地教导机器如何像人类一样思考时,或许也应该反躬自问:在这个过程中,我们对于自身智慧、意识乃至存在的理解,又被如何深刻地改变了呢?这或许是人工智能时代留给我们最值得长期思考的问题。
Est. 500 views for your reply