🔥 Search Hot Tweets
Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.
这可能是我写的最“接地气”的 AI 科普:从家政阿姨看懂 Agent 和 MCP 我家请了个家政阿姨打扫卫生,这位阿姨高中毕业,但是经过了家政公司专业训练,学会了该怎么针对不同家庭去打扫卫生,使用各种不同的清洁工具。 当然她不可能记住所有工具的用法,所以额外的,家政公司还给她了一本《家政技能手册》,这个手册有两部分,一部分是目录,不同技能的简要介绍,字数不长,阿姨每次来干活之前都会读一遍目录,以便需要时能想起来; 《家政技能手册》的另一部分是技能的详细介绍,详细介绍里面不仅说明了各种技能的详细做法,有的还有配套的手册,有的还需要借助一些工具。 家政公司还给阿姨配备了一款定制的平板电脑,这个平板电脑支持一种智能家居协议,所有支持这种智能家居协议的家电她都可以用这个平板电脑连上操作。 为了提升效率,家政公司还给她配备了便携式扫地机器人,每次她都开车带上,一些扫地的任务就直接使用扫地机器人。 为了我经常需要阿姨来家里打扫,为了避免麻烦,所以我把我家的一些基本情况写成了说明书,好让阿姨知道该怎么更好的清扫我们家,并且阿姨很专业,每次工作完都写了一份详细的工作记录,这样她下次来还可以看一下以前都做了啥。 虽然有这个说明书,当然每次过来我还是要交代一下:“阿姨,明天我家要开了个 party,客厅一定要弄干净整洁点。” --- 说了这么多我当然不是为了炫耀我家请了个阿姨干活或者帮这家家政公司打广告,而是借这个来“辅助解释”一些常见的 AI 名词。 - 家政阿姨:AI Agent,有基础知识(类似于大语言模型),经过训练,会规划会使用工具 - 扫地机器人:SubAgent,专业的、自主的执行者。 主AI(阿姨)负责委托和监督,机器人(SubAgent)负责具体执行。这大大解放了主AI的精力(上下文窗口),让她可以去干更重要的活。 - 智能家居协议:MCP(模型上下文协议),智能家居协议就是那个家电的统一标准: 支持智能家居协议(MCP 协议)的家电工具阿姨都可以使用。 - 《家政技能手册》:Skills,家政技能手册可以帮助阿姨(Agent)学会她没有被训练过的技能,而且这些技能是“动态加载”和“渐进式披露”的。 “动态加载”的意思是:阿姨只有在需要用特定技能的时候,才会去《家政技能手册》翻该技能的详细内容。 “渐进式披露”的意思更进一步:阿姨不会一开始就把整本手册都读完,她干活前先看一眼目录(元数据,大约 100 个词),“哦,这个技能跟我现在的任务有关”。然后它再打开读具体章节(完整的指令,小于 5000 词)。 这有什么好处?省脑子(省上下文窗口)。 确保阿姨总是在最需要的时候,用最少的“脑力”获取最关键的专业知识。 - 我家:Project,存放了与我家相关的说明书、历史信息。 希望上面这个比喻能帮助你更好的理解这些概念。 ⚠️ 需要注意的是,这些比喻只是帮助你理解这些概念,并不能代替你深入的去学习和理解这些知识。
AI 原生软件,这两周我一直在讲。我也分享过一个最简单、最日常的例子:购物 Claude Skill。 如果你用过,你大概已经体会到了——所谓“AI 原生”,不是比传统 App 多几个智能功能,而是整个运作方式变了。 你不再点按钮,不再找菜单,而是直接说:“帮我记录一下刚买的东西。”“下周提醒我补货。” 系统不是在“记账”,而是在学习你的结构、你的节奏、你家是怎么运作的。 当你真正用起来,你会突然意识到: 你操作软件的方式变了,你的思维方式也跟着变了。 这才是 AI 原生软件的核心。 此文有中文翻译。 When Software Disappears: The Real Beginning of AI-Native Systems https://t.co/UANM07h6DA
如果你用过 Flomo 或者买过小报童, 或者看过《产品沉思录》, 那你大概率知道这些小而美背后的人 —— 少楠 昨晚听了期他关于一人公司的访谈,3 小时信息量巨大。 少楠是典型的产品经理出身,创办了多个项目,包括美食分享应用“食色”、动画门户网站 Anime Taste、便签工具 Evermemo 和二手书平台“摆摆书架”等,也在丁香园做过首席产品官,后来出来做了多年一人公司。 Flomo 和 小报童 都是他和合伙人 白光 一起做的,十来个个人的团队,全员远程,活得还挺滋润。 从这期访谈里整理出 4 条生存法则, 每一条都是他用真金白银验证过的:
经常有人问,能否一次性跟多个AI模型对话。 之前橘子做过一个Chrome插件叫AIHomeTab,把新开浏览器窗口变成AI对话框,一次性向多个模型提问对话。 今天,爱贝壳团队也做了一个类似的插件叫AI ChatHub 产品思路差不多,拼接URL提交到多个模型获得结果。 Chrome 插件应用商店搜“AI ChatHub”安装即可。
YouMind 的这一波更新很不错。划重点: 1、遇到不满意的 AI 产出,可以一键点踩退还消耗的所有积分。真正按效果付费,再也不用担心积分被 AI 乱花了。 2、如果是遇到 YouMind 自己出错了,会自动退还积分,点踩都不需要。 3、写好的文章,可以一键复制到微信公众号了,默认简洁优雅,并支持换主题颜色。 4、AI 配图里的中文问题,也可以调用即梦 4.0 来生图解决了。 你的需求,是 YouMind 前进的动力。 YouMind 的诚实,值得你信任。 大胆创作,不止于学。
我们实验室以前有一个本科生 非常认真,非常聪明,非常努力 大一就来实验室做实验 基本上每天都会在实验室忙一会 有的时候两三个小时 有的时候七八个小时 一直和我们组博士做实验做到了大四 最后本科毕业,论文都还没发出来, 一直到她自己博士入学一两年 她和博士的两篇文章才被接收 所以,每次看到生物学的本科生本科发了什么顶刊。我都有点情绪复杂。然后感叹有个好爹妈真好
ShipAny One 破 $10k 用了 4 小时 ShipAny Two 破 $10k 用了 3 天 感谢支持,继续完善。❤️ 半价活动持续到 11.30 号,新用户 🉑 冲,老用户 0 元购新版。 https://t.co/fbT37uBd8Y
如果有人敢在抖音讲 claude skills,大体分为三种情况 1. 为了让小白听懂,大量使用修辞手法,以至于信息压缩极其严重,根本无法把整个事情完全讲清楚 2. 讲的很专业,但是播放量极差 3. 既有深度,又有流量,这是真高手
作为老板,最心痛的事情莫过于 给员工提供了 Claude Code、Codex、Cursor 各种工具 但员工却不用 了吧...
关于印度裔美国人和华裔美国人差异的有趣的观点(下面的内容是 Junde Wu 原推文内容摘要): 65年移民和国籍法开始,印度大批受过良好教育的医生、工程师、学者进入美国,成了印度裔社区的第一代基础,而他们的高学历背景,也直接塑造了整个族群的教育水平与收入结构。 而华人移民的节奏完全不同。 因为中国经历了文化大革命,高学历、高技能的大陆移民真正的大规模涌入,其实要等到 80 年代末、90 年代 才开始,直到 2000 年代才达到峰值。 我们今天看到的差异,不是因为文化,也不是因为某个族群“更聪明”,而是因为不同族群来到美国的时间点不同、路径不同、筛选机制不同。
今年,我读了很多 alignment 和 AI safety 的论文。 开始一天比一天好奇,Ilya Sutskever 的 Safe Superintelligence Inc 到底在做什么神秘的研究和产品?
M: 来这里的意义是什么? D:因为门票免费? M:那只是现实层….因为黑鸟是冷战侦察机工程巅峰,飞行速度超过马赫2.5全身热膨胀,把缝隙填满。形成内真空状态。波音707的原型,当时在华盛顿航展,毫无征兆的做了空中翻滚。开启喷气式时代。 D:哦,你儿子看上个80刀的纪念品,你去把钱付了? M:算了吧,不如买汉堡。 D:欢迎回到现实层。
谁能认出来?我能。 https://t.co/qa4X3Slw4k
靠,正像Elon曾经说过的,尤根发明了当前AI的everything! 当前AI的所有理论都可以从尤根一个人写过的论文中找到线索。 https://t.co/AMd8ZB4IW8
在讨论 AI-Native 软件范式(AI-Native Systems) 时,我们必须先承认一个现实:用户从来没有被教育过如何使用“语言作为系统界面”。过去三十年他们接受的是另一套训练: 无数个 App 容器,每个 App 代表一个单独的世界,有自己的按钮、菜单、图标、工作流。用户的心智是被图形界面塑形的。 而当你突然把一个纯语言界面放到他们面前——光的、秃的,没有工具条,没有按钮,没有模式切换——大多数用户是会本能不适的。 因为这不是他们被社会化学习过的操作方式。 这正是 AI-Native 的悖论: 语言本来是人类最自然的界面,但在软件里,它反而变成“最陌生的界面”。 换句话说: 用户需要被重新训练,让语言重新成为界面。 但“语言即界面”其实只是表层。真正的底层结构是: 语言 → 结构 → 调度 语言不是聊天,语言是可执行结构; 结构不是代码,结构是可调度的认知单元; 调度不是操作系统,调度是系统的生命机制。 要让消费者理解一个“没有 App、没有按钮、没有菜单”的世界,他们需要一个适应期。因为这是一种范式迁移: 从“点按钮”到“发起意图”; 从“在 App 之间切换”到“让结构在后台自动调度”; 从“模仿电脑的操作方式”到“让电脑模仿人的思考方式”。 这就是 AI-Native 时代真正的冲击点: 不是技术本身,而是用户心智的迁移速度。
老了,胖了。 问AI,我YouTube咋办? 他居然建议我去贴假睫毛…. https://t.co/mHl071AGy7

宝玉
纽约客:人工智能的盈利困局与历史教训 作者:约翰·卡西迪 1987年,诺贝尔经济学奖得主、麻省理工学院(M.I.T.)的罗伯特·索洛(Robert Solow)在《泰晤士书评》的一篇文章中评论道:“计算机时代随处可见,唯独在生产率的统计数据中不见踪影。” 尽管当时计算能力飞速提升,个人电脑也日益普及,但政府数据却显示,衡量工资和生活水平的关键指标——工人的人均总产出——却停滞了十多年。这就是后来著名的“生产率悖论”(productivity paradox)。这个悖论持续到了上世纪90年代甚至更久,引发了大量莫衷一是的学术研究。一些经济学家将其归咎于新技术管理不善;另一些人则认为,与蒸汽机和电力等早期发明相比,计算机在经济上的重要性相形见绌;还有人则怪罪于数据统计有误,认为修正后悖论便会消失。 索洛的文章发表近40年后,自OpenAI发布ChatGPT聊天机器人近三年来,我们可能正面临一个新的经济悖论,而这次的主角是生成式人工智能(generative artificial intelligence)。根据斯坦福大学、克莱姆森大学和世界银行的经济学家最近进行的一项调查,在今年6月和7月,有近一半的劳动者(准确地说是45.6%)都在使用AI工具。然而,麻省理工学院(M.I.T.)媒体实验室一个团队的新研究却报告了一个惊人的结果:“尽管企业在生成式AI上投入了300到400亿美元,本报告发现95%的组织回报为零。” 该研究的作者们审查了三百多个公开的AI项目和公告,并采访了五十多名公司高管。他们对“成功的AI投资”的定义是:已经超越了试点阶段(pilot phase)并被实际部署,且在六个月后产生了可衡量的财务回报或显著的生产率提升。他们写道:“只有5%成功整合的AI试点项目正在创造数百万美元的价值,而绝大多数项目仍停滞不前,对P&L(即‘损益表’,profit-and-loss)没有任何可衡量的影响。” 调查采访引发了一系列回应,其中一些充满了怀疑。“领英(LinkedIn)上炒得天花乱坠,好像一切都变了,但我们的实际运营中,根本性的东西一点没变,”一家中型制造公司的首席运营官告诉研究人员。“我们处理合同是快了点,但仅此而已。” 另一位受访者评论道:“我们今年看了几十个演示。可能一两个是真有用。剩下的要么是‘套壳’(wrappers,指仅仅包装了现有技术,没有实质创新),要么就是‘科学项目’(指离实际商业应用还很远的技术探索)。” 公平地说,该报告也指出,确实有一些公司进行了成功的AI投资。例如,报告强调了针对后台运营(back-office operations)的定制化工具所创造的效率,并指出:“这些早期结果表明,有学习能力的系统,如果针对特定流程,确实可以带来真正的价值,甚至无需进行重大的组织结构调整。” 调查还提到一些公司报告称“通过自动化外联和智能跟进系统,提高了客户保留率和销售转化率”,这表明AI系统可能对营销有用。 但是,“许多公司正艰难地获取实质性回报”这一观点,与跨国咨询公司Akkodis的另一项最新调查不谋而合。该公司联系了两千多名企业高管后发现,对本公司AI实施策略“非常有信心”的CEO比例,已从2024年的82%骤降至今年的49%。企业首席技术官的信心也有所下降,尽管降幅没那么大。Akkodis的调查称,这些变化“可能反映了先前在数字化或AI项目上令人失望的结果、实施中的延迟或失败,以及对可扩展性(scalability)的担忧。” 上周,媒体对麻省理工学院媒体实验室研究的报道,恰逢英伟达(Nvidia)、Meta和 Palantir 等高估值的AI相关股票下跌。当然,相关性不等于因果关系,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)最近的言论可能在这次抛售中扮演了更重要的角色(鉴于近期的价格涨幅,抛售在所难免)。据CNBC报道,奥尔特曼在一次与记者的晚宴上表示,目前的估值“高得离谱”(insane),并在15秒内三次使用了“泡沫”(bubble)一词。 尽管如此,麻省理工学院的这份研究还是吸引了大量关注。在最初一轮新闻报道之后,有消息称,与许多科技公司有联系的媒体实验室正在悄悄限制对该报告的访问。我留给该组织公关办公室和两位报告作者的信息都石沉大海。 尽管这份报告比一些新闻报道所描述的要微妙,但它无疑对2022年11月OpenAI发布ChatGPT以来支撑科技繁荣的宏大经济叙事提出了质疑。这个叙事的简版是:生成式AI的广泛传播对工人(尤其是知识工作者)不利,但对公司及其股东却极为有利,因为它将带来生产率的巨大飞跃,并因此带来丰厚利润。 为什么这一幕似乎还没有发生?一个可能的原因让人想起了上世纪八九十年代的一种观点,即管理失误限制了计算机带来的生产力效益。媒体实验室的研究发现,一些最成功的AI投资是由初创公司做出的,它们在工作流程的狭窄领域使用了高度定制化的工具。而在“生成式AI鸿沟”(GenAI Divide)的另一边,那些不太成功的初创公司“要么在构建通用工具,要么试图在内部开发能力”。报告更笼统地指出,成功与失败的分野“似乎不是由模型质量或监管驱动的,而是由(实施)方法决定的。” 可以想象,生成式AI的新颖性和复杂性可能让一些公司望而却步。咨询公司高德纳(Gartner)最近的一项研究发现,只有不到一半的CEO相信他们的首席信息官“精通AI”。但对于媒体实验室报告中凸显的失望记录,还有另一种可能的解释:对于许多成熟企业而言,生成式AI(至少在目前的形式下)根本没有被吹嘘的那么神。“它在头脑风暴和撰写初稿方面非常出色,但它记不住客户的偏好,也不会从以前的编辑中学习,”媒体实验室调查的一位受访者说。“它会重复同样的错误,每次会话都需要输入大量上下文(context)。对于高风险的工作,我需要一个能够积累知识并不断改进的系统。” 当然,有很多人觉得AI很有用,也有学术证据支持这一点:2023年,麻省理工学院的两位经济学家发现,在一项随机试验中,接触ChatGPT的参与者能更快地完成“专业写作任务”,写作质量也有所提高。同年,其他研究团队也发现,使用Github的Copilot(一款AI编程助手)的程序员,以及使用了专有AI工具的客户支持代理,都获得了生产率提升。媒体实验室的研究人员发现,许多员工正在工作中使用他们的个人工具,如GPT或Claude;报告将这种现象称为“影子AI经济”(shadow AI economy),并评论说“它带来的投资回报率(ROI)”往往优于雇主发起项目。但问题依然存在,而且这肯定是公司高管们会更频繁提出的问题:为什么没有更多的公司看到这些效益体现在最终的(公司)利润中? 部分问题可能在于,生成式AI虽然引人注目,但在经济的许多领域中应用有限。休闲和酒店业、零售业、建筑业、房地产业和护理行业(照顾儿童、老人或体弱者)——这些行业总共雇佣了大约五千万美国人,但它们看起来并不像是AI转型的直接候选者。 另一个需要注意的重点是,AI在整个经济中的普及很可能是一个漫长的过程。在硅谷,人们喜欢“快速行动,打破常规”(move fast and break things)。但经济史告诉我们,即使是最具变革性的技术,即经济学家所称的“通用技术”(general-purpose technologies),也必须等到配套的基础设施、技能和产品发展起来后,才能最大限度地发挥其效用。而这可能是一个漫长的过程。苏格兰发明家詹姆斯·瓦特(James Watt)在1769年发明了他的圆筒蒸汽机。三十年后,英国大多数棉纺厂仍在使用水车提供动力,部分原因是运输用于蒸汽机的煤炭很困难。直到19世纪初蒸汽火车发展起来,情况才有所改变。电力的普及也很缓慢,并没有立即带来全经济范围的生产率增长。正如索洛所指出的,计算机的发展也遵循了同样的模式。(从1996年到2003年,美国整体经济的生产率增长终于提速,许多经济学家将其归因于信息技术的延迟效应。但随后,增长率又回落了。) 经济学家认为,在某些情况下,新技术甚至可能降低生产率增长,因为它们具有颠覆性,难以融入现有的工作方式。直到后期,生产率的提高才会显现出来——这种模式被称为“J曲线”(J curve,指一项新技术在应用初期,由于投入成本高、需要时间适应和流程再造,生产率先会下降,形成J的底部;随后,随着技术成熟和配套完善,生产率会迅速攀升,形成J的上升部分)。今年早些时候,来自不同机构的四位经济学家发表了一篇论文,认为美国制造业现在可能正处于AI“J曲线”的下降部分。在与人口普查局合作收集了企业层面的AI采用数据后,经济学家们表示,他们发现的证据表明“短期绩效损失先于长期收益”。该研究的作者之一、多伦多大学教授克里斯蒂娜·麦克埃尔赫兰(Kristina McElheran)在麻省理工学院斯隆管理学院发表的一篇相关文章中写道:“AI不是即插即用(plug and play)的。它需要系统性的变革,而这个过程会带来摩擦,尤其是对老牌企业而言。” 如果从表面上看,这个论点对企业来说终究是乐观的——尽管对那些技能可以被AI复制的工人来说未必如此。(正如一些入门级程序员已经发现的那样,后者完全有理由感到警惕。)在技术的J曲线上,一旦“摩擦”被克服,生产率就会腾飞。但由于沿着曲线的旅程可能很漫长,因此很难预测谁将成为赢家和输家。在互联网商业化浪潮中,许多最终的赢家直到2000年互联网泡沫破灭之后才出现。(谷歌成立于1998年,但直到2004年才上市。Facebook直到2004年才创建,Airbnb直到2008年。)历史不一定会重演。但那些仍在AI热潮中乘风破浪的投资者,现在兑现一部分筹码或许是明智之举。♦
Est. 3.1K views for your reply
