🔥 Search Hot Tweets
Search and analyze hot tweets from KOL accounts within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.
这个视频炫酷,演示了月亮是怎么反射太阳光的 🌞->🌔->🌎 https://t.co/XDSakb383R
还是要做自己感兴趣的事情,哪怕看起来不那么主流正确有潜力。 我捡起了一年前被自己因为想快点上手VLA抛弃的项目,从程序员工作辞职后第一个想做的ai research,因为真的很好奇llm来模拟会和人类/rigid的agent有什么区别。当时的导师不懂我为什么想做这个,我的理由就是just for fun。然而我没有选择坚持自己的兴趣,而是选择投身做热门的机器人学习/数据。做了半天觉得自己也不大感兴趣呢,比起机器人还是对人更感兴趣。 之后单纯因为可能聊得来私信了一个推特小女孩(SDE背景+独立研究员+对意识感兴趣+很漂亮很酷),没想到真的成为了很好的朋友,每次deep talk都感觉意犹未尽,也带我在旧金山参加了很多活动、认识很多有趣的朋友,第一次有这种强烈的志同道合的感觉,感觉她算是我人生的贵人,帮助我打开了旧金山这张新地图。然后我们决定一起做点小东西,而她赞助了API和算力,前天我提到了我的那个simulation的想法,我们又决定一起开始做。感觉做自己的时候才会有好运,吸引力法则。有时候很多事情做不够好,也许本身就不够喜欢,但又觉得这个事情“正确”,谈恋爱和交朋友也是。 另外昨天参加了一个llm模拟的、特别低调、小团队但全是斯坦福教授和学生的high profile的公司的series a 聚会,已经融了100m并且还要double,商单已经接到爆了。 (其实之前也在推特bb过类似的商业模式,啊,很显然的saas市场,但没有被很多人注意到。)
Ding这个事情我也经历了。 说一个美国人的看法,正经只会说英文的美国人。 他们反而还羡慕少数语言(对他们来说中文也算)者,因为这种社区感强,意思就是,你反而能够通过少数社区找到真正的目标。英文大v也就是现在才逐渐有马斯克发的钱而已,但是社区感反而没有少数语言强。社区感不强,粘性也不强。 在美国有很多业绩很好的房地产中介,都是少数族裔。比如印度裔,早几年的华裔。美国人如果只是泛泛去做大众市场,很难出头,因为...社区本来就是割裂的。 其实AI以来,中文推特的质量已经好了很多了。
text me text me text me 已经星期五了,还没有给我发消息。 同时打五份工的中年男人年终是不是都很忙?
Nowledge Mem 的理念就是一个冥想盆,这个盆里,ai 自主或者我们主动地把思绪片段、重要发现丢进去。 它的野心是把所有的连线都丝滑连上,而现在我们还在快速补全这些虚线实线~ 我们现在的版本(private alpha)勾勒了骨架:记忆单元、历史消息、知识图谱,部分流入的插件、工具,流入之后加工、增强、处理的机制(graph 面板、ai now),但是很多流程还不完善,在各个桌面环境里还有尴尬的 bug。 感谢各位早期加入这个社区的先锋老师们的支持、信任。 未来一两周我们会把最核心路径上的东西梳理好、补齐重要的线路、修补不稳定的问题哈。🫡🙇 https://t.co/dllP4QTKMO
小白出海必备平台名词表 tiktok - 抖音 x/twitter - 微博 instagram - 小红书 Reddit - 百度贴吧 Quora - 知乎 Youtube - B站 Newsletter - 微信公众号 Facebook - 人人网 Threads - 微博 Linkedin - 脉脉 Whatsapp - 微信 Line - 微信(日韩) Telegram - 加密微信(币圈) Fiverr / Upworks - 服务型淘宝/猪八戒 Medium - 简书 Bluesky - 翻版推特 Yandex - 谷歌(俄罗斯) 你还知道哪些,评论区补充~
语境换一下: 1981年,在中国的许多地方“投机倒把”还是一项罪名。 有一群潮汕,广州人已经开始说商机,进货,价格差了…. 本质上来说,任何的社会层面变化,一定会影响人类的语言。 触碰先机的一定是先去适应和把这一切弄明白,而不是反“投机倒把”。世界少了谁都没损失,而你损失了时代冲浪的先机。
谷歌新的 Gemini TTS 模型太牛逼了! 直接可以通过提示词去控制说话人的性别、语调、语气、某个词的读音、年龄。 你能想到的都能控制,根本不需要切换单独的语音模型! 我的 AI 互动漫剧应用终于是完全体了! 使用Nano Banana Pro动态地生成每个场景的图片,以及新的TTS生成每角色的独特的语音。 https://t.co/CTsVOx70PN
我说过很多次,不要去赌大公司财报,尤其是用期权,逻辑也很简单: 1、机构的共识才是共识,哪怕业绩远超预期,只要有稍微不满意还是会跌,AVGO就这个意思,一跌大家开始讨论ASIC矿机是不是不是个好生意,赚不过NVDA这种通用性芯片了。 2、未来业绩指引也很容易被该公司的CEO去控制预期 3、期权的IV一般提前都被买起来了,你要赌至少要1周以上提前买,那时间价值就要多买一些,本身是浪费,要便宜就得买虚很多的行权价 期权的正确用法还是抄底,或者做空,做左侧用反向逻辑博,这样roi足够高,而且你要接受10次里面亏8次,每次仓位都开一样大小,剩下一次把这10次的本钱赚出来,剩下的一次是赚更大倍数的钱。 一盆豆子直接泼在坐标轴上。
对比了下 Banana Pro 还是强! 提示词:参考我提供的IP头像图片作为角色一致性参考。生成16宫格(4x4)表情包大图,每格一个表情,格与格之间留细白边分隔。角色保持相同画风,每格可在底部加短中文文案(2~6字,像素字体/简洁黑字)。除指定小道具外不要加复杂背景。无水印、无额外人物。 16格内容依次为:....
CRCL又一次用股价证明了满洲哥的说法,本质上就是货币基金,但是本身价格又受到BTC的影响,我其实不是很懂为啥BTC的价格对它影响这么大..... 不是payfi、稳定币逻辑么? 如果CRCL不做公链,确实美股有很多其他不错的标的可以选,没啥必要非死守这玩意,所以CRCL要么做Payfi,要么做公链,这俩都很符合这个公司接下来业务扩展范围的。
创业公司拿VC钱之后,拿多余的钱去买保本理财,用赚的利润还能多两个员工,都是心照不宣的常规操作,你不拿去买,VC还要说你。 但是摩尔线程这么大市值的半导体公司,刚上市就拿着75亿去理财,怎么感觉味道有些不对呢
好久没用安卓机了,问了gpt推荐用v2rayNG,捣鼓了下终于和世界接轨了。一个小观察,现在安卓手机配置高的吓人,我这个小米17promax居然有100w,如果充电快可以成为卖点,那么可拆卸电池为什么不再开倒车成为手机革命的新起点。我情愿带一块电池,也不愿意带一个移动电源。
你的人生追求是快乐吗? 快乐可以通过花钱买到,但那种快乐转瞬即逝,而且会让人感到空虚。 真正持久的满足感,只能来自于你为这个世界创造了什么价值。 你可以在小事上获得短暂的快乐,人生起起伏伏本来就是常态。 但真正持续的、深层的幸福感,只能来自于你产生的影响。 这种影响是什么,因人而异。 可能是创办一家改变世界的公司,也可能是成为一个好父亲,没有标准答案。 每当他回顾人生中最快乐的时刻,都是克服了巨大困难、解决了别人解决不了的问题之后。 那种快乐不是当下就能感受到的,往往要过很久,回头看的时候才会涌上心头。 萧伯纳有句话:理性的人让自己适应世界,不理性的人坚持让世界适应自己。所以,所有的进步都依赖于不理性的人。 人不能只消费,必须创造。
🧠大脑并不在乎你的意图,它只在乎你的重复。 在你心智深处那些安静的回路里,一件很了不起的事正在发生。 真正塑造习惯的并不是你的动力或奖励,而是你一次又一次去做同一件事时那种简单却稳定的力量。 华威大学的一项最新研究揭示了这个隐秘的真相: 当某个行动被频繁重复,它会在大脑里刻出路径,强到足以超越任何奖励或意图而持续存在。 于是你可以问问自己,你在重复什么? 因为你反复做得足够多的东西,最终会变成你的现实。 🔄 别只停留在想要,去重复。
对于勃勃这种流量逻辑,我是不会参与他们骂战的。对于围观吃瓜群众喜欢看这种互怼,我一直也不屑。我一不为钱,二不为流量。 我一直以来拉黑不手软,因为已经认识了不少和我一样真诚上网的网友。而且还是 并不稀罕所谓的流量。 对于这种人,我只能说,没教养。 许多人在网上随便乱说话,也是因为,线下没有任何约束。没有家人,没有社交,没有信仰,没有孩子。挺可怜。看着他与所有泡过澡的推友全部,真的是全部闹翻…....
给 antigravity 下达了一些批量化翻译的指令,运行到第四个文件就完全忘了是翻译,全是概括。。。。。 想了想还是切回 cc + subagent 几下跑完了
不要再做专家了!专家是工业时代的产物。 做一个全能人吧!我们的祖先本来就是全能人。 能写代码、能听音乐、能举重、能画画、能创作,不必把自己框在某一个专业里。 只会一样技能的时代正在过去,拥有多维度能力的人反而更有优势。 全能人。 这才是未来。 https://t.co/ULsGz3tqU8
推特上每天都在上演: 这个作者太牛逼了,他的书写得真好! 我一定要免费分享给推友! 我一定要大力传播他的盗版! 我一定要坑他一把! 《论以怨报德》 《论现代侠义精神》 《论当代恩将仇报之道》 《论如何优雅地背刺恩人》 《论白眼狼的自我修养》 《论薅羊毛的最高境界》 《论精神支持与物质白嫖》 《论口嫌体正直的艺术》 《论新时代农夫与蛇》 《论爱在心里口难开钱包》 《论鼓掌不花钱》 《论我为人人人人白嫖》 《论感动自己的重要性》 《论嘴上主义与心里生意》 《论精神股东的一百种姿态》 《论免费对作者的伤害》 《论云支持大师养成记》 《论键盘侠的浪漫主义》 《论好话说尽坏事做绝》 《论当代东郭先生与狼》
关于为什么被封号,如果经常发各种白嫖、学生认证等作弊违规信息,人家很容易检测到,上周五一大波推广 Wise 香港开卡的,结果很多人审核到现在一周了还没消息,大公司又不是傻子。当然被封了不排除有误伤。
非常牛逼,可以把不同图片的不同元素抠到一张图片里 然后让Nano Banana Pro直接融合、重构、重新排版,就变成了新的海报。 比如我这里左边那张图片的右下角的人物、底下的背景,以及迪士尼的那个文字部分都是单独的元素,但是右边就融合到一起了。 https://t.co/ucUaGc7JzM
Nano Banana Pro 是目前最强的 AI 图像模型。 人们正在用它创造疯狂的 3D 渲染、不可能的镜头,以及超逼真的 AI 网红。 10 个示例 + 提示语,收藏:👇 1. Nano banana → World Labs → WebAR(threejs) https://t.co/xSvlzjMuPV
很有意思 Figma 内置了个 Banana 而 Cursor 内置了个 Figma 很多所谓壁垒的东西,最终都不过是一次 Vibe
人生最调皮的一件事, 就是在大佬面前装蒜 假装这个人不是一个大佬 然后你和他就聊一些非常细枝末节的小破事 然后你一定要装作压根不认识这个人 然后持续聊 直到对方装不下去了 其实这个过程里 他也很爽、你也很爽 大家都很快乐
插播一条,Epic 现在可以白嫖《霍格沃兹之遗》 https://t.co/90zWrV0ND7
有的人字都懒得打,给个AI截图来说你不行。 有的人说你全篇废话,但是自己连废话都写不出来。 现在人都如此自信么?面对我这个纯原创,中英文长篇和代码都自己写的人? 不是说男人怎么样啊。我还带两个6岁以下的小孩子呢。
GPT 5.2 应该是结合了 5.0 的质量和 5.1的速度。 是否有多少的提升? 如果有大的提升肯定会叫 5.5 啊,叫啥子 5.2 呢。
总是会被“灾难”中的人情感动 背景:公寓热水管爆了,导致电梯停运,预计要很久修复,现在大家只能爬楼梯,最高层 59 楼, https://t.co/6slcW7z0qK
Mr Panda 推荐的这本神书真 TMD 的牛 B,忍不住用 Gemini 3 Pro 做了一门课 这样我就可以针对性系统性的学习了,不然单纯看这本书还是有点枯燥的 需要的朋友也可以根据个人习惯去定制一份 https://t.co/vXFB4eQBCR
看一下Figma新增的这个图像编辑能力有多牛逼 它抠出来的文字是带透明通道的,这个太顶了! 就是那个文字你想放哪就放哪,因为它带透明通道。 然后抠人像、抠一些细小的细节都没问题,消除某个元素也没问题。 https://t.co/semvAcKpfQ
我去,Figam 这个 Nano Banana Pro 驱动的图像编辑能力太顶了 几乎支持所有的图像编辑能力,包括: - 提取图片中的元素 - 消除图像中的元素 - 扩图和抠图(去除背景) - 通过提示词改图 尤其图片分层能力,扣的非常好,各种文字之类的也行 https://t.co/914FSQ5gtG
Cursor 上线了可视化编辑能力,可以像 Figam 一样直接调整你的网页设计样式 通过拖拽在 DOM 树中直接拖动元素,调整布局 侧栏可直观调参组件状态与样式; 还可以在界面上点选任意元素并用自然语言描述需求 https://t.co/LRkZMtf8Ri
没有AI以前,我绝对不会想到有一天我编程还会掉眼泪的…. https://t.co/sSnIxkzUBb
谷歌 Ultra 会员的 NotebookLM 权限终于扩充了! - 比免费版多 50 倍的生成限额 -可以使用最高等级 Gemini 模型 -支持添加最多 600 个笔记来源 -PPT 生成支持“长”的设定选项 -支持移除 PPT 和信息图的水印 https://t.co/NCbbGaDLod
过去我们讲 SaaS(软件即服务),现在硅谷那边开始流行”服务即软件“了。 什么是”服务即软件“呢,简单点说就是 agent 系统,不卖软件,卖会干活的“工人”,占信息源、收人力钱,这是一个 4.6 万亿美元的市场。 想要在这个市场中获得优势,必须占据信息源头,然后把价值包装成“完成的业务结果”(解决工单、缩短 MTTR、替代一线工资)。占源头的人,得以编排下游一切;按结果收费的人,掏走人力预算。
做民营企业家 不是在监狱里,就是在去监狱的路上 做内容创作者 不是被封号,就是在被封号的路上 JUST BE READY
🍌 nano banana pro prompt ☕️⚔️ A raging pirate sea battle unfolds inside a cup of coffee — where crema becomes waves and cannon fire shatters reality. A cinematic world hidden in plain sight. --- Prompt --- Ultra-photorealistic, cinematic macro photography style, capturing an impossible “world inside a cup.” A white ceramic coffee cup sits on a natural wooden tabletop, filled to the brim with dark coffee. The coffee surface transforms into a turbulent ocean: deep brown waves surge and collide, with realistic coffee crema forming foamy crests, swirling vortices, and complex fluid motion, indistinguishable from a real sea. The rim of the cup is damaged by cannon fire, chipped and broken in several places, implying the intensity of the battle. Two 18th-century classic pirate sailing ships clash violently inside the cup. The ships are miniature in scale yet extremely detailed: visible wooden hull grain, layered decks, rigging, and weathered sails partially torn and billowing in an unseen sea wind. Portions of the ships rise above the cup’s rim, creating a striking sense of scale contrast and surreal tension. The scene is frozen at the most dramatic moment of combat. Cannons fire simultaneously from both ships, erupting with bright orange muzzle flashes and thick white smoke that expands within the confined space. The explosions illuminate the ships, sails, and coffee waves, while splashes of liquid burst into the air like seawater caught mid-motion. Shot from a macro perspective with shallow depth of field, the focus is razor-sharp on the ships and battle action. The background is naturally blurred, revealing only the upper portion of the cup and hints of the surrounding environment. Lighting follows realistic photographic principles, with rich textures and cinematic contrast, creating a highly believable, dramatic, and surreal movie-like moment—tense, epic, and astonishingly lifelike. --ar 1:1
哈哈哈 和自己婚绿的朋友聊天 就在聊北美找工作的事情 大家都知道现在很难给sponsor了 我就想问一下她有没有比较熟悉的移民律师 我想把NIW先交了 结果她说: 有点好笑了,哥 有点嘲讽,又有点歧视 好吧,终究是高贵的美国人了 唉,好吧
根据文章生成公众号封面图提示词: {文章内容} 参考上面的内容帮我画一张微信公众号封面图,要夸张吸引眼球,标题是:《{文章标题}》 https://t.co/vMm0q7ons9
注意力:最后的殖民地 诺贝尔经济学奖得主Herbert Simon在1971年就预言: "在信息丰富的世界里,稀缺的不是信息,而是注意力。" 50年后,他的预言成为现实。 石油可以开采,粮食可以种植,商品可以生产。但注意力是固定的:每个人每天只有24小时,每小时只有3600秒。 而且,人类的注意力是有限的、易疲劳的、不可再生的。 这就是为什么Facebook、TikTok、YouTube的商业模式不是卖东西给你,而是把你的注意力卖给广告商。 你以为你是用户?不,你是产品。 https://t.co/Y6pJyaIKNG
🍌 nano banana pro prompt From a humble garage to a futuristic peak — a frameless isometric world that tells an entire company’s evolution in one vertical timeline 🚀🏗️ prompt 👇 https://t.co/dAJgZ98fI0
NotebookLM 正式加入 Google AI Ultra 计划! 从今天开始,订阅了该计划的用户将在 NotebookLM 中享受到“顶配”待遇: — 最强模型支持:直接调用 Gemini 系列最新、最强大的模型版本。 — 更高用量上限:大家爱不释手的核心功能——比如音频和视频概览(Audio & Video Overviews)以及幻灯片生成(Slide Decks)等——现在拥有了最高的额度限制,让你用得更尽兴。 — 最大容量空间:笔记本的容量全面扩容,每个笔记本支持添加的资料来源(Sources)数量也达到了巅峰。 — 独家特权体验:抢先使用特定功能,比如重新上线的幻灯片“长篇模式”(Long option),以及导出幻灯片和信息图表(Infographics)时可去除水印。
中日官方互啄对民间的影响逐渐显现了 大量航班无故取消的结果不光拦住了来日旅游人群,有正常返乡打算的人因为怕回不来,也只能留在日本过寒假了 另外,最近确实存在 1/3 年旅游签办不下来的情况,也不知道是哪边在卡脖子 当然,无论怎么搞,多花钱就能解决,大不了从韩国转机,只看值不值得
Sam 狂喜,OpenAI 的年底答卷 GPT 5.2 正式发布 不要被他的版本号欺骗,这是今年 OpenAI 的年底大招。 官方定位是:迄今为止面向专业知识工作的最强大模型。 模型性能大幅提升,价格也大幅提升了 40%。 在降本的大趋势下,模型涨价,一般都需要底气。 这个模型的底气在哪里? 前阵子 OpenAI 设计了 GDPval,一个以国内生产总值(GDP)这一关键经济指标为灵感。 1320个专业任务,覆盖了美国 GDP 贡献排名前 9 大行业中精选出的 44 个职业。 任务要求提交真实的成果作品,例如销售演示文稿、会计电子表格、急诊排班表、制造流程图,或短视频。 刚发布 GDPval 的时候,Claude Opus 4.1 以 47.6 的分数遥遥领先。 但是今天, GPT-5.2 直接把分数刷到了 70% 以上。
GPT 5.2 发布了,写了一篇 AI Biscotti。 这是我近期写得最好的一篇,exlusively for my subscribers。 https://t.co/X6M3XmJoWQ
OpenAI 发布了 GPT-5.2,“成人模式”将在明年第一季度推出。 OpenAI 刚刚推出了一款全新的 AI 模型,旨在大幅提升 ChatGPT 在编程、科学研究以及各类工作任务中的表现。这一动作紧随谷歌之后——几周前,谷歌母公司 Alphabet 推出了备受好评的 Gemini 3,一度让 OpenAI 被迫转入防守态势。 这款名为 GPT-5.2 的新模型不仅速度更快,在信息检索、写作和翻译方面也更加得心应手。OpenAI 在周四表示,该软件将提供三个不同版本。更重要的是,它被设计用来更好地模仿人类的推理过程 (即像人一样通过逻辑分析来解决问题),从而能够处理数学和编程等领域中那些更为复杂、篇幅更长的任务。 曾经,OpenAI 是 AI 研发领域无可争议的霸主,但现在它正面临着来自谷歌和 Anthropic 的新一轮猛烈冲击——这两家公司在过去几周内都发布了强大的新模型。尤其是谷歌的 Gemini 3,凭借其卓越的推理和编程能力赢得了广泛赞誉,并迅速登顶了 LMArena 和 Humanity’s Last Exam (“人类最后大考”,一个专门测试 AI 极限能力的权威评测集) 等备受瞩目的 AI 排行榜。 就在本月早些时候,OpenAI 首席执行官 Sam Altman 在一份公司备忘录中宣布进入“红色代码” (Code Red,通常指公司面临生死存亡危机时的最高紧急状态),并要求重新调配内部资源,全力加速 ChatGPT 的改进。这一指令让人不禁联想到三年前的戏剧性一幕:当时 ChatGPT 刚刚问世,谷歌也曾因感到巨大威胁而发布过类似的“红色代码”。 凭借 GPT-5.2,OpenAI 正试图吸引更多的企业客户并提升收入。这至关重要,因为该公司已承诺投入超过 1 万亿美元用于基础设施建设,以支撑 AI 的持续发展。为了实现这一目标,OpenAI 表示新模型旨在“为人们释放更多的经济价值”,具体的改进包括更高效地创建电子表格、制作演示文稿,以及编写代码。 GPT-5.2 将于本周四开始向付费用户推送。 今年 8 月,OpenAI 发布了备受期待的 GPT-5,但市场反应褒贬不一,有人质疑它并未带来革命性的突破。随后的 11 月,OpenAI 又推出了升级版 5.1,但这波更新很快就被谷歌更强大的 Gemini 3 抢去了风头。 在周四接受 CNBC 采访时,Altman 说道:“Gemini 3 对我们各项数据指标的冲击,其实比我们担心的要小。”他还表示,预计 OpenAI 将在明年 1 月结束“红色代码”状态,并且届时公司将处于“非常强势的地位”。 此外,OpenAI 还透露已开始部署一种能预测用户年龄的软件,旨在更好地管控 ChatGPT 对 18 岁以下用户的回应方式。在周四的媒体简报会上,OpenAI 应用业务首席执行官 Fidji Simo 表示,公司希望在推出“成人模式”之前先上线这一年龄识别功能。此前 Altman 曾提到,“成人模式”可能会允许“经过验证的成年人访问色情文学等内容”。 Simo 表示,“成人模式”将在明年第一季度推出。 新闻来源:https://t.co/WD8iGZ01np
你要问学术圈有多穷 就是我几个月前 在小红书发了一个nanobanana做科研机制图的帖子 本来帖子不温不火 结果莫名其妙几个月流量滚了八千多 每周都会有几个人跑来问我做图怎么收费 我说50一张,不包后续,800块帮你生成到满意 愣是回完了所有消息,也没人找我买 而我在这之前还觉得800交付有点重了 https://t.co/AbB2qERSQ8
🍌 nano banana pro prompt The Black Pearl awaits its captain. 🏴☠️✨ --- Prompt --- A detailed photograph captures a glass bottle containing a miniature scene. Inside is the 'Black Pearl,' a weathered pirate ship with torn black sails and Jolly Roger flags, sailing on rough turquoise waves. Above is a sunny sky with white clouds, a bright sun flare, and flying seagulls. The exterior of the glass bottle is covered in water droplets. It rests on a rustic, wet wooden surface with sunlight reflecting off the glass and water. The scene is photorealistic and highly detailed. --ar 3:2
Cursor 正式变成 design engineering 终极工具了。 试了一下 bug 还是不少的,修改后点 Apply 不管用,而且看起来是可视化编辑,但改动后竟然不是直接操作代码,而是打开一个新的 agent 让 AI 帮你改…… 比如我仅仅改动一个 padding 的尺寸,需要新 agent 窗口跑半天,那我不如直接打开文件改了,有点太浪费 token 了吧😅
豆包 AI 手机,两次指令写短视频标题 https://t.co/5ScQgGIPPS
Double Shot | Agent Scaling Law 一个月之内,面对 Agent scaling law,两篇文章得出似乎相反结论: Paper 1: 一百万个 Agent, 可以零差错完成一个需要一百万步骤的长程执行问题。 Paper 2: 在真实任务中,Agent 越多,就越会放大错误,影响执行任务表现。 问题来了:LLM 作为 Agent 究竟能不能,以及如何可靠地scale 到极长,极复杂的过程? Yes or No。 问题在于,真实世界的问题是否可以解构成为像Hanoi 那样的纯粹问题。
200万栋需要装电梯的高层居民楼,一旦走入老化的阶段,那就是一代人,睁眼啥也都还没干呢,就寻思“修补”这件事情。 当代还没有办法理解,我现在住的这个房子是1955年的。我们从住进来,就是屋顶,各种保温填料,我的木工,队友各种电工,水管工,各种墙面,地板的技能,都是自己慢慢干活练出来的。 这还是木结构小平房。不涉及高空外墙,复杂的排污,电工走线,通风,电梯维护,水管排污管各种管道有没有变形泄漏(可以推演一下排污管泄漏,高层,在某一层,泄漏怎么办),钢筋,水泥的混合比例,钢渣,消防,很多房子还找不到业主,空置....反正到时候开发商肯定不在了,物业是只管收钱的,邻里关系是很差很差的....这个惊天大雷怎么办。
