🔥 Search Hot Tweets
Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.
宝藏论文,虽然转过了,再转一次。 LLM的reasoning的epic failures,就像这几天大家转的50米洗车的案例,作为纯符号层的llm推理,论文中也首先提到要区分embodied和non-embodied,llm显然很难区分这一点,顾此失彼,让人走过去却忘了车! 论文的survey框架不错,不仅对于模型训练,对于如何搭建agent脚手架也有裨益。 一个会从错误中持续学习的agent会很可怕😱
CLI Agent + SSH 是我最多使用的 code agent 使用场景。几乎所有 CLI 动作都可以在 ssh session 中完成,只要有云,你几乎可以做任何事情,不受本地算力限制。 在 Opus 4.6 出来的时候,ssh 因为安全问题一度无法使用。 只过了两周,claude code 直接官方支持了 SSH support。 https://t.co/6s8rRRaDIO
#NewProfilePic 换个新头像,两年多以前年轻漂亮的自己。当然现在也年轻漂亮( https://t.co/k3JX9Fpvsw
https://t.co/YF4f1z9s0W
我的一个朋友婚姻不幸。初婚嫁了一个这边的华人来到欧洲,家暴她。 离婚后找了一个欧洲人,这个欧洲人个子不高,收入尚可,离异有一个孩子。 两个人婚后时常因为他前妻和孩子吵架,这个孩子明确对她说:这个家里只能有我一个小孩。 朋友先天就有一些妇科疾病,二人尝试过几次试管都以失败告终。结果去年年底跟我说自然怀上了。 她回中国待产,说等快生了再回欧洲。今日给她发消息祝新年快乐,她回复说她刨腹产下一个男孩,孩子不足七个月,在nicu里插管。 短短几个字,没有什么生育经验的我也能感受到其中分量。我问她她老公有没有去中国陪她,她说完全没有,那个人只是在纠结怎么样跟他儿子说这件事。 短短几个字,我都替她心疼。结婚、生孩子,真的都是要非常慎重的事,这几年看了太多人间悲剧,莫不是与这些残破的家庭有关。尽量一对夫妻走到老,后妈后爹不好当啊。

宝玉
推荐阅读:《万字解析 Manus 的 PMF 和 AI Agent 赛道竞争的稳态约束》 作者: “约尔 Yor” 作者问了一个问题:AI应用的数据都在暴涨,但怎么判断用户是真在用,还是只是在尝鲜围观? 作者给出的答案是:别看融资额和PR稿,去看Reddit和Discord上的真实吐槽。这些地方的用户样本偏早期adopter,语气不友好甚至充满抱怨,但恰恰因为他们真的拿AI去干活、为结果承担过现实成本,所以信息密度极高。 先说结论:Manus找到了自己的位置,而且很清晰。 【1】核心发现 Manus 到底解决了什么问题? 一句话:那些不做不行、自己做太累、雇人又不划算的商业杂活。 报税、填表、爬数据、做PPT、跑固定流程,这些任务的特征是输入输出明确、逻辑不复杂、但执行过程冗长琐碎。 Manus覆盖的正是这片结构性真空。 用户付费的四种动机: 1. 花钱换精力(认知代工) 2. 第一次做出原本不会的东西(能力解锁) 3. 比雇人便宜(成本替代) 4. 不想参与繁琐执行(托管) Manus 和 ChatGPT 不是替代关系,而是分工。 ChatGPT 是认知层产品,擅长想清楚;Manus 是执行层产品,负责跑出来。 很多用户先在 ChatGPT 打磨 prompt,再交给 Manus 执行,省积分。 【2】Manus 比 ChatGPT 强在哪 ChatGPT 是认知层产品,擅长对话、思考、解释。 Manus 是执行层产品,能在真实工作流里干活。 具体差异: - Manus 能交付完整调研报告而非只给建议; - 能直接处理 PDF、图片生成表格而非需要大量人工修正; - 能离线持续执行而非需要你盯着; - 能拿到系统权限直接操作服务器和代码仓库。 【3】谁在付费? 核心用户是 Freelancer、一人公司、小型工作室。他们对外售卖判断力,但缺少助理和运营。Manus 提供的是一种"低配组织形态",让个体拥有接近小团队的执行能力。 Manus提供的是一种低配组织形态,让个体拥有接近小团队的执行能力。 付费逻辑很直接:只要比雇人便宜、比自己做省时间,ROI 算得过账就行。 【4】Manus 的软肋? 积分焦虑。Agent 的价值来自交付结果,但计费发生在执行过程,成本和结果脱钩。 用户愿意为结果付钱,但不敢为过程放手。只要执行路径不确定、按 token 计费,就必然制造成本焦虑,抑制用户把更大任务交出去。 用户的积分焦虑本质是“执行不确定性”的定价问题。 【5】更大的问题:这一代AI争夺的稀缺资源是什么? 移动互联网争的是用户时间,AI争的是人类可被外包的经济效用总量:有多少真实工作、决策和表达,人类愿意授权给AI执行。 Token消耗量就像当年移动互联网时代的人均网络流量消耗,只说明为系统消耗了多少资源,不代表为现实世界创造了多少价值。 AI 产品在争夺三种份额: 1. 任务份额 2. 决策份额 3. 产出份额。 【6】终局形态? Manus 之外的机会在三个方向: 1. 深耕垂直领域的专业 Agent 2. AI 加人类服务的混合交付 3. 嵌入工作过程的 Copilot 终局可能不是一个超级智能体,决定天花板的,是谁能进入更高价值、更高责任、更高决策密度的任务结构。 链接:https://t.co/IrjkMFkkir
Est. 100 views for your reply