🔥 Search Hot Tweets
Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.
宝藏论文,虽然转过了,再转一次。 LLM的reasoning的epic failures,就像这几天大家转的50米洗车的案例,作为纯符号层的llm推理,论文中也首先提到要区分embodied和non-embodied,llm显然很难区分这一点,顾此失彼,让人走过去却忘了车! 论文的survey框架不错,不仅对于模型训练,对于如何搭建agent脚手架也有裨益。 一个会从错误中持续学习的agent会很可怕😱
CLI Agent + SSH 是我最多使用的 code agent 使用场景。几乎所有 CLI 动作都可以在 ssh session 中完成,只要有云,你几乎可以做任何事情,不受本地算力限制。 在 Opus 4.6 出来的时候,ssh 因为安全问题一度无法使用。 只过了两周,claude code 直接官方支持了 SSH support。 https://t.co/6s8rRRaDIO
#NewProfilePic 换个新头像,两年多以前年轻漂亮的自己。当然现在也年轻漂亮( https://t.co/k3JX9Fpvsw
https://t.co/YF4f1z9s0W
我的一个朋友婚姻不幸。初婚嫁了一个这边的华人来到欧洲,家暴她。 离婚后找了一个欧洲人,这个欧洲人个子不高,收入尚可,离异有一个孩子。 两个人婚后时常因为他前妻和孩子吵架,这个孩子明确对她说:这个家里只能有我一个小孩。 朋友先天就有一些妇科疾病,二人尝试过几次试管都以失败告终。结果去年年底跟我说自然怀上了。 她回中国待产,说等快生了再回欧洲。今日给她发消息祝新年快乐,她回复说她刨腹产下一个男孩,孩子不足七个月,在nicu里插管。 短短几个字,没有什么生育经验的我也能感受到其中分量。我问她她老公有没有去中国陪她,她说完全没有,那个人只是在纠结怎么样跟他儿子说这件事。 短短几个字,我都替她心疼。结婚、生孩子,真的都是要非常慎重的事,这几年看了太多人间悲剧,莫不是与这些残破的家庭有关。尽量一对夫妻走到老,后妈后爹不好当啊。

宝玉
主持人问 Clawdbot 创始人 Peter 对不同模型的看法。 Peter 说他的项目设计之初就支持所有模型,包括本地模型,因为这是一个探索和学习的试验田(playground)。 论个性,Opus 遥遥领先。 “我不知道他们拿什么数据训练的,是不是有很多 Reddit 帖子,但它在 Discord 里的表现太像人了。” 他给 AI 设计了一个“不回复”选项:如果不想说话,就输出一个特殊标记(token),消息不发送。 "所以它不会每条消息都回,而是听着对话,偶尔甩出一个神回复(banger),能把我逗笑。你知道 AI 的笑话通常有多烂吧。但 Opus 不一样。" 但论写代码,他更信任 OpenAI 的 Codex。 “Codex 处理大型代码库的能力更强。我经常写完提示词直接推送到主分支(main),95% 的情况它真的能跑。Claude Code 需要更多技巧,更多哄骗。” 他的总结:两个都好,但用 Codex 他能更快地并行任务,因为需要的"保姆式照看"(handholding)更少。
Est. 200 views for your reply