🔥 Search Hot Tweets
Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.
宝藏论文,虽然转过了,再转一次。 LLM的reasoning的epic failures,就像这几天大家转的50米洗车的案例,作为纯符号层的llm推理,论文中也首先提到要区分embodied和non-embodied,llm显然很难区分这一点,顾此失彼,让人走过去却忘了车! 论文的survey框架不错,不仅对于模型训练,对于如何搭建agent脚手架也有裨益。 一个会从错误中持续学习的agent会很可怕😱
CLI Agent + SSH 是我最多使用的 code agent 使用场景。几乎所有 CLI 动作都可以在 ssh session 中完成,只要有云,你几乎可以做任何事情,不受本地算力限制。 在 Opus 4.6 出来的时候,ssh 因为安全问题一度无法使用。 只过了两周,claude code 直接官方支持了 SSH support。 https://t.co/6s8rRRaDIO
#NewProfilePic 换个新头像,两年多以前年轻漂亮的自己。当然现在也年轻漂亮( https://t.co/k3JX9Fpvsw
https://t.co/YF4f1z9s0W
我的一个朋友婚姻不幸。初婚嫁了一个这边的华人来到欧洲,家暴她。 离婚后找了一个欧洲人,这个欧洲人个子不高,收入尚可,离异有一个孩子。 两个人婚后时常因为他前妻和孩子吵架,这个孩子明确对她说:这个家里只能有我一个小孩。 朋友先天就有一些妇科疾病,二人尝试过几次试管都以失败告终。结果去年年底跟我说自然怀上了。 她回中国待产,说等快生了再回欧洲。今日给她发消息祝新年快乐,她回复说她刨腹产下一个男孩,孩子不足七个月,在nicu里插管。 短短几个字,没有什么生育经验的我也能感受到其中分量。我问她她老公有没有去中国陪她,她说完全没有,那个人只是在纠结怎么样跟他儿子说这件事。 短短几个字,我都替她心疼。结婚、生孩子,真的都是要非常慎重的事,这几年看了太多人间悲剧,莫不是与这些残破的家庭有关。尽量一对夫妻走到老,后妈后爹不好当啊。

阿崔cxr
反馈来了!针对一个中小型的功能,我尝试了两种写法: 1. 第一种方式:先出一个 Plan,把所有代码都在 Plan 里面描述好,然后让 Kimi 去执行。结果就是 Plan 里的很多细节它没有遵守,实现出来也有很多 bug。 2. 第二种方法:采用 TDD(测试驱动开发)的方式,先写一个失败的测试,再写功能实现。 这种方式的核心在于,每一次执行的任务都足够小,所以在架构设计上我可以手动告知它调整方向。在这个场景下,Kimi 是可用的,因为任务拆得足够小,它的表现其实和 Opus 模型差不多。 所以现在的 Kimi 模型能用是能用,但只限于小任务。如果你面对的是偏大型的任务,我建议还是用 Opus,或者使用 TDD 的方式把大任务拆小,然后一步步去做。 综上所述,我会把 Kimi 作为一个日常解决一些小任务的工具去用。当然,针对大型项目或大型任务,还是有点离不开 Opus,但进步已经很明显了,最起码可以用了 (我是在 cc 中使用的 kimi, kimi cli 在使用的时候直接报错)
Est. 400 views for your reply