🔥 Search Hot Tweets
Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.
宝藏论文,虽然转过了,再转一次。 LLM的reasoning的epic failures,就像这几天大家转的50米洗车的案例,作为纯符号层的llm推理,论文中也首先提到要区分embodied和non-embodied,llm显然很难区分这一点,顾此失彼,让人走过去却忘了车! 论文的survey框架不错,不仅对于模型训练,对于如何搭建agent脚手架也有裨益。 一个会从错误中持续学习的agent会很可怕😱
CLI Agent + SSH 是我最多使用的 code agent 使用场景。几乎所有 CLI 动作都可以在 ssh session 中完成,只要有云,你几乎可以做任何事情,不受本地算力限制。 在 Opus 4.6 出来的时候,ssh 因为安全问题一度无法使用。 只过了两周,claude code 直接官方支持了 SSH support。 https://t.co/6s8rRRaDIO
#NewProfilePic 换个新头像,两年多以前年轻漂亮的自己。当然现在也年轻漂亮( https://t.co/k3JX9Fpvsw
https://t.co/YF4f1z9s0W
我的一个朋友婚姻不幸。初婚嫁了一个这边的华人来到欧洲,家暴她。 离婚后找了一个欧洲人,这个欧洲人个子不高,收入尚可,离异有一个孩子。 两个人婚后时常因为他前妻和孩子吵架,这个孩子明确对她说:这个家里只能有我一个小孩。 朋友先天就有一些妇科疾病,二人尝试过几次试管都以失败告终。结果去年年底跟我说自然怀上了。 她回中国待产,说等快生了再回欧洲。今日给她发消息祝新年快乐,她回复说她刨腹产下一个男孩,孩子不足七个月,在nicu里插管。 短短几个字,没有什么生育经验的我也能感受到其中分量。我问她她老公有没有去中国陪她,她说完全没有,那个人只是在纠结怎么样跟他儿子说这件事。 短短几个字,我都替她心疼。结婚、生孩子,真的都是要非常慎重的事,这几年看了太多人间悲剧,莫不是与这些残破的家庭有关。尽量一对夫妻走到老,后妈后爹不好当啊。

Kai
在传统软件开发流程中,也就是本科的软件工程的方法论中,从另一个角度理解,其可以看作是一套面向“老板”的流程,也就是如何让 老板不需要看细节的代码实现就能够了解整个软件的架构,就能知道整体开发的大方向是没错的,也可以有信心的交付出去 传统软件开发流程不是糟粕,是一套行之有效的“军事化”开发流程,只是碳基生物的效率和耐心太差了,所以才会抱怨整个过程中 “效率慢、文档多、费时费力”,但如果换成廉价的硅基 token 呢? 人类可以看着整个 agent 集群按照传统软件开发流程产出高质量的文档和代码,人类不需要深入代码去思考每一行的对错,只需要分析文档上的架构是否符合预期即可。 至于细节实现中的小 bug,无伤大雅,甚至 bug 率可能比人类低。 当然,估计是很难整体照搬传统软件开发流程,需要针对 agent 场景做修改和定制
Est. 300 views for your reply