SoPilotSoPilot

🔥 Search Hot Tweets

Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.

Real-time Hot Tweet Analysis

Susan STEM
41.3Kfo
Susan STEM@feltanimalworld· 5h ago发布

年轻人面对最糟糕的社会情况,最佳的选择反而是回归保守。 该结婚就结婚,该生孩子就生孩子。 这件事情发生过无数次,在好的年代,坏的年代。而且以现在的工业化发展程度,已经算历史高点了。并不会发生真正的社会灾害。 转机说不定在哪一天就来了。不要相信你身边想拖你下水,把你变得radical的人。这种感觉就好比你身边那个一直跟你说“男人都不是好东西”的闺蜜,55岁那一天你突然发现她其实父慈子孝,在家里什么都有,贤惠的不得了。

69
8
12
13.4K
Data updated 5m ago
Viral Probability
64%
Predicted Views
47.0K
Est. 300 views for your reply
勒西
9.3Kfo
勒西@LexiCoding· 5h ago发布

贫穷,真的能限制一个人。 🇨🇦加拿大 20 岁小姐姐中了一百万加币彩票。 结果,她选择每星期支付 1000 加币的领奖方式。

44
2
37
14.7K
Data updated 5m ago
Viral Probability
59%
Predicted Views
43.0K
Est. 100 views for your reply
徐冲浪
120.9Kfo
徐冲浪@cyrilxuq· 6h ago发布

我发现在人中下面那个器官里,放入麦辣鸡腿堡会很舒服

24
1
7
7.2K
Data updated 5m ago
Viral Probability
56%
Predicted Views
17.0K
Est. 100 views for your reply
dontbesilent
58.1Kfo
dontbesilent@dontbesilent12· 7h ago发布

最近发票报销的问题搞得非常混乱 负责税务规划的人不适合干这么打杂的事儿 代理记账的人又过于打杂了,处理不了上百张发票的归纳分类 差点要雇个大学生来对接了,偶然发现千问官网的 VL 模型,上传文件似乎是没有数量限制的,出奇地好用 Openrouter 的 Qwen3-VL 一次只能上传 8 个文件,Qwen 官网的可以一次处理几十个 PDF 一句 prompt 直接就把发票表格做好了,又少雇一个人😄

20
5
3
2.8K
Data updated 5m ago
Viral Probability
60%
Predicted Views
6.0K
Est. 300 views for your reply
勒西
9.3Kfo
勒西@LexiCoding· 7h ago发布

今天听肉唐僧的节目后,忽然理解了,纽约为什么会选一个社会主义穆斯林市长。 👉相较于穷,现在的年轻人,更害怕卷。 卷的问题不在于吃苦。卷,是一眼望不到边的苦海,一种无法逃脱的绝望。这已经超越了个人努力的极限。 此时,年轻人就会自然而然的,需要一个超越人类能力的解决方案。 就像保健品一样,这种需求,只有社会主义者,只有骗子,才能满足。

29
3
4
16.2K
Data updated 5m ago
Viral Probability
57%
Predicted Views
48.0K
Est. 3.2K views for your reply
Yangyi

Yangyi

@Yangyixxxx· 109.7K followers

这事儿有点意思… 50 位来自字节、阿里、腾讯等机构的 AI 研究员,联合发布了一份 300 页的论文,里面有些关于代码模型和 Agent 的结论,挺出人意料。 关键点: > 小模型也能打败大厂的专有模型 RL(特别是 RLVR)让小开源模型在推理方面超越大模型。 一个用 RLVR 在高质量验证问题上训练的 14B 模型,可以匹敌 OpenAI 的 o3。 > 模型学 Python 有点吃力 预训练时混合语言模型是好事,但 Python 和静态类型语言不太一样。 语法相似的语言(Java 和 C#,或者 JavaScript 和 TypeScript)能产生很好的协同效应。 如果把 Python 大量混入静态类型语言的训练中,反而可能因为 Python 的动态类型而适得其反。 > 语言之间有差异(代码 Scaling Laws) 让模型精通一门语言所需的数据量,很大程度上取决于这门语言本身。 论文认为 C# 和 Java 更容易学习(所需训练数据更少)。 Python 和 JavaScript 实际上更难学,有点讽刺(但你会发现 AI 最常被用于这些语言 😂)。 > MoE vs Dense(能力 vs 稳定性) MoE 模型容量更大,但在 SFT 期间比 Dense 模型更脆弱。 训练中的超参数对 MoE 模型的影响更大,而 Dense 模型更稳定。 MoE 模型还需要持续调整学习率,以避免路由不稳定。 > 代码模型默认是「不安全」的 在公共代码库上训练,会让模型学习到多年积累的不安全编码模式。 安全微调通常效果不佳。 模型可能拒绝写仇恨言论邮件,但会很乐意生成一个存在 SQL 注入漏洞的函数,因为它「能用」。 > 结构比内容更重要 在 CoT 微调中,模板和逐步推理模式比推理的事实性更重要! 模型实际上学习的是分解问题的「认知模板」。 为推理创建合成训练数据时,逐步结构(「如何做」)比确保每个中间事实都完美更重要。 > 「Lost in the middle」问题仍然存在 新模型支持更大的上下文,但当重要代码位于 Prompt(或上下文)中间而不是开头或结尾时,准确性仍然会下降。 > 多 Agent 辩论减少幻觉 对于复杂的软件工程任务来说,这明显更好。 我认为设置辩论非常关键,如果调整不当,甚至可能导致 Agent 强化幻觉。 > 代码安全上的「对齐税」 对齐可能会降低一般的编码能力。 论文实际上提出了一种解决方案,以减轻这种税收的方式进行对齐。 想了解更多细节,可以阅读完整论文。 https://t.co/sXyz0sBiEI

147
37
4
12.6K
Posted 9d ago · Data updated 9d ago
Reply Suggestion

Est. 3.8K views for your reply