🔥 Search Hot Tweets

Discover fast-rising X posts through keyword search and intelligent analysis. Review high-potential tweets manually, or use Automated X Engagement in hot tweets mode so SoPilot can open tweets, generate quality comments, and save engagement history during the golden window.

We recommend installing the SoPilot plugin so comments or quote-post content can be generated automatically when opening X posts.

郭宇 guoyu.eth
180.1Kfo
郭宇 guoyu.eth@turingou· 4h ago发布

现代邮箱基本上只是一个域名和一堆 webhooks,对于主要邮箱我会用 codex 连接 Gmail MCP,对于每个产品或者业务的私人邮箱我都使用 mails 自动管理着,因为没必要给每个域名都申请一个 Google workspace(而且这会很贵)

22
1
1
11.0K
Data updated 22m ago
Velocity
2.5K/h
Surging
Viral Probability
49%
Predicted Views
31.0K
Est. 2.0K views for your reply
Berryxia.AI
44.6Kfo
Berryxia.AI@berryxia· 10h ago发布

周末窝在家里,花半小时学习它吧! 别光刷短视频, 看下Anthropic的上下文管理的视频! 2026年AI DevCon上,Anthropic的Lamis做了一场关于上下文工程的演讲。 整场演讲浓缩了过去一年Anthropic在上下文管理上的所有实践,从最简单的方案到最前沿的架构。 从Claude MD文件开始。 一个纯Markdown文件,放在会话开头,告诉Agent代码库结构、组织信息、个人偏好。 效果出奇地好:Anthropic的原话是"unreasonably effective"。(效果惊人出奇的好) 但问题也明显:文件越来越长,上下文膨胀,管理困难。 第二步是记忆工具。 让Agent自主决定何时读取、何时写入、何时更新记忆。全部在带内完成,也就是在会话上下文中进行。 Anthropic发现,在这种场景下,自主性运作得非常好。Agent比人类更擅长判断什么值得记住。 第三步是Skills。 核心思想是渐进式披露。 Agent只看文件顶部几行前言,决定是否需要加载整个文件。 Lamis的比喻很精准:就像房间里有一个书架,每次有人跟我说话,我扫一眼书单,看有没有相关书籍,然后取下来读。 不需要提前把所有知识塞进上下文。 第四步是文件系统。 把记忆系统建模为普通文件系统,用Markdown文件填充,Agent用bash和grep搜索。 不需要花哨的向量数据库,不需要专门的工具——Agent本来就擅长操作文件系统。 但当这些方案扩展到生产环境,问题就来了。 多个Agent同时写入同一个记忆文件怎么办。一个Agent写入错误信息到组织级上下文,所有Agent都会受影响。记忆过时了怎么办。 有人通过提示词注入向记忆中写入恶意内容怎么办。 Anthropic给出的解决方案是四个原则:版本控制(能回滚)、并发控制(哈希校验)、权限管理(组织级只读、个人级可写)、可移植性(干净的API,跨系统访问)。 然后是最有意思的部分:做梦。 带内记忆有一个根本性局限:Agent既要完成任务,又要管理记忆,这是两个竞争性目标。 而且Agent只能看到当前会话的信息,无法识别跨会话的模式。 做梦是一个带外的异步处理过程。 它取一段时间内的所有会话记录,交给一个专门的Agent分析。 这个Agent查看记忆存储,识别模式,提出更改建议。比如:所有地理学生都答错了同一个问题:说明课程中缺少了某个主题。 所有数学考试的答案都用弧度制而不是角度制,说明工具配置有问题。 做梦本质上是一个批量处理的"校长",审查所有"学生"的作业,发现问题,调整"课程"。 它有自己的专用资源,不和任务执行竞争上下文。 Anthropic已经在生产中运行这套系统。 他们发现:Agent第二次执行任务时做得更好,成本降低(因为能一次性完成),延迟下降。 做梦的额外token消耗被任务本身的效率提升抵消了。 最后Lamis说了一句话值得记住:上下文工程是过去一年才真正发展起来的领域。 模型智能本身不会产生复利:它需要上下文来执行你交给它的具体任务。 而上下文工程的效果是倍增智能,即使模型本身变得更聪明,这个投资依然有价值。

63
9
1
4.7K
Data updated 22m ago
Velocity
457/h
Normal
Viral Probability
49%
Predicted Views
10.0K
Est. 500 views for your reply
Balder
30.9Kfo
Balder@Balder13946731· 6h ago发布

OpenAI居然将自己最前沿的模型在 $CBRS 芯片上发行,推理速度达到了惊人的750 tokens/s 这就是为什么 $CBRS 在周五的时候逆着所有芯片股大涨的原因吗😳

35
1
13
13.6K
Data updated 22m ago
Velocity
2.3K/h
Surging
Viral Probability
53%
Predicted Views
39.0K
Est. 200 views for your reply
Art of Speculation
32.4Kfo
Art of Speculation@ArtofSpecuycky· 8h ago发布

All In Podcast最新一期,几位大佬怎么看美光、存储瓶颈、中国开源模型和分布式推理 这期All In Podcast信息量挺大的,挑几个我觉得最值得分享的话题整理了一下。 先说中国开源模型这条线,进展比想象中快 智谱AI发布了新一代Frontier级开源模型GLM 5.2,7440亿参数,100万token上下文,彻底走MIT开源协议。评测数据挺惊人:在软件工程编程基准测试里击败了GPT-5.5,距离Anthropic最顶级的Claude Opus 4.8也只差不到1%,但API价格比同等性能的美国模型便宜了整整85%。 节目里有个细节很有意思,说的是中国团队加速追赶的一种方法:用成千上万台手机和iPad组成设备农场,用加密账户向美国顶级Frontier模型的API高密度提问,把对方的推理链路收割下来,喂给自己的开源模型做强化训练。这相当于把美国实验室耗费巨资跑出来的��准答案当成小抄,用很低的成本实现接近的性能。 Sacks对此的态度挺尖锐,他批评Anthropic的Dario之前推动美国政府设立繁琐的安全审批流程,这种自我设限反而拖慢了美国自己的节奏。Fable模型因为越狱指控被迫下架,OpenAI的新模型审批也很难产。他的判断是中国模型目前技术上落后大概9个月,芯片上落后大概24个月,但已经全线用华为昇腾这类本土芯片完成了GLM5家族的训练,未来这些针对本土芯片优化、便宜好用的"AI盒子"很可能会被低价倾销到全球市场,而美国自己却在设各种限制,反而把这个万亿级出口市场让出去了。 美光这次的财报,节目里给出了一个精准的定位:DRAM才是整个AI浪潮真正的卡脖子环节 美光这季度营收同比暴增四倍,从90亿飙升到420亿,指引远超预期,2026年的HBM产能早就全部售罄。 节目里有个观点说得挺直白:之前大家在推特上找各种日本小辅材公司当作"瓶颈股",但真正的命脉只有DRAM,尤其是HBM。原因很简单,内存的带宽和容量决定了所有大模型推理性能的物理天花板,这是个硬约束,绕不过去。甚至提到马斯克正在建设的超级工厂,技术核心也是对准DRAM,不是光纤、电源或者NAND闪存。 美光这次商业模式上也做了一个挺有意思的变化:跟核心云厂商签了带有"价格下限与上限"保护的长期供应协议,锁定了50%的未来营收。这意味着即便未来行业周期下行,最低合同保价也比过去任何一轮周期的毛利峰值还高。 进入壁垒这块,虽然中国的长鑫存储在筹备上市,未来可能会用低价中低端消费级内存缓解苹果这类大厂的成本压力,但在AI服务器需要的顶级HBM领域,全球目前还是只有美光、SK海力士、三星这三家能生产,工艺难度极高,不是短期能被追上的。 节目里给了一个挺夸张的预测:明年全球超大规模资本开支里,会有30%到40%直接流向DRAM芯片厂商。这种成本飙升已经导致苹果全线提高了MacBook和Mac Studio的零���价。 边缘计算和分布式推理这部分,是这期里最有想象力的内容,分享几个我觉得有意思的设想 特斯拉6月18日申请了一个叫"Megapod"的硬件商标。背后的物理逻辑是:在地面建一个1吉瓦的数据中心,土地、能耗、液冷的审批流程极其漫长。Megapod的设想是把GPU、电池网络和冷却系统集成进一个集装箱式的模块化数据中心,直接空降在已经获批、有现成电网和空闲土地的特斯拉超级充电站网络里,绕开传统数据中心建设最大的瓶颈——审批和电力接入。 分布式推理这条线的逻辑也挺有意思:模型回答问题可以拆成两个阶段,理解问题的Prefill阶段和高带宽高内存消耗的Decode阶段。大资金可以收购折旧的旧显卡,前端外挂专门做解码优化的芯片,组成成本更低的分布式推理网络。 更疯狂一点的设想是,未来给买家用储能电池Powerwall的用户提供折扣,强制在每个电池里内置AI芯片,再配合Starlink卫星连接,电池闲置的时候自动组成一个庞大的分布式P2P推理池,获得源源不断几乎免费的离岸算力。这个设想如果真的实现,对传统云大厂会是一次降维打击。 最疯狂的部分是太空算力。地面建1吉瓦数据中心需要350亿美元芯片成本加250亿美元冷却人工成本,还面临各种用地争议。但随着SpaceX的星舰实现完全可重复使用,把1吉瓦算力通过激光互联发射到太空轨道的成本可能暴降到只要50亿美元。太空天然的严寒环境和近乎无限的太阳能,可能让太空数据中心的运营经济学在3到4年内反超地表数据中心。

106
12
13
13.3K
Data updated 22m ago
Velocity
1.7K/h
Surging
Viral Probability
59%
Predicted Views
41.0K
Est. 200 views for your reply
FUJIIDERA
57.7Kfo
FUJIIDERA@FreedomFujii· 10h ago发布

成本大概两百多点吧。主要是为了测试性爱镜头所以前期没什么剧情。(大家可以评论构想一下可以有怎样的剧情桥段的引入到两人的做爱过程中) Seedance产出总体还可以,也是要抽卡以及重新构图,在他给出的不合格的素材里选取到可用的部分。但我对自己设计的做爱戏份的镜头组接很满意😀欢迎同好讨论交流 https://t.co/1bUDc6fjK4

33
5
3
4.9K
Data updated 52m ago
Velocity
522/h
Normal
Viral Probability
43%
Predicted Views
10.0K
Est. 500 views for your reply
OōEli.eth
82.8Kfo
OōEli.eth@ooeli_eth· 8h ago发布

阿里巴巴的股价今年跌得真狠! 年内跌幅超39%, 并且RSI创上市以来最低,进入严重超卖区间, 目前股价回到12年前上市初的水平, 总市值只有台积电的十分之一。 原因方面, AI投入巨大,但是市场份额明显落后于豆包等竞争对手, 近期被美国国防部列入所谓”中国军方关联企业”名单, 加上又被Anthropic指控动用几万假帐号窃取Claude AI模型能力。 在传统强项电商方面,价格战愈发激烈,市场份额不断被对手蚕食, 大量失败收购案例以及不断地人才流失, 让这颗中国互联网巨星,12年如一梦。

59
3
23
23.8K
Data updated 52m ago
Velocity
3.2K/h
Surging
Viral Probability
53%
Predicted Views
93.0K
Est. 300 views for your reply
RamenPanda
87.5Kfo
RamenPanda@IamRamenPanda· 9h ago发布

GPT 5.6和智谱GLM 5.2使用成本一样 中美AI大模型价格战开打了!!

23
1
4
10.9K
Data updated 1h ago
Velocity
1.3K/h
Surging
Viral Probability
51%
Predicted Views
15.0K
Est. 400 views for your reply
Larus Canus
30.1Kfo
Larus Canus@MrLarus· 11h ago发布

📸用 GPT-Image2 实现写真自由:POV 古风夜游抓拍! 高机位第一视角构图,古风夜游系列✨ 1、递一盏花灯 2、雨夜共撑油纸伞 3、轻轻拉住衣袖 4、把披风披到她肩上 灯笼、雨巷、青石板、近距离互动,再加上她抬眼看镜头的那一瞬间~ 不像普通古风写真,更像一段正在发生的故事! 提示词在评论区👇 https://t.co/WxF7yLvpEe

93
7
4
8.8K
Data updated 1h ago
Velocity
886/h
Normal
Viral Probability
53%
Predicted Views
12.0K
Est. 300 views for your reply
宝玉
228.5Kfo
宝玉@dotey· 11h ago发布

6 月 26 日,OpenAI 正式从 ChatGPT 中移除了 GPT-4.5。这是 GPT-4 系列在 ChatGPT 里的最后一个模型,至此,GPT-4 时代在消费端彻底翻篇。 我觉得 GPT-4.5 至今仍是最好的写作模型之一,GPT-5 系列在文风和个性上始终没能达到 GPT-4.5 的水准。 GPT-4.5 原本就只对付费用户开放,使用量不大,所以 OpenAI 只给了 30 天的过渡期(5 月 28 日公告,6 月 26 日下线)。已有的 GPT-4.5 对话会自动切换到 GPT-5.5 继续,用户不需要手动操作。基于 GPT-4.5 搭建的自定义 GPT 也将同步失效,创建者需要手动迁移到新模型。 API 端不受影响,开发者仍然可以通过 API 调用 GPT-4.5。 回头看,GPT-4 系列的退场过程颇为曲折。去年 GPT-5 发布时,OpenAI 原本打算同步下线 GPT-4o,结果引发大规模用户抗议,不少人把 GPT-4o 当成了有温度的陪伴者,对下线反应激烈到 OpenAI 不得不临时恢复。最终 GPT-4o 在今年 2 月才正式退役,OpenAI 当时透露日活用户中仅 0.1% 仍在选用它,但按 8 亿周活用户的基数算,这仍然意味着约 80 万人。 下一个要走的是 o3,8 月 26 日下线,过渡期 90 天。

59
0
14
22.6K
Data updated 3h ago
Velocity
2.9K/h
Surging
Viral Probability
53%
Predicted Views
95.0K
Est. 500 views for your reply
宝玉
228.5Kfo
宝玉@dotey· 11h ago发布

现在 Codex/Claude Code 的上下文压缩确实做的挺好了,加上 Prompt Caching,一个 Session 内持续聊没那么大成本压力了。我现在也越来越多的在一个会话内继续任务。 另外还有两个配套功能是很好的: 1. fork,就是从某一个对话位置开分支,只保留该对话前面的历史记录,让上下文更纯粹 2. /btw或者/side,在当前会话中提问,通常用于你想起来一件跟当前任务关系不大的事,没必要加入当前上下文中。 比如说使用 plan 模式时,你要回答一堆问题,但是这些问题选项说的不是很清楚你也不知道该选什么,这时候最适合用 /btw 让详细解释一下每个选项的意思,甚至还可以让它给你建议。

97
14
16
19.6K
Data updated 3h ago
Velocity
2.5K/h
Surging
Viral Probability
60%
Predicted Views
87.0K
Est. 400 views for your reply