🔥 Search Hot Tweets
Discover fast-rising X posts through keyword search and intelligent analysis. Review high-potential tweets manually, or use Automated X Engagement in hot tweets mode so SoPilot can open tweets, generate quality comments, and save engagement history during the golden window.
We recommend installing the SoPilot plugin so comments or quote-post content can be generated automatically when opening X posts.
我倒是觉得,刷算法题写简单代码这个能力已经没啥意义了。退化为查统计分布表,手算对数开根号性质的零成本能力。要是上手干活,也许考察一下 30 分钟能不能拉起一台虚拟机配置好 Linux 远程环境设置好 Codex 更直接。
大A确实不能算是充分市场,它的宏观调控和主动的翻译是很强的。 这波对基金的强制约束甚至约谈,背后直接带来了相关龙头的持续降温,从豆包和DeepSeek给的数据可以看出来,很多市值到现在已经有了很大的回调。基金经理为了保证业绩,同时又能表现得很听话,已经在5月底就开始逐渐寻找新的标的了。 不管美股怎么疯狂,大A应该是要转向的。拭目以待,顺势而为。
看到一位网友的 Gentle-AI 配置:串联 11 个不同职能的智能体,用低成本 Flash 模型处理大部分上下文,只在设计(Qwen)、编码(Kimi Code)等关键环节调用高性能模型。这样每日成本控制在 4~7 美元,同时通过多智能体对齐审查显著降低幻觉率。 这就是 Gentle-AI 的 per-phase model routing:不同阶段匹配最适合的模型,而不是全程依赖单一模型。 一个用 Go 编写的 AI 编程助手生态配置器,可为 Claude Code、OpenCode、Cursor、Copilot、Gemini CLI 等 15 种工具一键接入持久记忆、SDD 工作流、技能库、MCP 服务、AI 供应商切换和教学型人格。 https://t.co/qwLkhsDBWG
谷歌现在正在限制 Meta 使用 Gemini 的规模。 “谷歌大约在 3 月告诉 Meta,无法提供 Meta 想购买的全部 Gemini 算力/容量。” “知情人士称,Meta 受到的影响尤其大,因为它对谷歌模型的需求异常高。”
Om Malik 去世了。 让 Codex 下载他个人网站上 4800 多篇文章,用 deepseek-v4-flash 翻译成中文,做成中英对照版本离线保存。 硅谷 OG 老科技媒体人一生的公开文字创作,全部翻译��共 ¥13.13,一个月前充给梁圣的 ¥50 现在还没花完。 这速度和质量,大学英语翻译专业一半以上的意义不存在了。 https://t.co/ygte6TyjhZ
Deepseek 的官方 V4 API 有没有在用氮气加速 DSpark,看��一个说法是上线两周就开始用了。 https://t.co/5ewLhv2rjr
还没体验过 Pi 或 Craft agent 的朋友,建议现在就去试一次。你会立刻明白我上个月说那句话时是什么心情。 我之前就讲过:未来程序员不再主要“做需求”,而是“做 agent”。agent 用来把你的能力蒸馏出来:你只要把需求说清楚,剩下的交给它完成。 如果你要研究怎么做一个 code agent,别从 0 开始,直接从 Pi agent 起步。它的可扩展性很好,集成进现有业务会省掉大量时间。 如果你要研究怎么做一个类似 codex desktop 的产品,那就从 Craft agent 入手。它基于 Pi agent 和 Claude agent,功能完整、覆盖面也足。 觉得复杂也没关系:能裁就裁。Claude agent sdk、messaging-gateway 这些都可以精简掉,留下的就是实打实的核心能力。 我已经基于它二开了一个新产品,叫 Echo,接入了技能市场,流程非常顺滑。它现在就是我的独立开发搭子,后续开发、运营我都在它上面跑。
硬着头皮学习了一下文峰的 Dspark,结合杰富瑞对存储涨价预期 200% 的逻辑,得出个结论,给存储紧缺带来火上浇油,文峰丧心病狂!!! 大模型生成文字,正常是一个字一个字往外蹦。每蹦一个字,GPU就要把前面所有历史记录翻一遍。但翻完之后实际计算量极小,GPU的算力99%在干等。卡点不是脑子不够用,是翻书的速度跟不上。 DSpark的思路就是:让一个小模型先写5个字的草稿,大模型一次性审完。原来审1个字的时间,现在审5个。效率直接拉满。 效果很猛,DeepSeek自己的V4-Flash速度提升60到85%,V4-Pro提升57到78%。高并发场景下名义吞吐优势甚至达到661%。这确实是个好东西。 DSpark 为什么反而可能让存储更紧张,这个反直觉,但道理很简单。推理变快变便宜了,原来用不起AI的场景现在全上了。就像外卖补贴一降,订单量直接爆。 推理需求暴增→GPU买更多→HBM要更多→三大厂把更多产线给HBM→普通内存产能更少→涨更多。 还有个细节:DSpark要加载一个小模型写草稿,这个草稿模型本身就占显存。等于效率上去了,显存胃口也更大了。DeepSeek融资 74 亿美金,疯狂招人和扩建推理算力集群,然后再开源DSpark 反而某种意义上是为了让自家服务更快更便宜,从来从大模型端把价格打到地板,让 ai 赋能到更多场景。 所以逻辑链条是这样的:AI需求暴增→HBM需求暴增→HBM挤占DRAM晶圆→DRAM涨价。 所以DSpark反而可能让存储更紧张!
Codex app迎来大量更新⬇️ 1⃣处理超长线程任务更加流畅。 2⃣悬停式导航栏,可预览并快速跳转,实测体验很丝滑。 3⃣搜索覆盖了更多控制项和筛选,外观更清晰,也更易于查找。 4⃣UI缩放更改时不再导致工具提示、对话框、菜单、选择气泡、拖拽预览或自动补全出现错位。 4⃣复制到 Slack 时将保留 Markdown 格式,如列表、加粗、代码和链接;此外,粘贴大段文本时不再会导致界面卡死。 5⃣ 最后的彩蛋:专门的宠物面板。
我是不是最迟把Codex接入微信里面的人。。。 1.本机安装并启动 OpenClaw Gateway 地址是 http://127.0.0.1:18789/,作为微信和 Codex 之间的中转。 2.安装微信插件 安装 @tencent-weixin/openclaw-weixin(用图四的那串可以复制的提示词,扔给Codex),然后用微信扫码绑定。第一次扫错号,后来重新扫码,只保留了新账号。 3.安装 Codex 插件 安装 @openclaw/codex,让 OpenClaw 可以调用 (直接让Codex安装)Codex runtime。 4.登录 OpenAI/Codex 通过 OpenClaw 的 OAuth 流程登录你的 OpenAI/Codex 账号。 5.切默认模型 把默认模型从 DeepSeek 切到:openai/gpt-5.5 6.并显式指定: https://t.co/VfyG8uIXcm = codex 7.调高智力档位 把默认 thinking 调成: xhigh 8.重启 Gateway 并验证 确认微信通道正常、模型是 GPT-5.5、Runtime 是 OpenAI Codex。 然后我就能够随时调用我开机的Mac,再加上https://t.co/vdKPrHBuAa 就能随时随地在手机微信里面解析聊天记录。 再掉用各种社媒解析Skill搜集选题和素材等等。。。
跟Codex一起工作,可以学习到新知识,大家知道webp文件大小很小,很多网站都开始用webp。我的一个老网站我也改造成了webp。但是我们现在拍摄的照片很多都很大,直接上传的时候一个照片可能就超越了php默认的上传限制。这个不难改,但是我记不住,就跟Codex说,让它改。但是它给了另外一个方案,说可以在浏览器端做一个转换操作,本来5M的图片,直接被修改成了webp,然后上传,这样看似只是客户端压缩和服务器压缩的区别。但是流量省了好多,我之前都没听说现在浏览器还可以做这个操作。嗯,学会了
22岁小伙两天逆推Anthropic黑箱!Claude Mythos架构彻底开源曝光🔥 Anthropic放出史上最危险AI—Claude Mythos,能自主挖出操作系统和浏览器里藏了20多年的零日漏洞,只在Project Glasswing里给40家顶级机构内测,普通人完全摸不到。 结果?22岁高中辍学生Kye Gomez(Swarms创始人)只用几天时间,就把Mythos核心架构从���开论文里逆向出来,直接开源! 项目 OpenMythos GitHub已冲破1.4万+ Star,纯PyTorch实现,几行代码就能本地跑。 核心黑科技 采用 Recurrent-Depth Transformer(循环深度Transformer) 同一套权重循环运行多次(最高64次),所有思考在隐空间无声完成 Prelude(前奏)→ Recurrent Loop(循环块)→ Coda(尾声)三段式结构 支持MoE + MLA/GQA注意力(借鉴DeepSeek) 770M参数 ≈ 1.3B传统模型,参数减半,性能不减! 去Fork学习,下一个改变AI格局的,可能就是你!
PRD 实现对比 GLM-5.2 vs GPT-5.5 Loop 测试 输入:相对简略的 PRD,功能粒度较粗,PRD和提示词见回复 结论: GPT-5.5:不可用,懒惰,大量未实现功能和罗列性质的页面设计。建议 Human-in-loop 生成详细功能点后再执行。 GLM-5.2:还不错,一次可用只需要微调,有点用Opus的感觉。
参加过几场 AI Hackathon 了,昨天 Google 那场体验是最差的一次。 首先是插座根本不够,就墙脚那几个排查,大家都在角落抢充电。 然后没个正经的桌子,用椅子自带的小桌板,放个鼠标都费劲。 我跟小伙伴基本上都是坐在地上。 然后就是token,人人都在报怨不够用,我们因为本身就不喜欢gemini那个马屁精的智商,担心被它浪费时间,全程都是在用自己的API。 我看了下,后面大家基本上都是在用cc或者codex了。 最难受的是 Demo 评审环节。 明明规则写着每组只有 3 分钟,结果前面的队伍一个接一个超时,主办方也没人控时。甚至有些团队讲着讲着,才发现没给人家开麦克风。各种事故叠加,导致最后时间不够了,后面的队伍项目根本没机会展示。 于是因为时间不够,干脆连正常评审都没有,直接中断,然后告诉大家所有项目交给 AI 来评审? 输赢无所谓,本来大家也是去玩的,但感觉就是太糊弄人了。体验极其糟糕。
现代邮箱基本上只是一个域名和一堆 webhooks,对于主要邮箱我会用 codex 连接 Gmail MCP,对于每个产品或者业务的私人邮箱我都使用 mails 自动管理着,因为没必要给每个域名都申请一个 Google workspace(而且这会很贵)
GPT 5.6启用新命名体系,Sol太阳,Terra地球,Luna月球。 但很奇怪的是,美国政府对GPT 5.6全系列模型都进行了出口管制,包括小杯模型。很难理解连GPT 5.4 mini这样级别的模型都不能公开发布。
codex国内使用方法在国内使用 Codex,由于网络环境限制,通常需要借助第三方工具配置国内的大模型服务。 以下是具体步骤: 1.下载并安装必要软件Codex:前往OpenAI官方页面(https://t.co/n0kEuDy8mG)下载适用于Windows或macOS的官方桌面应用。 CCSwitch:从https://t.co/WT4fEisX0Q(https://t.co/h22JJeI46c)下载并安装3.16!1及以上版本,这是一个用于路由AI请求的本地代理工具。 2.获取国内大模型APIKey选择一个国内AI服务提供商(如DeepSeek(https://t.co/s3REd0WGfX)、智谱AI(https://t.co/ELNGbfuoIy)等),注册并完成实名认证。在提供商的控制台创建APIKey,并完成最低充值(通常几元即可满足初期体验需求)。 3.配置CCSwitch打开CCSwitch,在左侧选中“GPT”,点击右侧“+”号添加供应商。选择你注册的大模型提供商(如DeepSeek),将获取的APIKey填入对应字段。 进入CCSwitch的“设置”→“路由”页面,开启“本地路由”总开关,并勾选“Codex”。 4.启动并使用Codex完成上述配置后,退出并重新打开Codex。Codex的请求会通过CCSwitch转发到你配置的国内大模型,即可正常使用。
AI 时代最值得关注的 5 大卡脖子赛道: 一、内存:AI 的粮仓 1. 美光 Micron $MU AI 服务器最缺的就是高带宽内存(HBM)。随着 GPU 数量不断增加,每一块 GPU 都需要更多、更快的内存。 2. 三星 Samsung $005930 全球最大的存储芯片制造商之一,拥有完整的 DRAM、HBM、NAND 产品线,AI 数据中心扩张将持续带动存储需求增长。 3. SK 海力士 SK hynix $SKHY 目前全球 HBM 龙头之一,是 NVIDIA 最重要的 HBM 供应商之一,几乎站在 AI 内存产业链最核心的位置。 二、连接:AI 的高速公路 1. 博通 Broadcom $AVGO AI GPU 越多,服务器之间的数据交换越重要。博通几乎是高速交换芯片和网络连接的绝对龙头,也是 AI 基础设施最核心的受益者之一。 2. Marvell $MRVL 高速网络、光通信、自定义 AI 芯片布局全面,深度受益于 AI 数据中心升级。 3. Astera Labs $ALAB 专注 AI 服务器互连芯片,帮助 GPU、CPU、高速内存之间实现更高效率的数据传输,是 AI 新贵之一。 4. Credo Technology $CRDO 高速 SerDes 和网络连接芯片龙头,随着 AI 集群规模不断扩大,需求持续增长。 5. Applied Optoelectronics $AAOI 提供高速光模块,是 AI 数据中心光通信的重要供应商之一。 6. Arista Networks $ANET 全球领先的数据中心交换机公司,大型 AI 集群建设几乎都离不开它,持续受益于 AI 网络升级。 三、电力:AI 最容易忽略的瓶颈 1. Constellation Energy $CEG 美国最大的核电运营商之一。AI 数据中心耗电量暴涨,稳定电力成为最稀缺资源。 2. Vistra $VST 拥有天然气、核电等多元发电资产,是 AI 电力需求增长的重要受益者。 3. GE Vernova $GEV 提供发电设备、电网和能源基础设施,是全球能源升级的重要参与者。 4. Flex Ltd. $FLEX 全球电子制造龙头,为数据中心、电源及基础设施提供制造能力,受益于 AI 硬件投资扩张。 5. Vertiv $VRT AI 数据中心电源、散热、供电系统龙头,没有稳定供电和散热,再强的 GPU 也无法持续运行。 6. Navitas Semiconductor $NVTS 专注第三代半导体 GaN、SiC 电源芯片,帮助 AI 数据中心实现更高能效。 7. Talen Energy $TLN 拥有丰富电力资产,并积极布局数据中心供电业务,是 AI 电力概念的重要公司。 8. 安森美 ON Semiconductor $ON 功率半导体龙头,产品广泛应用于服务器、电源管理及能源基础设施。 四、计算:AI 算力工厂 1. Nebius Group $NBIS 专注 AI 云计算平台,为企业提供 GPU 算力服务,是 AI 基础设施的新兴玩家。 2. Cipher Mining $CIFR 利用现有能源和基础设施,从比特币挖矿逐步向 AI 算力业务延伸。 3. IREN $IREN 拥有大量低成本绿色能源,持续建设 AI 数据中心和 GPU 算力平台。 4. Applied Digital $APLD 建设大型 AI 数据中心,为超大规模 GPU 集群提供托管服务。 5. TeraWulf $WULF 依托低成本核电资源发展 AI 数据中心,电力优势明显。 6. Core Scientific $CORZ 北美最大的算力基础设施公司之一,持续转型 AI HPC 数据中心。 7. CoreWeave $CRWV AI 云计算明星企业,为 OpenAI、微软等客户提供 GPU 云服务,是 AI 算力需求爆发的重要受益者。 五、CPU:AI 的大脑 1. 英伟达 NVIDIA $NVDA 目前全球 AI 芯片绝对龙头,从 GPU 到网络、软件生态几乎全面领先。 2. 超威半导体 AMD $AMD 持续推出 AI GPU 和服务器 CPU,不断抢占数据中心市场份额,是 NVIDIA 最重要的竞争者之一。 3. 英特尔 Intel $INTC 拥有庞大的 CPU 市场基础,正在推进 AI 芯片和先进制造布局,未来仍具反转潜力。 4. Arm $ARM 全球 CPU 架构领导者,从手机到 AI 数据中心都在加速采用 Arm 架构,长期成长空间巨大。 5. 高通 Qualcomm $QCOM 积极布局 AI PC、边缘 AI 和终端 AI 芯片,未来 AI 将越来越多在设备端运行,高通有望持续受益。 掌握内存、连接、电力、计算、CPU五大卡脖子环节,才是长期核心资产!
OpenAI居然将自己最前沿的模型在 $CBRS 芯片上发行,推理速度达到了惊人的750 tokens/s 这就是为什么 $CBRS 在周五的时候逆着所有芯片股大涨的原因吗😳
周末窝在家里,花半小时学习它吧! 别光刷短视频, 看下Anthropic的上下文管理的视频! 2026年AI DevCon上,Anthropic的Lamis做了一场关于上下文工程的演讲。 整场演讲浓缩了过去一年Anthropic在上下文管理上的所有实践,从最简单的方案到最前沿的架构。 从Claude MD文件开始。 一个纯Markdown文件,放在会话开头,告诉Agent代码库结构、组织信息、个人偏好。 效果出奇地好:Anthropic的原话是"unreasonably effective"。(效果惊人出奇的好) 但问题也明显:文件越来越长,上下文膨胀,管理困难。 第二步是记忆工具。 让Agent自主决定何时读取、何时写入、何时更新记忆。全部在带内完成,也就是在会话上下文中进行。 Anthropic发现,在这种场景下,自主性运作得非常好。Agent比人类更擅长判断什么值得记住。 第三步是Skills。 核心思想是渐进式披露。 Agent只看文件顶部几行前言,决定是否需要加载整个文件。 Lamis的比喻很精准:就像房间里有一个书架,每次有人跟我说话,我扫一眼书单,看有没有相关书籍,然后取下来读。 不需要提前把所有知识塞进上下文。 第四步是文件系统。 把记忆系统建模为普通文件系统,用Markdown文件填充,Agent用bash和grep搜索。 不需要花哨的向量数据库,不需要专门的工具——Agent本来就擅长操作文件系统。 但当这些方案扩展到生产环境,问题就来了。 多个Agent同时写入同一个记忆文件怎么办。一个Agent写入错误信息到组织级上下文,所有Agent都会受影响。记忆过时了怎么办。 有人通过提示词注入向记忆中写入恶意内容怎么办。 Anthropic给出的解决方案是四个原则:版本控制(能回滚)、并发控制(哈希校验)、权限管理(组织级只读、个人级可写)、可移植性(干净的API,跨系统访问)。 然后是最有意思的部分:做梦。 带内记忆有一个根本性局限:Agent既要完成任务,又要管理记忆,这是两个竞争性目标。 而且Agent只能看到当前会话的信息,无法识别跨会话的模式。 做梦是一个带外的异步处理过程。 它取一段时间内的所有会话记录,交给一个专门的Agent分析。 这个Agent查看记忆存储,识别模式,提出更改建议。比如:所有地理学生都答错了同一个问题:说明课程中缺少了某个主题。 所有数学考试的答案都用弧度制而不是角度制,说明工具配置有问题。 做梦本质上是一个批量处理的"校长",审查所有"学生"的作业,发现问题,调整"课程"。 它有自己的专用资源,不和任务执行竞争上下文。 Anthropic已经在生产中运行这套系统。 他们发现:Agent第二次执行任务时做得更好,成本降低(因为能一次性完成),延迟下降。 做梦的额外token消耗被任务本身的效率提升抵消了。 最后Lamis说了一句话值得记住:上下文工程是过去一年才真正发展起来的领域。 模型智能本身不会产生复利:它需要上下文来执行你交给它的具体任务。 而上下文工程的效果是倍增智能,即使模型本身变得更聪明,这个投资依然有价值。
All In Podcast最新一期,几位大佬怎么看美光、存储瓶颈、中国开源模型和分布式推理 这期All In Podcast信息量挺大的,挑几个我觉得最值得分享的话题整理了一下。 先说中国开源模型这条线,进展比想象中快 智谱AI发布了新一代Frontier级开源模型GLM 5.2,7440亿参数,100万token上下文,彻底走MIT开源协议。评测数据挺惊人:在软件工程编程基准测试里击败了GPT-5.5,距离Anthropic最顶级的Claude Opus 4.8也只差不到1%,但API价格比同等性能的美国模型便宜了整整85%。 节目里有个细节很有意思,说的是中国团队加速追赶的一种方法:用成千上万台手机和iPad组成设备农场,用加密账户向美国顶级Frontier模型的API高密度提问,把对方的推理链路收割下来,喂给自己的开源模型做强化训练。这相当于把美国实验室耗费巨资跑出来的��准答案当成小抄,用很低的成本实现接近的性能。 Sacks对此的态度挺尖锐,他批评Anthropic的Dario之前推动美国政府设立繁琐的安全审批流程,这种自我设限反而拖慢了美国自己的节奏。Fable模型因为越狱指控被迫下架,OpenAI的新模型审批也很难产。他的判断是中国模型目前技术上落后大概9个月,芯片上落后大概24个月,但已经全线用华为昇腾这类本土芯片完成了GLM5家族的训练,未来这些针对本土芯片优化、便宜好用的"AI盒子"很可能会被低价倾销到全球市场,而美国自己却在设各种限制,反而把这个万亿级出口市场让出去了。 美光这次的财报,节目里给出了一个精准的定位:DRAM才是整个AI浪潮真正的卡脖子环节 美光这季度营收同比暴增四倍,从90亿飙升到420亿,指引远超预期,2026年的HBM产能早就全部售罄。 节目里有个观点说得挺直白:之前大家在推特上找各种日本小辅材公司当作"瓶颈股",但真正的命脉只有DRAM,尤其是HBM。原因很简单,内存的带宽和容量决定了所有大模型推理性能的物理天花板,这是个硬约束,绕不过去。甚至提到马斯克正在建设的超级工厂,技术核心也是对准DRAM,不是光纤、电源或者NAND闪存。 美光这次商业模式上也做了一个挺有意思的变化:跟核心云厂商签了带有"价格下限与上限"保护的长期供应协议,锁定了50%的未来营收。这意味着即便未来行业周期下行,最低合同保价也比过去任何一轮周期的毛利峰值还高。 进入壁垒这块,虽然中国的长鑫存储在筹备上市,未来可能会用低价中低端消费级内存缓解苹果这类大厂的成本压力,但在AI服务器需要的顶级HBM领域,全球目前还是只有美光、SK海力士、三星这三家能生产,工艺难度极高,不是短期能被追上的。 节目里给了一个挺夸张的预测:明年全球超大规模资本开支里,会有30%到40%直接流向DRAM芯片厂商。这种成本飙升已经导致苹果全线提高了MacBook和Mac Studio的零���价。 边缘计算和分布式推理这部分,是这期里最有想象力的内容,分享几个我觉得有意思的设想 特斯拉6月18日申请了一个叫"Megapod"的硬件商标。背后的物理逻辑是:在地面建一个1吉瓦的数据中心,土地、能耗、液冷的审批流程极其漫长。Megapod的设想是把GPU、电池网络和冷却系统集成进一个集装箱式的模块化数据中心,直接空降在已经获批、有现成电网和空闲土地的特斯拉超级充电站网络里,绕开传统数据中心建设最大的瓶颈——审批和电力接入。 分布式推理这条线的逻辑也挺有意思:模型回答问题可以拆成两个阶段,理解问题的Prefill阶段和高带宽高内存消耗的Decode阶段。大资金可以收购折旧的旧显卡,前端外挂专门做解码优化的芯片,组成成本更低的分布式推理网络。 更疯狂一点的设想是,未来给买家用储能电池Powerwall的用户提供折扣,强制在每个电池里内置AI芯片,再配合Starlink卫星连接,电池闲置的时候自动组成一个庞大的分布式P2P推理池,获得源源不断几乎免费的离岸算力。这个设想如果真的实现,对传统云大厂会是一次降维打击。 最疯狂的部分是太空算力。地面建1吉瓦数据中心需要350亿美元芯片成本加250亿美元冷却人工成本,还面临各种用地争议。但随着SpaceX的星舰实现完全可重复使用,把1吉瓦算力通过激光互联发射到太空轨道的成本可能暴降到只要50亿美元。太空天然的严寒环境和近乎无限的太阳能,可能让太空数据中心的运营经济学在3到4年内反超地表数据中心。
成本大概两百多点吧。主要是为了测试性爱镜头所以前期没什么剧情。(大家可以评论构想一下可以有怎样的剧情桥段的引入到两人的做爱过程中) Seedance产出总体还可以,也是要抽卡以及重新构图,在他给出的不合格的素材里选取到可用的部分。但我对自己设计的做爱戏份的镜头组接很满意😀欢迎同好讨论交流 https://t.co/1bUDc6fjK4
阿里巴巴的股价今年跌得真狠! 年内跌幅超39%, 并且RSI创上市以来最低,进入严重超卖区间, 目前股价回到12年前上市初的水平, 总市值只有台积电的十分之一。 原因方面, AI投入巨大,但是市场份额明显落后于豆包等竞争对手, 近期被美国国防部列入所谓”中国军方关联企业”名单, 加上又被Anthropic指控动用几万假帐号窃取Claude AI模型能力。 在传统强项电商方面,价格战愈发激烈,市场份额不断被对手蚕食, 大量失败收购案例以及不断地人才流失, 让这颗中国互联网巨星,12年如一梦。
GPT 5.6和智谱GLM 5.2使用成本一样 中美AI大模型价格战开打了!!
📸用 GPT-Image2 实现写真自由:POV 古风夜游抓拍! 高机位第一视角构图,古风夜游系列✨ 1、递一盏花灯 2、雨夜共撑油纸伞 3、轻轻拉住衣袖 4、把披风披到她肩上 灯笼、雨巷、青石板、近距离互动,再加上她抬眼看镜头的那一瞬间~ 不像普通古风写真,更像一段正在发生的故事! 提示词在评论区👇 https://t.co/WxF7yLvpEe
6 月 26 日,OpenAI 正式从 ChatGPT 中移除了 GPT-4.5。这是 GPT-4 系列在 ChatGPT 里的最后一个模型,至此,GPT-4 时代在消费端彻底翻篇。 我觉得 GPT-4.5 至今仍是最好的写作模型之一,GPT-5 系列在文风和个性上始终没能达到 GPT-4.5 的水准。 GPT-4.5 原本就只对付费用户开放,使用量不大,所以 OpenAI 只给了 30 天的过渡期(5 月 28 日公告,6 月 26 日下线)。已有的 GPT-4.5 对话会自动切换到 GPT-5.5 继续,用户不需要手动操作。基于 GPT-4.5 搭建的自定义 GPT 也将同步失效,创建者需要手动迁移到新模型。 API 端不受影响,开发者仍然可以通过 API 调用 GPT-4.5。 回头看,GPT-4 系列的退场过程颇为曲折。去年 GPT-5 发布时,OpenAI 原本打算同步下线 GPT-4o,结果引发大规模用户抗议,不少人把 GPT-4o 当成了有温度的陪伴者,对下线反应激烈到 OpenAI 不得不临时恢复。最终 GPT-4o 在今年 2 月才正式退役,OpenAI 当时透露日活用户中仅 0.1% 仍在选用它,但按 8 亿周活用户的基数算,这仍然意味着约 80 万人。 下一个要走的是 o3,8 月 26 日下线,过渡期 90 天。
现在 Codex/Claude Code 的上下文压缩确实做的挺好了,加上 Prompt Caching,一个 Session 内持续聊没那么大成本压力了。我现在也越来越多的在一个会话内继续任务。 另外还有两个配套功能是很好的: 1. fork,就是从某一个对话位置开分支,只保留该对话前面的历史记录,让上下文更纯粹 2. /btw或者/side,在当前会话中提问,通常用于你想起来一件跟当前任务关系不大的事,没必要加入当前上下文中。 比如说使用 plan 模式时,你要回答一堆问题,但是这些问题选项说的不是很清楚你也不知道该选什么,这时候最适合用 /btw 让详细解释一下每个选项的意思,甚至还可以让它给你建议。

Berryxia.AI
周末窝在家里,花半小时学习它吧! 别光刷短视频, 看下Anthropic的上下文管理的视频! 2026年AI DevCon上,Anthropic的Lamis做了一场关于上下文工程的演讲。 整场演讲浓缩了过去一年Anthropic在上下文管理上的所有实践,从最简单的方案到最前沿的架构。 从Claude MD文件开始。 一个纯Markdown文件,放在会话开头,告诉Agent代码库结构、组织信息、个人偏好。 效果出奇地好:Anthropic的原话是"unreasonably effective"。(效果惊人出奇的好) 但问题也明显:文件越来越长,上下文膨胀,管理困难。 第二步是记忆工具。 让Agent自主决定何时读取、何时写入、何时更新记忆。全部在带内完成,也就是在会话上下文中进行。 Anthropic发现,在这种场景下,自主性运作得非常好。Agent比人类更擅长判断什么值得记住。 第三步是Skills。 核心思想是渐进式披露。 Agent只看文件顶部几行前言,决定是否需要加载整个文件。 Lamis的比喻很精准:就像房间里有一个书架,每次有人跟我说话,我扫一眼书单,看有没有相关书籍,然后取下来读。 不需要提前把所有知识塞进上下文。 第四步是文件系统。 把记忆系统建模为普通文件系统,用Markdown文件填充,Agent用bash和grep搜索。 不需要花哨的向量数据库,不需要专门的工具——Agent本来就擅长操作文件系统。 但当这些方案扩展到生产环境,问题就来了。 多个Agent同时写入同一个记忆文件怎么办。一个Agent写入错误信息到组织级上下文,所有Agent都会受影响。记忆过时了怎么办。 有人通过提示词注入向记忆中写入恶意内容怎么办。 Anthropic给出的解决方案是四个原则:版本控制(能回滚)、并发控制(哈希校验)、权限管理(组织级只读、个人级可写)、可移植性(干净的API,跨系统访问)。 然后是最有意思的部分:做梦。 带内记忆有一个根本性局限:Agent既要完成任务,又要管理记忆,这是两个竞争性目标。 而且Agent只能看到当前会话的信息,无法识别跨会话的模式。 做梦是一个带外的异步处理过程。 它取一段时间内的所有会话记录,交给一个专门的Agent分析。 这个Agent查看记忆存储,识别模式,提出更改建议。比如:所有地理学生都答错了同一个问题:说明课程中缺少了某个主题。 所有数学考试的答案都用弧度制而不是角度制,说明工具配置有问题。 做梦本质上是一个批量处理的"校长",审查所有"学生"的作业,发现问题,调整"课程"。 它有自己的专用资源,不和任务执行竞争上下文。 Anthropic已经在生产中运行这套系统。 他们发现:Agent第二次执行任务时做得更好,成本降低(因为能一次性完成),延迟下降。 做梦的额外token消耗被任务本身的效率提升抵消了。 最后Lamis说了一句话值得记住:上下文工程是过去一年才真正发展起来的领域。 模型智能本身不会产生复利:它需要上下文来执行你交给它的具体任务。 而上下文工程的效果是倍增智能,即使模型本身变得更聪明,这个投资依然有价值。
Est. 500 views for your reply