🔥 推特起爆帖监控
搜索和分析大V账号即将起爆的热帖推文。通过SoPilot插件快速评论和互动,抢先一步占领评论区,你将获得更多的曝光。

我最高效的休息场所是在滴滴专车的后排 如果你把这看作是消费行为的话,作为一个物欲不高的人,这可能是我为数不多的特别愿意多花点钱的地方 如果你把这看作是投资行为的话,有这么一个可以投得进去的地方,还真是一个挺重要的事儿

把复杂的问题简单化是一个很重要的能力 比如人一天到底要睡够多少个小时 我觉得困了我就睡 我觉得不困我就醒 比如我的产品应不应该涨价 我卖得动就涨 我卖不动就不涨 比如 我怎么做时间管理 有着急的事就先干,事情不着急就可以休息 比如我应该在哪个平台做自媒体 我的对标在哪个平台 我就在哪个平台 比如我应该用哪种方式变现 我的对标用哪种方式变现 我就用哪种方式变现 比如哪个 AI 更好用 你都用过一遍 自然知道哪个 AI 产品更好用 得抑郁症的人和正常人的区别是,前者对事物没有偏好,后者对事物有偏好

西贝和老罗的事儿应该是有巨佬出面调停 此事就告一段落了 于是追求流量的老罗,今天晚上追着华与华猛打😂 https://t.co/B9DOY4QdmN

或许这几本书,能帮我们看清背后的逻辑: 📖 《公众舆论》 —— 李普曼提出“拟态环境”概念,揭示我们眼中的世界很多时候是被媒体建构出来的。 📖 《沉默的螺旋》 —— 诺依曼剖析“害怕孤立”如何让少数声音逐渐消失,舆论因此形成。 📖 《宣传》 —— 伯内斯被称为“公关之父”,这本书毫不掩饰如何通过心理学与符号操纵来引导大众。 📖 《认知操纵》 —— 从心理学和传播学角度解析现代社会的“信息战术”。 📖 《羊群的共识》 —— 探讨群体思维如何在舆论中发挥力量。 📖 《舆论的结晶》 —— 系统化总结舆论的生成与传播规律。 📖 《弱传播》 —— 在信息过载的时代,反而“微弱信息”能精准击中人心。 📖 《公关学》 —— 理论与实务兼顾,帮助理解公共关系的应对与策略。

我彻底上头图像类 Agent,尤其是 Lovart。 我愿称之为当下最强的视觉 Agent,不仅因为新上线的 Seedream 4.0 吊打了市面大多数模型,特别是在中文理解上比 nano banana 更适合中国宝宝体质,也更因为它真的在补齐普通人和专业创作之间的那道鸿沟。 Lovart 给了我一种“终于有人把视觉创作的流程当成 Agent 架构来重构”的感觉。我不是第一次说这个判断了,Agent 的本质不是替代专业能力,而是重组创作路径。 Lovart + Seedream 4.0 这套组合,能让我们从 prompt 一路走到海报构图、局部编辑、多尺寸输出、甚至直接生成故事板和视频的系统性 Agent。 这是一个很重要的转变:当图像模型开始服务于创作流程而不是图像质量时,它就已经跳出 Diffusion 的范畴,进入了视觉组织系统的范式。

最近两个周末泡在 Lovart,上周是 Nano Banana,这周是 Seedream 4.0,这两者让我第一次感受到创作门槛被拉低,特别是后者在中文上的造诣让我更坚定Lovart+Seedream可能是当下最好的图像创作服务。 这一切背后的核心感受只有一句:Agent 和模型是乘法关系。 对我这样的普通用户而言,可以永远追求更强的底模,但没有一个能读懂我意图拆解过程、引导我做出结构决策的 Agent,一切都还是停留在试试看。 而一旦 Agent 补齐了我们和专业技能之间的鸿沟,哪怕只掌握一点点基础知识,它也能让我的技能指数级地提升,就像我这周在 Lovart 上做的那些图,构图、光影、材质、排布都开始有了设计感,而我甚至没变得更专业,只是 agent 更懂我了。 这跟最近 X 上讨论很火的“初级程序员 + vibe coding”如出一辙:我们不一定要成为资深专家,但有一些基础知识再加上一个能共振的智能体,就可以把当前的直觉和愿望翻译成现实。 模型给了我们无限能力,而 agent 让我们真正上手。

上次在杭州听李继刚老师分享,也特别有收获。 看这次 PPT 截图,又升华了。 很赞其中几张图。 看着图,貌似能脑补继刚的话,神奇。

看到微软开源的一个项目 MarkItDown,这么小的一个工具获得了 7w+ star。 但它干的事儿特别朴素,把各种格式的文件(Word、PDF、Excel、PPT、图片、音频、HTML、JSON、甚至 zip 包)一键变成结构化 Markdown。 是的,保留标题、列表、表格、链接结构的那种 Markdown。 为什么我会觉得这个工具值得讲讲?因为这其实解决了一个我们常常下意识忽略的问题: 在做 AI 工具链 / 多模态 Agent 的时候,非结构化文件怎么喂给模型?怎么结构保留?怎么对齐输入? MarkItDown 把这事儿做成了入口标准件。 它让我们可以构建一条干净的链路: 1. 业务文件/网页/对话记录/OCR 结果 → Markdown with structure 2. 再接入 LLM、embedding、Agent 或私有知识库系统 整个链条让每一个本来不适合进 AI 的文件,都变得适合进 AI。 就这一点,已经超越了文件格式转换工具的定位,把它当成 AI 里文档智能的基建模块也不为过。 pip install 或者用它提供的mcp版本,就全搞定了。微软这波是真的懂工程师在处理数据入口时的痛点。 这项目能有这么多 star 是因为它处理的恰恰是所有 AI 工作流都要面对的最前一公里。文件乱、格式多、结构丢失等一系列这琐碎问题解决不了,后面你那套 pipeline 其实跑不通的。 未来我们肯定会有越来越多“agent + 数据 + 多模态”的场景,那些 agent 想干活,第一件事就是把一堆烂七八糟的原始资料读懂,还原出它的结构和语义。 MarkItDown 说白了就是把这个入口的苦活累活都干了。 这种不 infra 的工具往往才是最重要的 infra。推荐给所有做 LLM 产品的人。


平台选择:做小红书还是做抖音 https://t.co/C2NtN7UxEV

每次有人问我为什么要辞职,我都会完整地说一遍我的几个理由。今天在这条贴里面再简单地说一下其中一个原因,并顺便给个建议。 现在所有在做固定全职工作的朋友,有以下几条路防范未来的不确定性: - 要么你有资金在做投资,可以用钱去赚钱。 - 要么你有自己的个人项目或小生意。 - 要么就是家里有矿。 你是哪种? 现在公司职场这条路径的不确定性,比十年前二十年前差异巨大。以往那种按部就班一步一步升职、稳定工作的路径,即使在国外也不再行得通。简单说,迟早你的性价比会不如算法和机器。企业主没有一个例外,都在考虑如何用AI降本增效,而你就是成本。 在这种情况下,如果你能有一笔钱投资,或是有其他辅助收入,甚至能抵上部分或全部工资的收入,那算是比较稳定的。否则,迟早会到一个节点,要么主动离开,要么被动被裁。越是中高级职位,生活受到的冲击越大。 现在已经不是"黑天鹅"时代了,而是"黑天鹅养殖场",遍地天鹅乱飞。黑天鹅事件可能是行业变化,也可能地缘政治原因,是你被列为敏感族裔----这些事上一辈人不用考虑,我们这一辈却不得不考虑。 机器输出能力比你强,整个行业被机器替代的情况比比皆是。传统大企业被小公司干掉,也不是不可能。 最具体的建议是:哪怕已经有稳定工作的人,也应该拿出20%的时间和精力来投资自己,学习新技能,同时保证健康。 而且我个人感觉也就是这三五年,各个行业就会剧变。其实现在已经很多变化了,但身处热水里的青蛙,通常都感知不到水温的变化。

今天在上海参加了李继刚的织梦师线下分享会 分享质量之高,世界范围内也是顶级 在 AI 时代,人何以自处? 机械,取代了人的体力(后来人们发明了健身房) AI,取代了人的脑力(后来人们发明了健脑房?) 人类还剩下什么? AI 没有目的,而人全是目的 人的目的,就是心力。 体力、脑力都接近无限之后, 最重要的问题是: 你,想做什么? 人何以自处? 答案逐渐清晰。 注入心力,与体力、脑力一起。 成为一个新的人。

创业之后,看到这世界虚假太多,而真实是多么可贵。 90%的电话都是推销和诈骗 90%的VC都是来学习交流 90%的FA都只会拉微信群 90%的产品宣传都是照骗 那什么是真实呢? 一对一私聊沟通,比社交媒体的公开辩论要真实 微信拉三人群介绍的好友,比搜索添加的要真实 线下见面的朋友,比线上视频聊天的朋友要真实 真实就意味着在场。 在场就意味着舍弃了其他的可能性。 你选择了最重要的那个场。

Paul Graham: 今年读过的最好书籍——Period Piece 达尔文孙女的自传,中文版 《维多利亚时代的童年》 出版社: 生活·读书·新知三联书店/ 2014年 她是著名生物学家达尔文孙女,本人是杰出的木版画家, 这个家族以其在科学、艺术和工业领域的众多杰出人物而闻名。 作者语言风格极具魅力:温和、风趣而又犀利, 既有对童年和家庭的深情,又毫不避讳批评当时的迂腐。 本书展现了科学精神(理性、观察、怀疑)如何与人文艺术(情感、美感、表达)在一个家庭和个人身上完美结合。它打破了“文理对立”的刻板印象

即梦 4 提示词: 生成一幅超写实风格、4K画质的夜间全身人像摄影作品,主角是一位23岁的中国年轻美丽女性,肤色白皙细腻,长直的黑发柔顺地别在一侧耳后。她站在寒夜中布满霜冻的城市公交车站,双臂交叉抱紧以抵御寒冷。她的神情包含70%的轻微烦躁与30%的无奈而自嘲,仿佛正在重读一条令她后悔发送的消息。 人物服饰: -上半身依次穿着黑色西装外套、深蓝色运动卫衣、整洁笔挺的白色衬衫与一条细长的黑色领带; -下半身穿着极短的黑色百褶裙; -腿部穿着全新的白色及膝袜; -脚上穿着擦拭得光亮如镜的黑色皮鞋。 场景环境: -夜晚城市的公交站台,地面铺满冰霜,远处车灯的倒影映射于冰冷潮湿的路面; -上方三分之一的画面笼罩着浓厚的雾气; -公交候车亭的玻璃上覆盖着蒸汽,有人用手指随意画了一个笑脸图案,这个笑脸的痕迹明显比周围的水汽消退得更快; -场景灯光呈现电影级别的冷调蓝白色,明暗对比鲜明。 隐藏细节: -女孩左脚鞋面上的倒影中,隐约可见一辆模糊的红色双层巴士,但无法确定它是否即将到达。 拍摄视角及风格: - 镜头采用低眼平视角,将人物完整呈现于画面之中; -使用模拟PhaseOne中画幅相机的真实质感; -景深效果:清晰聚焦在人物主体上,远处的灯光呈现柔和唯美的散景虚化效果; -整体视觉风格呈现电影般的高级冷色调,极致逼真且富有戏剧感。



工作遇阻的时候想想马云 就觉得这一切也都没什么大不了 https://t.co/DgbPaiaOiI

中推你不知道的Benchmark: 1、在一条推文跑到10万展示前,如果单纯靠算法自然流,大部分情况下展示:点赞约在8-10,这就是优质内容的一个标志 2、能快速破圈(1天至少20w)的推文,1-2个小时就要跑过万展示 3、推特的流量展示区是20-30w,一般能过30w的很容易会到50w,过了50w区间的就容易到80-100w 4、纯简中推文,展示量天花板大概是1500万 5、如果你在推文中构建CTA,那么CTR大概是万2到千3不等 6、最快涨粉的策略不是发内容,而是让自己成为工具人 7、所有巨量爆发增长,都是由于一种模式互动带来的,绝不是靠内容营销 8、正常来说,好的内容一天可以带1000+粉丝 9、靠内容涨粉,一天大几千粉丝是比较极限的 10、推文的生命周期往往只有1-3天

「精准流量」在多数情况下都是一个谎言 这个词背后的假设是:存在 10% 的人群,他们很愿意买我的东西,还有 90% 的人群,他们不太愿意买我的东西 所以我就做个视频,只让 10% 的人刷到就可以了,不火也无所谓 但实际情况是:买家的心智不是静态的,我有多大概率买你的东西,不仅仅在于「买家是谁」,更在于「卖家说了什么 做了什么」 你觉得你只能转化 10% 的“精准”人群,是因为他们本来就要买东西,你发布的内容解决了信息差问题而已,这能叫转化吗? “转”本义为旋转、移动、改变方向,“化”本义为变化、演变 人家本来就要买,然后刚好看见你了,这能叫转化吗?哪里“转”了?哪里“化”了? 真正的转化是,把你的内容曝光给所有人,让 50% 人有 30% 的下单意愿,让 20% 的人有 80% 的下单意愿,让 10% 的人当场付款 这里面是有说服的过程、有心智变化的过程的,这玩意儿叫「销售」,这才是「转化」 只有极少数屡次做出过爆款的人,才有资格说:这条虽然流量不够大,但是转化率还行 绝大多数说 “我是做客资的,我要的不是流量,是精准” 都只在拿这个理由掩饰自己的菜 我有个 2B “同行”特别喜欢把“精准流量”这个词挂在嘴边 每次他流量不好就说自己是故意为之,每次他给客服陪跑没流量就说“咱们就是这么设计的” 最终的结果就是他所有的收入都是靠骗

大佬大多是做不好自媒体的 能做自媒体的都是普通人 大佬想做自媒体很难 因为他们的思想更深邃 认知更饱满 离大众太远了 想下沉就得降维转化表达 把高深的东西说的通俗易懂 是非常难的 一方面不屑于这样做 一方面想润物细无声是比掷地有声难的多的多 在这个过程里信息会被压缩 表达就不一定是自己想表达的 反而是普通人容易做自媒体 因为普通人会觉得这有啥难的 就是比我多干了这么一点点 能意识到那个差距是可以通过执行来弥补的 这种情况下他就会觉得你是个分享实用经验的前辈 而不是遥不可及的 当这个事情变得看似可以获得的时候 人们才会看下去 所以如果你想做自媒体 你得说很多人都懂但没有说出来的事儿 这也就是为什么大部分人觉得自媒体都没货 水平也不高的原因了 玄而又玄 是众妙之门 绝不是众人通往“成功”的门

哈哈第一年来我家,冬天我居然给她做了一件毛衣!想想这个功夫,反正以后再也没做过了。 https://t.co/j3XbZpzBCZ

之前和 @xDinoDeer 聊过怎么让推文过百万曝光 当时觉得必须让非简体中文用户看到这条推文,只靠简中推特可能做不到 结果这条到了 200w+ 曝光,似乎是只靠简中区流量做到的,流量点是色情 + AI 不过发完之后马上 hkdoll 就说让大家别再发 AI 脱口罩 …… 这个流量测试不太体面,以后不发了

这就是为什么25年做Agents的公司赶紧融钱 年初看到Deepseek,Manus之后 投资情绪全被带动了 市场热起来了,25年能融多点儿就融多点 钱放账上趴着,反正也就是10个多人的小团队,一年也没多少成本 能熬过2年穿越周期走出来,最差也是被收购 但到了明年,这个环境可能就会开始恶劣 尤其是从Manus这种头部没了下文之后 市场就会开始恐慌 这Agents搞了这么久了,到底有没有真正在交付结果的? 怎么看起来都跟玩具一样? 搞Agents的初创 有很多团队可能是连最基本的标准化评估机制都欠缺的 连结果都无法Verifiable 就更别说什么reward了 很多时候调一下提示词 效果反而还衰退了 大家就凭感觉反馈 什么时候意味着这件事开始能被量化呢? 就是当你看见有像律师一样收费的Agents 而不是单纯的只给你看消耗多少token 却不管结果


源即文明 过去村口的长舌妇吵架,最多就是几十个人围观,如今却被搬到互联网上,变成了没完没了的时间线。俺老孙真是烦透了!现实里可以绕开村口,但线上逃不过无休止的争吵。我不想当什么网红,我也不是啥大v,我只想找到真正的共鸣者。因为和我能共鸣的人如大海捞针。在我看来,大多数所谓网红并没有什么真本事,他们不过是把长舌妇的大嗓门搬到线上放大而已。可是,下一个文明需要的并不是流量式的大嗓门,而是“源”。 互联网的流量逻辑正在走到尽头,它必然会被下一个计算机文明所改变。 流量的本质,说到底就是一种“注意力套利”,谁能集中用户的注意力,谁就能收割流量红利。然而当下乌烟瘴气的社交媒体,流量逻辑更像是“村口吵架被无限放大”。推荐算法追逐的是注意力最大化,而最能吸引注意力的,正是愤怒、仇恨、八卦、极端立场等情绪化内容。于是,算法天然地把“吵架”推到流量顶端。低门槛的复制与转发进一步加剧了这种扩散效应:在村口,吵架也就几十人围观;在互联网上,复制、转发和评论却能在短短数小时内,把同样的争吵扩散到百万级。更糟糕的是,平台的激励机制本身就是“吵架的庄家”:平台依赖广告收益 → 广告依赖流量 → 流量依赖停留时间 → 而停留时间恰恰依赖冲突与对立。最终,平台把吵架变成了一台“流量收割机”。 这一套逻辑注定无法支撑下一个文明。下一个文明要靠的不是流量,而是“源”。 “源”才是文明的真正底座。 在当下的互联网环境中,人们往往只看见“流量”的表象,却忽视了流量背后的源头——也就是知识、思想、价值与信号的原始发出点。流量再大,终究只是搬运与分发,而源才决定是否有值得搬运的内容。源的稀缺性显而易见:在“村口吵架”的逻辑下,噪音可以无限制造,但真正的信号源却极为有限。原创的科学发现、第一手的历史经验、原始的思想洞见,这些才是推动文明前进的燃料。文明从来不是靠“重复”积累,而是靠“源的叠加”。一旦失去源,文明就会陷入空转,只剩下争吵与消耗。 这一轮互联网文明——Facebook、抖音等平台所代表的信息洪流时代——人人都能发声,但识别源的能力却全面退化,结果是真正的信号被埋没。随着 AI 的加入,信息生成的边际成本无限趋近于零,发声的门槛被抹平,甚至“声音”本身也失去了意义。真正重要的,唯有那个“源”。 流量只是表象,如同江河中的波涛,可以汹涌,可以喧嚣,但它并不具备真正的创造力。源才是水的发端。文明的积累,不是靠转发和复述,而是靠源头的原创与信号的生成。 从本质上说,源有三大特征: 生成性 —— 决定是否有真正的新思想、新知识、新价值被提出。 验证性 —— 能够被追溯与检验,区别于谣言、噪音和情绪化复制。 可迁移性 —— 能够跨越语言、文化与学科,被不同系统和智能体调用。 文明的未来,不在于谁能操控流量,而在于谁能不断创造、守护并扩散优质的源。 语料已经用完了?AI为何无法成为源的创造者 AI 本质上无法成为源的创造者。如果严格按照 “源的本质” 来衡量,源意味着:第一性信息 + 原创压缩 + 可验证锚点。它必须来自经验的原点(实验、观察、身体体验、社会实践),必须带有不可替代性(一次性发生的真实事件、独特的洞见),并且必须具备可验证性(能够溯源、能够被检验,而不是幻觉)。 从这个标准看,AI 有四大根本性缺陷。首先,AI 没有第一手经验。它不会亲自下田、做实验、感受痛苦或爱。它的全部输入都来自已有的数据,而这些数据本身就是别人创造的源,因此 AI 只能成为源的二次利用者,而不是源的起点。 其次,AI 缺乏主体性压缩。人类在创造源时,会做价值判断和取舍,决定哪些是必须留下的、哪些可以舍弃。AI 的压缩仅仅是统计学上的,而不是“带有主权的选择”,因此它难以提出真正的范式性问题或哲学性洞见。 第三,AI 无法自证。真正的源必须能被验证,而 AI 生成的知识往往缺乏可溯源性,它的“幻觉”就是例子。缺少验证机制,AI 的输出更像高拟合的猜测,而不是文明赖以积累的信号源。最后,AI 缺乏不可替代性。AI 的生成可以无限复制,几乎没有独一无二的存在;而真正的源,往往是一次性的、不可复制的,比如一组新的实验数据,或一首源自特定生命体验的诗。 因此,哪怕语料被消耗殆尽,AI 也无法独立创造新的源。它的价值在于扩展、重组和放大已有源,而不是成为源头本身。真正能创造源的,仍然是人类在与世界直接交互中产生的经验与洞见。 不要沦为村口的长舌妇 表面上看,AI 已经在许多领域超越了人类专家,似乎让“源”的价值被稀释。但事实恰恰相反,在 AI 时代,源的重要性只会被放大。AI 并不是凭空创造,它的能力源于对既有语料、知识和经验的压缩与重组。没有高质量的源,AI 只能生成“次生知识”,陷入幻觉与同质化的循环。 在新的文明格局中,源将扮演三重角色。首先,它是 AI 的燃料。大模型的持续演进需要新的数据源,否则就会停滞在自我循环,出现“数据塌缩”。谁掌握了新鲜、稀缺、不可替代的源,谁就定义了 AI 的能力边界。其次,它是真伪的 验证器。在信息过剩和 AI 造假的环境里,唯一能站得住脚的就是可验证的源。未来,溯源机制——区块链、加密签名、实验记录——将成为文明秩序的基石。最后,它是 价值的锚定器。源就是未来的“价值单元”,无论是原创算法、实验数据还是思想洞见,都会成为 AI 时代的“知识货币”。源被调用和验证的次数,本身就是未来信用系统的基础。没有源的 AI,就像没有煤的蒸汽机:虽然能运转,但很快陷入空转。 要成为“源”的制造者 因此,关键在于如何成为 源的创造者。源的诞生有三种方式:第一,第一性经验——去做别人没做过的实验,走别人没走过的路径,留下第一手材料,比如科学实验数据、独立田野调查、原创代码与架构。第二,思想压缩——把复杂的现象压缩为可迁移、可调用的结构,例如新的理论框架、公式或认知范式。第三,价值嵌入——在知识中注入价值坐标,使其成为文明的锚点,如伦理原则、制度设计或共识协议。 源的创造者往往具备三个特征:独立性,能在主流之外捕捉新信号;结构化能力,能把零散观察转化为可调用的语言单元;跨界迁移力,能让源在跨学科、跨系统中复用,从而真正成为文明的源泉。要走上这条道路,需要四种能力:首先是观察力,敏锐发现那些无人注意的异常;其次是记录力,把经验、数据与思想沉淀成结构化表达;然后是调度力,让源能被他人或 AI 调用,而不是孤立存在;最后是验证力,确保源的真实性与可追溯性,避免它沦为另一种噪音。 当前的互联网逻辑正在慢慢腐朽与没落,宛如旧时代的贵族走到尽头。 情绪、冲突、八卦最能吸引点击,于是结果便是“村口吵架的全球化”。真正的信号源被埋没,优质的知识被淹没在噪音之中。全球注意力被平台绑架,而人类的注意力毕竟有限,流量逻辑却在无限膨胀,最终导致个体信息过载、群体认知分裂。更严重的是,价值逐渐空心化。流量驱动的只是曝光,而非价值;平台越大,越倾向于追逐短期流量,而不是着眼于长期的文明建设。 互联网的流量逻辑,塑造了一个“注意力收割的文明”,但这一文明已经陷入内卷、透支与腐蚀,无法再支撑人类的未来。下一个文明,必须以“源”为核心,而非流量。*源是真实的信号,是可验证的知识,是未来秩序的锚。 技术的花样已经被玩到尽头,单纯的“算法+流量”无法托举下一个文明。因为文明需要的是真实的信号源,而不是噪音的放大器。流量逻辑的激励机制决定了它必然制造噪音,而文明的演进需要的却是稀缺、可验证、结构化的源。文明需要稳定的秩序,而不是被注意力撕裂的碎片化世界;文明需要价值的锚定,而不是点击与转化的短期幻影。只有回到源,文明才能重新找到延续与跃迁的基础。 祝各位尽早成为自己领域里不可替代的“源”。

三个小时的播客听完了,太好了! 2023年读到ReAct,被这篇paper正面影响了学术轨迹和工作内容,并开始关注 Shunyu 的工作, ReAct, SWE agent, r-bench 每篇都是过一段时间就拿出来读一下,Shunyu是我最喜欢的 Agent 研究员。 2023年,用中文介绍了ReAct,也开启了我在推上做技术分享的开端,居然发现当时有跟 Shunyu 互动。 这个播客,随手记了很多笔记,很有收获: 1. 简单和通用的方法,更贴合 AI 的泛化能力特征。 2. 验证方法的好坏,在于找到合适的任务和好的环境。 3. 在research中,传统上在已知任务中创造新方法,而先想到方法然后找合适任务验证是比较挑战的。 4. 新的交互方式以及新的环境,可能会带来 super app。 5. Agent 的创业者应该问自己,创造的价值是什么。 6. Agent/ LLM 解决问题的内在激励,是一个疑问,但也是机会。

这几天测完了今年备受瞩目的两个开源tts,可以说相当失望。具体是哪家,懂的都懂,就不点名了。 一个连正确的发音都做不到,幻觉丛生,另一个强很多,至少是能用的,只是数据训练量明显不够,克隆音色相似度不够,说话自然度也差很多,距离官方发布的卖家秀相去甚远,无法给消费者直接使用。 我非常好奇,开源出来的模型版本,到底是不是卖家做营销视频的那个版本。 不过我确实越来越理解大家说的“开源是一种商业模式”了,以前我们管小红书上的这种东西叫“照骗”。 这些照骗,为模型厂商赢得了注意力,自媒体博主也跟着转发放大,结果到最后一开箱,大家发现根本货不对版。 毕竟照骗看得多了,大家就不再相信照片了。 希望多一些真开源,少一些假照骗。

迷雾中的巨兽 自由金牛你这篇帖子,我只能说深度共鸣。原本想好好总结、认真回应,但这几天灵感匮乏,心里的线索像一团乱麻,连找出一个清晰的线头都很难,更别提把它们排成线性的语言。 在推特上结识的几位朋友,我觉得我们上下文的契合度极高。如果从技术内容上看,最接近的是自由金牛@jinniudashu;如果从语言体系上看,那就是 Nagi Yan @naki2012。打个比方:我们像是在拼同一套乐高套装里的零件。我现在在拼脚,你在拼头。部位不同,但来源于同一个盒子。 过去几天,我写了几篇技术长文,主要是对 Web3.0 范式和区块链加密的理解,也收到了几个加密团队和正在做开发的程序员的重要反馈。我都看到了,也都收藏了。但脑子乱糟糟的,一时半会儿整理不出完整的回复。 然而,在这个混乱中,我得到一个重要的感知: 我们其实都在触摸同一头“迷雾中的巨兽”。 有的人看到了它的脚,有的人摸到它的手,有的人注意到牙齿、皮肤,听起来好像风马牛不相及,实际上都是同一个整体。 这头巨兽,我暂时称它为 “社会图灵机”。 这种在迷雾中摸索的感觉,很像 1960 年代的计算机科学家在尝试想象 2010 年代的 iPhone。他们心里同样面对着一头模糊的巨兽:揣在口袋里的通用图灵机。他们会反复追问:输入怎么做?普通人能看懂吗?交互的界面会是什么样子? 我们目前遇到的几个问题,其实在自由金牛你上一篇帖子里已经有了非常高的信息密度。我先尝试简单回应一下。 首先,我认为我们会在未来五年之内见证一个重大的范式分水岭:LLM 即产品 (LLM-as-Product) vs LLM 即原材料 (LLM-as-Material) 的分歧。这是整个行业正在纠结的分叉点,目前还没有形成广泛的共识,你也看得很清楚。巨头(OpenAI、Anthropic、Google)在资本压力下,优先推动 LLM 即产品,因为它能快速变现。普通用户也更容易接受“一个好用的工具”,而不是“一个抽象的智力材料”。 然而,你和我在多个帖子里,其实已经不约而同地把筹码压在 LLM 即原材料 上。背后的逻辑是清晰的:1)科技范式的必然演化,2)西方社会制度传统的开放惯性,3)大厂之间、大厂与广大程序员、大厂与消费者之间的长期博弈。 你提到了一个关键词:“角色”。在我的语言宇宙里,这个概念叫做 “结构人格 (Structural Persona)”。这种契合感让我惊叹数秒,因为我们其实指向了同一个核心问题:LLM 原始智力是混沌的,它像大海一样充满潜能,但不可直接调度。要真正抵达核心目标——可调用 (Callable)、可迁移 (Transferable)、可验证 (Verifiable)、可组合 (Schedulable),必须先把它切成可控的“乐高块”。 这和复杂系统的原理完全一致。LLM 作为“大智力海洋”,本质上是连续的:所有知识、语言、语义都在一个庞大的参数空间中流动。连续性虽包含无限潜能,却不可控、不可验证,也无法直接调度。在复杂系统的科学中,这正是为什么必须 离散化 (Discretization)。例如 流体力学 → 网格离散,只有把连续流体切成有限单元格,才能进行数值模拟。 所以,你说的“角色”,我说的“结构人格”,本质上都是 对连续智力的离散化操作。切块之后,它们必须具备五个条件:1)边界清晰性 (Clear Boundary),2)可验证性 (Verifiability),3)可组合性 (Composability),4)可调度性 (Schedulability),5)可迁移性 (Portability)。这样才是真正的 智力乐高颗粒,能够无限组合、无限扩展复杂度。 就如你说的,从有限智力到无限复杂度。太天才了,不愧是和我一个乐高盒子。复杂度不是来自“大模型能做一切”,而是来自有限单元的组合性:N 种块 → N! 种拼接方式 → 指数级爆炸。只要所有块遵循统一接口,就能保证拼接自由度。通过 层级抽象(小块 → 复合块 → 系统级结构),信息密度被层层放大,少数基础块就能生成无限复杂度。 最简单的比方,就是生命本身:四种碱基的有限组合,演化出了无限复杂的生命系统。 所以,核心结论就是:必须离散化。而让我兴奋的是,我看到我们两个人在各自推演时,几乎独立地走到了同一个方向。 最后,几周前你对我的评论,我是真的放在心里了。那就是——我如何去安排自己预算好的一万个小时。与其把时间分散在无数细碎的事情上,我更愿意花出其中的 9999 个小时,投入到共识的分析与传播上。 这个共识,首先必须是 技术圈内部的共识。因为当下的技术语境极度纷杂,即使我们面对的是同一头“迷雾中的巨兽”,讨论往往也会变成鸡同鸭讲,甚至还会因此争吵。没有基础的对齐,根本无法前进。 同时,这个共识也必须成为 民众的共识。因为它最终要落地到社会接口,要进入日常生活。如果无法跨越技术的上层和大众的底层,无法在二者之间建立顺畅的传播链路,那么所有的探索都会变成自说自话。 技术圈和广大民众的语言隔离,是下一个范式会彻底改变和抹平的。 更重要的是,这个共识还应该是 跨语言、跨国别的共识。这是第一次,中国的程序员不仅有资格,而且有足够的实力去参与协议的制定。如何让中文与英文世界真正对接,是一次前所未有的机遇。

五岁抬头 借用老高和小茉的一个名梗。我对真正的中国知识分子始终怀有好感,因为我生命里许多重要的知识,正是他们一点一滴教给我的。他们很多人带着一种天然的感知力和普世的怜悯。例如我的圣经知识,就是由家庭教会的刘牧师在一整年里耐心教导的。他不懂英文,也没有出过国,全凭对主的爱自学出所有的内容,分文不取。光是《创世纪》就花了好几个星期来讲解。 正因如此,在大学时我自己去借了托马斯·曼Thomas Mann的《约瑟与他的兄弟们》Joseph and His Brothers。这是一本极为艰深的书,原文是德语写的,我惊讶地发现图书馆里的英文版和德语版几乎没有被借阅过,像新书一样。室友看到我啃这本书都很诧异:“哇,你好厉害,这是啥?”我笑说,相当于是“圣经版的二月河”。也正是在那时,我意识到自己真正的天赋是“符号”——任何能转化为符号的东西,我都能轻松掌握。后来转码,学习英美法,钻研各种中英文 nerd 的内容都得心应手。不完全理解也能考高分,甚至能写出能跑的代码。 新教传统、五月花号精神、对圣经的解释和对平等的渴望,是北美成功的根本原因。在中文推特上,卢尔辰好像也讲过这一点@erchenlu1。来到陌生的土地,在一个法治的地方,人必须有两样武器:其一是知识,比如对科学的理解,或者对当地约定俗成的道德的理解;其二是法治,法律既是保护自己的武装,也是防止自己越轨的约束。法律与道德,缺一不可。在美国上过本科的人,都会在通识课里读到大量相关的内容。 不遵守法律,后果很直接:会惹上官司。那不遵守道德呢?人们会认定你不是一个“好人”。一定要当个好人吗?不一定。但要记住,这是在别人的土地上,不当个好人,人家完全可以不欢迎你。所谓的“好人”,在新教传统里就是:守法,为人良善,有家庭责任。看到另一个生命的逝去,会生出“为人”的基本怜悯。 自 2024 年中以来,我在 LLM 这种真正的符号智能面前跌倒、困惑了两年,终于发现必须用母语来强化我的符号能力,这才是正道。因为一个人最核心的语言,就是母语。在这个过程中,我遇见了许多中国知识分子,我们高度共鸣,彼此共享上下文。我很高兴,因为我们年纪相仿, 而且都在五岁的时候抬过头。墙上写着: 好好学习,天天向上。

拉黑任何人,完全是因为我既不是一个媒体人,也不想当个网红。熟悉我的推友,都知道我是来寻找共识和技术探讨的。二爷是真是假,与我无关。但是他想当个网红是真的。拉黑是因为,不想浪费我的attention, 你的评论会占用我的2秒,目前是技术派管理时间线的主流操作。我们的脑力很贵的。只留给好好说话,不开口就喷,真想学习和共识讨论的人群,谢谢。

确实,最近在应诸多小伙伴呼吁更新 MCPMark 的 thinking 榜单,其中一个很有意思的地方就是 gpt-5 带上 thinking 后能把 github mcp 的成功率刷高 20 多个绝对点。而同期的 MCP Universe 的工作中用 ReAct 对比,开 thinking 和不开 thinking 的得分则比较接近。 感觉对于 Agent Model 来说 Less Structure 可能才是正道

分享7个「套图」提示词,可在lovart「一键批量直出」 适合Nano Banana、Seedream4 🧵 目录: 1. 苹果高管 / 美式证件照 2. 黑白艺术照 3. 角色设定 4. 科普配图 5. 婚礼物料 6. 小红书知识卡片 7. 公众号封面 8. 无限画布玩法 即日起到9.20 Lovart都能免费爽用这两个模型,可以把案例跑起来! https://t.co/TGN82y6hK0