🔥 推特起爆帖监控
搜索和分析大V账号即将起爆的热帖推文。通过SoPilot插件快速评论和互动,抢先一步占领评论区,你将获得更多的曝光。
Hi,Click to combine my complete image. nano banana pro prompt: Subject: A young woman with light-colored skin and dark blonde/light brown hair casually tied in a low or mid messy bun, with a few loose strands framing her cheeks. Expression & Mood: Slight head tilt with a soft, playful smile; gentle eye contact directly toward the camera; casual, relaxed “social media snapshot” vibe. Makeup: Very natural light makeup — noticeable lashes, subtle blush, and naturally rosy glossy lips. Outfit: White thin-strap tank top with a low or rounded neckline; waistband of gray sweatpants/lounge pants visible. Accessories: Short pearl necklace layered with a thinner metal chain. Pose & Composition: Close-up half-body to waist selfie; torso turned slightly with a slight lean forward; shoulders forming a diagonal line; the subject occupies most of the frame; background slightly blurred. Environment: Indoor setting with a light-colored wall; minimal shelving on the left with small décor items (picture frame / plant / small object); a black chair nearby. Warm indoor lighting with soft shadows, authentic phone-camera texture.
谷歌被薅的顶不住了 Antigravity开始为 Pro 用户设置每周的额度上限,Ultra 用户不受影响 https://t.co/CFWvzqtHqQ
Dia 的 CEO Josh Miller 说: 如果你不尽快让团队以 Claude Code 为原生工作方式,你们会被远远甩在后面 就像在 2010 年代早期没能完全拥抱移动原生产品一样。 最近苹果 Safari 首席设计师也加入他们了,估计要发力了 ------ 他说Claude Code 正在真实改变团队协作:设计师频繁提交 PR,非工程师可以自主做原型,工程师获得更大杠杆开展实验而不影响核心职责。整体效果是更多实验、更快学习,像给整支团队配了“代码电助力自行车”。 他呼吁创业者尽快转向“Claude Code‑原生”,将其比作 2010 年代初全面拥抱移动原生的窗口期。随之公司明确了三项方向: 薪酬与人才门槛:为卓越、Claude Code‑原生的构建者支付溢价。 福利与流程:像唱片公司对待艺人一样,帮助同事进入并保持心流、让更多想法上线。 创造性雄心与自由:公司做更少的事,但在这些事上追求更宽的广度与更深的深度,并容忍高风险尝试。 这也带来新角色需求。新开的“设计制片人(Design Producer)”将统筹 Dia 的全部产品工作,连接产品负责人与内部职能、外部合作者;既是“经营唱片公司”,也是“设计录音室”,共同定义 AI‑原生设计团队的运作方式。
发现 opencode 默认支持读取 claude 的 skill 所以咱写的 clean-code-reviewer skill 躺着就可以直接在opencode 中使用了,选择你青睐的模型,比如 minimax @MiniMax_AI (现在是模型免费的) 只需要输入「调用 clean-code-reviewer skill ,扫描一下当前的代码仓库,至少找 10 处可以优化的问题」 得益于 M2.1 能力,识别速度比较快。 无意义的变量命名/长函数/重复代码/死代码都能很快嗅探叭出来定点清除。
LobeHub 新版桌面端 350M ,在 Electron 届应该已经是还可以的程度了🤗(对比参考:Linear 300M , Cursor 400M ,Claude 500M)
万维钢的脱口秀太牛了: CES 其实是 China Engineering Service。 最先进的特斯拉机器人上有一个摄像头,全天候在监控你,用来确保你在监控机器人。 苹果机器人太漂亮。不忍心用它漂亮的手直接干活,推荐苹果官方手套,299 美刀一副。 东北人不想买一个陪伴机器人,而是想买一队机器人。这样出门,五个随从,一个开车,四个跟着车跑。情绪价值拉满。 小孩问扎克伯格:我爸让我问你,Meta 有隐私问题吗。小扎回答:他不是你爸。 听完后,好想租个飞行汽车,去拉斯维加斯。
理解不了评论区的一些人。 这东西的本来是用这个案例教一下怎么创建 Skill 的整个过程。 一堆人说要 API 就不看了。那你不创建这个,不能创建个别的吗? 再说,就有些人的用量来说,他充会员未必有用 API 便宜。
我现在尽量少在网页、app 里面和 claude 聊天 尽量多用 claude code 聊天,因为如果聊出来一个有用的结果,就可以把这个聊天过程做成 skill,供后续调用 这个过程还能产生另外两个附加产品 1、我可以让它把这个 skill 转成一篇文章发推特或者公众号 (需要用一个模仿我文风的 skill 过一遍,但是这个目前还不太好用,没时间迭代) 2、连上 API,就可以把这个 skill 封装成网站对外开放了,但是做一堆网站收费也实在是繁琐,商业效率不高,可以免费开放引流 至于往哪引流、怎么变现,就看个人设计商业模式的能力了
这个人发布了最全面的免费 Vibe Coding 指南。 https://t.co/3xQmnVBSwq
想要第一时间薅开源 AI 工具红利,GitHub 上已经有一批拿来就能上手的项目在疯狂涨星。 比如 DeepSeek OCR,主打高性能文档 OCR,适合做批量 PDF 解析和知识库入库这类苦力活自动化。 Nano vLLM 把视觉语言模型做成极简实现,代码量很小,适合想自己魔改推理引擎的开发者。 做 Agent 和工作流的可以看 OpenWorkflow、Agent Lightning 和 https://t.co/8GwJ62PkZw 等项目,帮你快速起一个可编排的多 Agent 系统。 做多模态内容的可以用 HunyuanWorld Mirror 和 Step Audio EditX,搭建视频音频编辑和 AIGC 生产线的底层能力。 日常找轮子可以订阅 awesome ai tools 和 GitHub 的 ai tools Topic,把这些项目二次封装成自己的 AI 工具箱。
niji V7模型居然上线了,大家都以为不会有更新了 这个宣传片不错 https://t.co/IXOjUJuW0p
有人问 MCP 和 Skills 有什么区别。 简单说:大部分 MCP 能做的事 skill 也能做,而且更省 context。MCP 是给不想写代码的人准备的 abstraction layer。 但 abstraction 是有成本的——你省了写代码的时间,付出的是 context window。
“你们应该多用 Bash。” 过去几周,Anthropic 的 Thariq 和几十家做通用智能体的公司开了电话会议。邮件助手、客服机器人、日程管理——各种产品形态都有。聊完一圈,他发现自己反复在说同一句话。 Bash?那不是程序员用的命令行工具吗,和这些产品有什么关系? 先看一个具体场景。 假设你有一个邮件 Agent,你问它:“这周我在打车上花了多少钱?” 传统做法是这样的:Agent 调用 API 拉取邮件,可能一次性取回 100 封,然后让模型从里面找 Uber、Lyft 的收据,加总金额。 问题在于 100 封邮件塞进上下文,模型要同时记住这些内容,从中筛选、计算。这对大语言模型来说并不轻松。容易漏,容易错,而且你没法验证它到底看了哪些邮件。 这就是典型的模型舒适区问题:数据量不算大到需要专门写程序处理,但又超出了模型一次性硬算的能力范围。夹在中间,很尴尬。 Thariq 的方案是:给 Agent 一个 Bash 工具,让它把中间结果存成文件。 听起来很简单,但背后的逻辑很有意思。 传统的工具调用是这样的流程: 工具 → 模型处理 → 输出结果 所有中间状态都在模型的“脑子”里,你看不见,也没法检查。 换成 Bash 之后,流程变了: 工具 → 存文件 → 搜索/过滤 → 模型处理 → 输出结果 模型可以先把 100 封邮件存到一个文件里,然后用 grep 搜“Uber”,再 grep“Lyft”,分别统计。每一步都有迹可查,最后加总的时候,它还能回头检查自己的中间结果。 这带来三个能力升级: 可复现。同样的命令再跑一遍,结果一样。你可以调试,可以排查问题。 可验证。模型不是凭“记忆”给你答案,而是基于实际文件里的数据。你信不过的话,自己也能打开文件看一眼。 可组合。一个命令的输出可以作为下一个命令的输入,管道一接,复杂任务就能拆成简单步骤。 Bash 让 Agent 从“脑算”变成了“打草稿”。草稿可以留痕,可以检查,可以改。这对需要准确性的任务来说太重要了。 邮件搜索只是最直观的例子。Bash 的能力边界其实很宽。 链式 API 调用是个常见需求。比如“把这周我发过邮件的联系人都找出来”,这需要先拉邮件列表,提取收件人,去重,再逐个查询联系人详情。一连串操作用 Tool calls 来做,调用次数多,中间状态难管理。用 Bash 脚本串起来,逻辑清晰得多。 视频和文件处理也是 Bash 的强项。ffmpeg 这个命令行工具,模型用起来得心应手。找视频里某个片段、裁剪、转码,一行命令搞定。 还有定时任务。在 Agent 运行的容器里,用 cronjob 或 at 命令就能创建定时执行的任务。用户说“每天早上 8 点给我发一份新闻摘要”,Agent 可以自己设好闹钟。 这些场景有个共同点:都需要多步骤操作,都需要保存中间状态,都超出了单次工具调用的能力范围。 但 Bash 是把双刃剑。 能执行命令意味着能做很多事,也意味着能做很多危险的事。rm -rf 一不小心就能删光整个目录。如果 Agent 被恶意提示词攻击,后果可能很严重。 Anthropic 显然考虑到了这一点。他们在 Claude Agent SDK 里做了一套权限系统,包括 Bash 命令解析器和分级权限控制。哪些命令可以直接执行,哪些需要用户确认,哪些完全禁止,都可以配置。 我用 Claude Code 的体会是,这套权限系统确实降低了心理负担。它会在执行敏感操作前询问你,而不是闷头就干。但安全护栏不是万能药。权限系统本身也可能有漏洞,Bash 解析器也可能被绕过。 安全护栏是必需品,但不能因此就觉得万事大吉。 强调 Bash 的好处,也得说清楚它的边界。 如果任务足够简单,别用。“今天天气怎么样”这种一次性查询,直接调 API 返回结果就行,没必要存文件再处理。杀鸡用牛刀反而更慢。 如果环境是 Serverless 的,用不了。很多云函数运行时没有可持久化的文件系统,Bash 的“存中间结果”优势就没了。 如果对安全要求极高,谨慎使用。命令注入的风险无法百分之百消除,金融、医疗这类场景可能更适合用白名单式的专用工具,而非通用的 Bash。 工具的选择取决于场景,而不是工具本身的强弱。Bash 很强,但不是所有场合都该用。 回过头看,Thariq 这条建议的真正价值不是“Bash 很强”这个结论,而是背后的思维方式: 让 Agent 的思考过程“落地”到可检查的中间产物。 传统的 Agent 设计把所有东西都塞进模型的上下文,一锤子买卖。Bash 提供了另一种路径:把复杂任务拆开,每一步都留下痕迹,可以验证,可以回溯。 想想看,这和人类处理复杂问题的方式多像。我们做复杂计算时会列竖式,写长文章时会先拟提纲,处理大量信息时会做笔记。不是因为脑子记不住,而是因为落到纸上更可靠、更容易检查。 Agent 也一样。不是说模型处理不了,而是有中间产物的流程更值得信任。我自己用 Agent 辅助写作,所有中间产物都会存成文件:网络检索资料、提纲、不同版本的草稿、画图的提示词。这些存下来后续就可以灵活组合。 Bash 不只是程序员的工具,更是让 Agent 具备可验证、可复现、可审计能力的关键一环。
看到非常有趣三点! 1. Reconstruction Attacks 利用拆解将payload打散成无害片段,骗过Guardrail,完成攻击。 2. Output Obfuscation Attacks 用暗号或隐喻对攻击意图加密,LLM能领会,而Guardrail无法理解,从而完成攻击。 3. 对activation对另一种妙用。 相比于 Persona Vector 是用于 Steer,而在这里直接用作 Probe 来 Monitor模型生成的内在 Intent。
朋友圈转发: 自媒体的本质是精神控制。 我做了一个测试,用胡塞尔、海德格尔、尼采、福柯、列维纳斯等哲学家的观点制作一个“认知劫持”智能体,它的用处是当我输入视频脚本时,输出3种点击率最大化的封面配文和标题选项。 我选择了一个选项,修改了4天前发布的视频封面和标题,然后投放了75元的播放量薯条(让小红书推一波流验证我的新封面)。这期视频在发布的第3天新增播放量已经明显下跌,但修改后跑了1天,播放量又涨了3倍,互动数涨了3倍,评论数涨了4倍(我还删除拉黑了几个带节奏的),转发数涨了4倍,封面点击率从最低时5%涨到19%。 内容完全没变,只改了封面和标题。 那些与我素未谋面的人,他们的大脑只要发现特定文字排列组合后,就会神奇的触发某种神经机制,这促使他们把手指按到屏幕上,做出互动,甚至有的人还会花很长时间敲出长篇评论。 这让我意识到当我们滑动屏幕时,其实不仅仅是我们在选择内容,也是内容在塑造我们大脑的神经结构,重写我们的认知模式,目的是为了劫持我们的注意力。
Deepseek 又要在新年放大招啊 The Information 说会在 2 月中旬发布 V4 模型,而且编程能力可能会超过 Claude 和 Openai 在处理超长代码提示词方面有突破 https://t.co/HyJBoOZnQR
