🔥 Search Hot Tweets
Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.

宝玉
Claude Sonnet 4.5 新功能速览 Claude Sonnet 4.5 是我们迄今为止最适合用来构建复杂 AI 智能体 (AI Agent) 的模型,这些智能体可以长时间独立工作。它在编程能力上取得了前沿性的突破,在计算机使用方面达到了业界顶尖水平,并且在金融分析、网络安全和科学研究等领域的智能体应用中表现卓越。 相比 Sonnet 4 的主要升级 卓越的编程能力 Claude Sonnet 4.5 是我们目前最强的编程模型,在整个软件开发生命周期中都有显著提升: • SWE-bench 权威认证的性能:在多个编程基准测试中刷新了业界最高水平。 • 更强的规划与系统设计能力:能做出更优秀的软件架构决策和代码组织。 • 改进的安全工程实践:具备更稳健的安全实践能力和漏洞检测能力。 • 更精准的指令遵循:能更精确地遵循编程规范和需求。 开启“扩展思考”以获得最佳性能:当启用扩展思考功能时,Claude Sonnet 4.5 在处理编程任务时表现会大幅提升。该功能默认关闭,但我们强烈建议在处理复杂编程工作时开启它。请注意,开启扩展思考会影响提示词缓存的效率。具体配置方法请参见迁移指南。 智能体能力 Claude Sonnet 4.5 在 AI 智能体能力上实现了重大飞跃: • 更长的自主运行时间:Sonnet 4.5 可以连续数小时独立工作,同时保持思路清晰,专注于渐进式地完成任务。模型会稳扎稳打,一次处理几个任务,而不是试图一次性解决所有问题。它提供的进度更新都基于事实,能准确反映已完成的工作。 • 上下文感知:Claude 现在可以在整个对话过程中追踪自己的 Token 使用情况,并在每次工具调用后收到更新。这种感知能力有助于防止它过早放弃任务,并使其在执行长期任务时更加高效。技术细节请参见上下文感知,提示词编写建议请参见Claude 4 最佳实践。 • 更强的工具使用能力:模型能更有效地进行并行工具调用。例如,在研究时同时发起多个推测性搜索,或一次性读取多个文件以更快地建立背景信息。通过改进跨多个工具和信息源的协调能力,模型可以在智能体搜索和编程工作流中,有效地利用各种能力。 • 先进的上下文管理:Sonnet 4.5 在外部文件中保持着出色的状态追踪能力,即使跨越不同会话也能保持对目标的专注。结合更高效的上下文窗口利用率和我们新的上下文管理 API 功能,模型可以在长时间的会话中对信息进行最佳处理,始终保持连贯性。 沟通与互动风格 Claude Sonnet 4.5 拥有更加精炼的沟通方式,风格简洁、直接且自然。它会提供基于事实的进度更新,并且在工具调用后可能会跳过冗长的总结,以保持工作流程的顺畅(当然,这一点可以通过提示词进行调整)。 想了解如何更好地与这种沟通风格协作,请参阅 Claude 4 最佳实践。 创意内容生成 Claude Sonnet 4.5 在创意内容生成任务上表现出色: • 演示文稿和动画:在制作幻灯片和视觉内容方面,其表现与 Claude Opus 4.1 相当,甚至更优。 • 创意闪光:能够产出精美、专业的作品,并能很好地遵循指令。 • 一次成功的高质量:在初次尝试时就能生成设计精良、可直接使用的内容。 全新 API 功能 记忆工具 (Beta) 全新的记忆工具 (memory tool) 能让 Claude 在上下文窗口之外存储和检索信息: tools=[ { "type": "memory_20250818", "name": "memory" } ]
Est. 500 views for your reply
