🔥 Search Hot Tweets

Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.

Real-time Hot Tweet Analysis

9 10 11 12 13

Discord RSS

宝玉

@dotey· 135.7K followers

Claude Sonnet 4.5 新功能速览 Claude Sonnet 4.5 是我们迄今为止最适合用来构建复杂 AI 智能体 (AI Agent) 的模型，这些智能体可以长时间独立工作。它在编程能力上取得了前沿性的突破，在计算机使用方面达到了业界顶尖水平，并且在金融分析、网络安全和科学研究等领域的智能体应用中表现卓越。相比 Sonnet 4 的主要升级卓越的编程能力 Claude Sonnet 4.5 是我们目前最强的编程模型，在整个软件开发生命周期中都有显著提升： • SWE-bench 权威认证的性能：在多个编程基准测试中刷新了业界最高水平。 • 更强的规划与系统设计能力：能做出更优秀的软件架构决策和代码组织。 • 改进的安全工程实践：具备更稳健的安全实践能力和漏洞检测能力。 • 更精准的指令遵循：能更精确地遵循编程规范和需求。开启“扩展思考”以获得最佳性能：当启用扩展思考功能时，Claude Sonnet 4.5 在处理编程任务时表现会大幅提升。该功能默认关闭，但我们强烈建议在处理复杂编程工作时开启它。请注意，开启扩展思考会影响提示词缓存的效率。具体配置方法请参见迁移指南。智能体能力 Claude Sonnet 4.5 在 AI 智能体能力上实现了重大飞跃： • 更长的自主运行时间：Sonnet 4.5 可以连续数小时独立工作，同时保持思路清晰，专注于渐进式地完成任务。模型会稳扎稳打，一次处理几个任务，而不是试图一次性解决所有问题。它提供的进度更新都基于事实，能准确反映已完成的工作。 • 上下文感知：Claude 现在可以在整个对话过程中追踪自己的 Token 使用情况，并在每次工具调用后收到更新。这种感知能力有助于防止它过早放弃任务，并使其在执行长期任务时更加高效。技术细节请参见上下文感知，提示词编写建议请参见Claude 4 最佳实践。 • 更强的工具使用能力：模型能更有效地进行并行工具调用。例如，在研究时同时发起多个推测性搜索，或一次性读取多个文件以更快地建立背景信息。通过改进跨多个工具和信息源的协调能力，模型可以在智能体搜索和编程工作流中，有效地利用各种能力。 • 先进的上下文管理：Sonnet 4.5 在外部文件中保持着出色的状态追踪能力，即使跨越不同会话也能保持对目标的专注。结合更高效的上下文窗口利用率和我们新的上下文管理 API 功能，模型可以在长时间的会话中对信息进行最佳处理，始终保持连贯性。沟通与互动风格 Claude Sonnet 4.5 拥有更加精炼的沟通方式，风格简洁、直接且自然。它会提供基于事实的进度更新，并且在工具调用后可能会跳过冗长的总结，以保持工作流程的顺畅（当然，这一点可以通过提示词进行调整）。想了解如何更好地与这种沟通风格协作，请参阅 Claude 4 最佳实践。创意内容生成 Claude Sonnet 4.5 在创意内容生成任务上表现出色： • 演示文稿和动画：在制作幻灯片和视觉内容方面，其表现与 Claude Opus 4.1 相当，甚至更优。 • 创意闪光：能够产出精美、专业的作品，并能很好地遵循指令。 • 一次成功的高质量：在初次尝试时就能生成设计精良、可直接使用的内容。全新 API 功能记忆工具 (Beta) 全新的记忆工具 (memory tool) 能让 Claude 在上下文窗口之外存储和检索信息： tools=[ { "type": "memory_20250818", "name": "memory" } ]

44.3K

Posted 75d ago · Data updated 74d ago

Reply Suggestion

Est. 500 views for your reply