Anthropic 推出 Claude Opus 4.7,把重點放在「更可靠地完成複雜任務」:推理、編碼、視覺理解與指令遵循都宣稱再進化。對企業與開發團隊來說,最重要的不是口號,而是:你能不能用可量化的方式,驗證它真的更好用、且更好控。 在 Opus 4.7 之前,Anthropic 已經用 Claude 3.7 Sonnet 打出「混合推理」與更強的工程協作(例如可在 API 控制思考時間、以及終端機導向的 Claude Code)這條路線,並在 SWE-bench 等測試上獲得相當亮眼的成績與討論度(例如報導提到 SWE-bench 70.3%)developer.cloud.tencent.com。Opus 4.7 若定位在更高階的旗艦能力,接下來就該用更嚴格的...