過去数日間、Opus 4.8のテストを行ってきました。


Anthropicはこれに取り組んでいます。感心しています。
これまでの4.8アップデートに関する私の考えは以下の通りです*
• かなり遅いですが、賢いです。GPTのO3が最初にリリースされたときのことを思い出させます
• 推論努力をアプリ内で直接切り替えられるのは完全にゲームチェンジャーです。毎日これを使っており、「低」レベルをデフォルトにしても十分に感じます。
• 4.8はしばしば、自分ができると知っているタスクをできないと言います。これはおそらくAnthropicが幻覚問題を解決しようとしているためです。少しイライラします。
• Ultracode + 4.8は非常に優れています…ただしトークンを大量に消費します(予想通りです)
• ダイナミックワークフローは、このアップデートで私のお気に入りの機能です。プロンプトに直接「workflow」と入力するだけで簡単に展開できます。
• Claude Codeの4.8からの応答と通常のデスクトップの応答は大きく異なります。ほとんどの場合、デスクトップアプリでは4.8はより多く「ヘッジ」し、間違うことを恐れているように感じます。
• すべてのワークフローを4.7から4.8に切り替えました - 理由はありません(同じ価格です)し、4.8は客観的に賢いです。
全体として、これまでの4.8の体験は楽しいものでしたが、正直に言えば、5.6がそれを圧倒すると思います…
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め