AIツール SPECIAL REPORT — Vol.16782

Claude Fable 5とは何が違うのか|GPT-5.5・Gemini比較と導入判断の視点【2026年6月】

Claude Fable 5(2026年6月9日発表)の解説。Opusの上に新設されたMythos級の一般公開版という位置づけ、100万トークンのコンテキストや安全フォールバック機構、GPT-5.5・Gemini・Grokとの比較、価格(入力$10/出力$50)とZDR非対応など導入前の注意点を、中堅企業の経営者向けに公開情報で整理します。

編集部 / biz-trend.works
| 2026.06.11 公開 | 読了 11分
Claude Fable 5とは何が違うのか|GPT-5.5・Gemini比較と導入判断の視点【2026年6月】
Photo by BizTrend 編集部 / 2026.06.11

【情報提供】本記事は公開情報に基づく解説記事です。価格・仕様・ベンチマークは変動するため、最新情報は各社公式ページでご確認ください。ベンチマーク数値の多くはAnthropic公表値および第三者まとめの転載で、独立した再現検証は現時点で限定的です。

Claude Fable 5(クロード・フェイブル5)は、Anthropicが2026年6月9日に発表した新しいAIモデルです。従来の「Opus/Sonnet/Haiku」という3階層の上に「Mythos級」という新階層を設けた、同社が一般提供する中で最上位のモデルと位置づけられています。本記事は、中堅企業の経営者・CFOがAI導入やツール選定を判断するために、Fable 5を価格・性能・安全性・用途・コスパの5つの角度から、GPT-5.5・Gemini・Grok・DeepSeekと横断比較します。この1本で全体像がつかめる構成です。関連情報はAIツールカテゴリもあわせてご覧ください。

結論(先に3行):Fable 5は「人手なら数日かかる複雑で長い仕事」専用の最上位モデルで、ソフトウェア開発系のベンチマークでは他社に大差をつけます。ただし価格は従来上位モデルの2倍($10/$50)で、安全フィルタの誤検知やデータ保持の制約もあります。全業務を置き換えるのではなく、重いタスクだけに投入し、定型処理は安いモデルに残す使い分けがコスト効率の要点です。

30秒で分かる早見表

細部に入る前に、主要な論点を一覧にまとめます。各項目は本文で詳しく解説します。

論点 要点
発表 2026年6月9日・Anthropic。「Mythos級」の一般公開版
強み 長く複雑なタスクの完遂力。ソフト開発系ベンチで首位
弱み 科学知識系は他社が上。価格が高い。安全フィルタの誤検知報告
価格 入力$10/出力$50(100万トークン)。Opus 4.8の2倍
容量 コンテキスト100万トークン・最大出力12.8万トークン
向く用途 大規模移行・長文書の横断分析・多段の自律タスク
注意 ゼロデータ保持(ZDR)不可・30日保持固定

Claude Fable 5とは ― 「Mythos級」という新階層

Anthropicの公式発表によると、Fable 5は「Mythos級モデルを一般利用向けに安全化したもの」です。同時に発表されたClaude Mythos 5は同一の基盤モデルで、一部の安全装置を外した版が米政府連携プログラム経由で限定提供されます。名前の違い(Mythos/Fable)は能力差ではなくセーフガードの有無を表します。

重要なのは、これがOpus/Sonnet/Haikuの置き換えではない点です。従来の3階層の「上」に新しい階層が増えました。下の図でモデルの位置関係を整理します。

Claudeモデルの階層とFable 5の位置づけ(2026年6月) Mythos 5(限定提供) 一部の安全装置なし・同一の基盤モデル 政府連携の限定グループのみ Fable 5(一般公開・本記事の主役) 安全分類器を組み込み・$10/$50 1Mコンテキスト・128K出力 高リスク要求は下位へ委譲 Opus 4.8(フォールバック先・$5/$25) 拒否時はここが応答を引き継ぐ 従来の3階層:Opus(高性能)/ Sonnet(バランス)/ Haiku(高速・低価格) 置き換えではなく、この上に「Mythos級」が新設された
FableとMythosは同一の基盤モデル。違いは安全装置の有無で、Fable 5は高リスク要求をOpus 4.8へ自動的に委ねる(Anthropic公式発表を基に作図)

角度1:主要5モデルの横断スペック比較

2026年前半は各社がフラッグシップを更新しました。Fable 5を含む主要5モデルの基本スペックを並べます。価格は100万トークンあたり、各社公式・報道ベースです。

モデル 提供元 価格(入力/出力) コンテキスト 打ち出す軸
Claude Fable 5 Anthropic $10 / $50 100万 長時間タスクの完遂+安全機構
GPT-5.5 OpenAI $5 / $30 非公開(長文対応) 多段エージェント処理と効率
Gemini 3.1 Pro Google 公式価格を参照 100万 マルチモーダルと配布規模
Grok 4.3 xAI $1.25 / $2.50 大容量対応 低価格とツール呼び出し
DeepSeek V4 DeepSeek $0.14〜 / $0.28〜 100万 低価格+オープンウェイト

価格だけを見るとFable 5は最も高く、DeepSeek V4とは入力で約70倍の開きがあります。「高い=常に最良」ではなく、仕事の性質に対して価格が見合うかが判断軸になります。次の性能比較とあわせて読むと、その理由が見えてきます。

角度2:ベンチマークの多角比較(得意と不得意)

性能は単一の指標では測れません。ここでは性質の異なる3つの指標で比較します。ソフトウェア開発(SWE-bench Pro)、科学知識(GPQA Diamond)、誤情報の少なさ(幻覚率)の3軸です。

まずソフトウェア開発系の指標を棒グラフで見ます。これはFable 5が最も得意とする領域です。

SWE-bench Pro スコア比較(ソフトウェア開発・高いほど良い) 80.3% Fable 5 69.2% Opus 4.8 58.6% GPT-5.5 54.2% Gemini 3.1 Pro
SWE-bench Pro(実際のソフトウェア課題の解決率)。Fable 5が80%超で首位。数値はAnthropic公表値と第三者まとめ(Eden AI等)による(2026年6月時点・対象期は各社公表時)

一方で、Fable 5が負けている軸もあります。下の表は3つの指標を横断したものです。科学知識を問うGPQA Diamondでは、GeminiとGPT-5.5がFable 5を上回ります。すべての軸で一方的に勝つモデルは存在しません。

指標(性質) Fable 5 GPT-5.5 Gemini 3.1 Pro 読み方
SWE-bench Pro(ソフト開発) 80.3% 58.6% 54.2% Fableが大差で首位
GPQA Diamond(科学知識) 91.3% 92.8% 94.3% Geminiが首位・Fableは3番手
幻覚率(低いほど良い) 約36% 約86% 約50% Claude系が最も誤りが少ない

この表が示すのは、「コードや長い実務タスクならFable 5、最新の科学知識ならGemini、誤情報を避けたいならClaude系」という棲み分けです。幻覚率(事実でないことを断定する割合)が低いのは、ビジネス文書や調査で重要な特性です。

角度3:Fable 5固有の安全機構という違い

Fable 5を従来モデルと最も分けるのが、組み込みの安全機構です。サイバーセキュリティ・生物・化学などの高リスクと判定された要求には応答せず、下位のOpus 4.8に処理を委ねます。この流れを図にします。

リクエストが処理される流れ 利用者の リクエスト 安全分類器が 高リスクか判定 (発動は5%未満に調整) 通常:Fable 5が応答 複雑な仕事ほど真価を発揮 高リスク:Opus 4.8へ委譲 拒否はエラーでなく仕様 企業利用の注意点 分類器は意図的に過剰ブロック側へ調整されており、医療・研究・セキュリティ監査などで 無害な依頼が誤って拒否される報告がある(The Register・公式GitHub Issue)。自社業務で要検証。
高リスクと判定された要求はOpus 4.8に委ねられる。拒否時もエラーではなく仕様として扱われる(Anthropic公式発表・コミュニティ報告を基に作図)

Anthropicは発動頻度を「セッションの5%未満」と説明しています。ただしリリース直後のコミュニティでは、医療・研究分野の無害な専門用語で誤検知が起きるという報告が複数挙がっています。Anthropic自身も、意図的に過剰ブロック側に振った上で誤検知を削減中と認めています。

角度4:料金とコスパ ― タスク別の最適モデル

価格はOpus 4.8(入力$5/出力$25)のちょうど2倍です。個人・チーム向けサブスクリプションでは、Anthropicの発表によると2026年6月22日まで追加費用なしで利用でき、6月23日以降は利用クレジット制に移行する予定です。最新の条件は公式ページでご確認ください。

コスト管理の要点は「品質基準を満たす中で最も安いモデルを使う」という考え方です。仕事の性質ごとに最適なモデルは変わります。固定費としてのIT投資を考える視点は経営・固定費カテゴリでも扱っています。

仕事の種類 推奨モデル帯 理由
大規模システム移行・長文書の横断分析 Fable 5 途中で人が割り込まずに完遂してほしい重い仕事
レポート作成・複数ステップの調査 Fable 5 または Opus 複雑さに応じて使い分け
メール下書き・議事録要約 Sonnet バランス型で十分・コストは数分の1
分類・FAQ応答・定型抽出 Haiku など軽量 大量処理は最も安いモデルで品質が足りる

角度5:実務での評価と企業導入の注意点

開発者コミュニティの実測レビューでは「遅く高価だが、投げた仕事はほぼこなす」という評価が代表的です(Simon Willison氏)。金融分野ではシニアレベルの推論を測るベンチマークで全モデル中トップのスコアが報告され、リーガルAIのHarveyが即日対応するなど、専門ツール側の採用も始まっています。

一方で、企業が導入する前に確認すべき点を整理します。性能の高さだけで判断すると、運用段階でつまずきます。

確認項目 内容と対応
コスト構造 API・サブスクとも消費が約2倍。定型処理は下位モデルに残す前提で試算する
データ保持(ZDR) ゼロデータ保持の契約が不可・30日保持が固定。顧客データ要件が厳しい企業は契約部門の確認が前提
安全フィルタの誤検知 専門領域で無害な依頼が拒否される報告あり。自社の業務領域で小さく試してから広げる
日本語性能 定量ベンチは未整備。国内の定性評価では従来上位より良いとの報告だが、自社タスクで確認を推奨

中堅企業はどう向き合うべきか

使い分けの結論:Fable 5に任せるのは、大規模な移行や長大な資料の横断分析など「途中で人が割り込まずに完遂してほしい重い仕事」に限定します。日常の定型処理は下位モデルに流すと、コストを数分の1に抑えられます。モデルは数ヶ月で世代交代するため、特定モデルへの固定投資より「タスクごとに最適なモデルへ切り替えられる体制」を作るほうが、料金面でも品質面でも有利です。

具体的には、まず自社の業務を「重い知的タスク」と「定型・大量処理」に仕分けることから始めます。前者だけをFable 5やOpusに、後者はSonnetやHaiku、あるいは低価格な他社モデルに振り分けます。AIツールの選定軸はAIツールカテゴリ、IT投資の進め方はDX・ITカテゴリの記事でも扱っています。

よくある質問(FAQ)

Q. Fable 5は今までのClaudeより常に良いのですか。
いいえ。長く複雑なタスクでは優位ですが、科学知識など他社が上回る軸もあります。仕事の性質しだいで最適なモデルは変わります。

Q. 価格が高いぶん、すべてをFable 5にすべきですか。
おすすめしません。定型処理は下位モデルで品質が足りることが多く、消費が約2倍のFable 5を使うとコストだけが膨らみます。

Q. 安全フィルタで仕事が止まることはありますか。
高リスクと判定された要求は下位モデルに委ねられます。医療や研究など一部領域で無害な依頼が誤って拒否される報告があるため、自社業務で事前に検証してください。

Q. 顧客データを扱っても大丈夫ですか。
ゼロデータ保持(ZDR)の契約が使えず30日保持が固定のため、データ要件が厳しい場合はコンプライアンス部門の確認が前提になります。

まとめ ― この記事の要点

  • Fable 5は2026年6月9日発表。Opusの上の「Mythos級」一般公開版で、名前の違いは安全装置の有無を表す
  • 得意=ソフト開発・長時間タスク(SWE-bench Proで80%超・首位)、不得意=科学知識系(Gemini等が上)
  • 幻覚率はClaude系が最も低く、ビジネス文書・調査に向く
  • 価格はOpus 4.8の2倍($10/$50)。安全フィルタの誤検知とZDR非対応は導入前に点検しておきたい
  • 結論は「品質基準を満たす最も安いモデルを使う」。重い仕事だけFable 5、定型は下位モデルへ

主な出典

※本文中の価格・ベンチマーク数値は上記の公式発表・公式ドキュメント・第三者まとめを出典とし、対象時点(2026年6月時点)を併記しています。ベンチマークの多くはAnthropic公表値の転載であり、独立した再現検証は現時点で限定的です。各社の価格・仕様は変動します。

本記事は公開情報に基づく情報提供であり、特定製品の導入成果を約束するものではありません。導入判断の際は各社公式ページの最新情報をご確認ください。

本記事は2026年6月時点の情報に基づいています。



CONTINUE READING

経営判断に「比較の知性」を。
次の一本を、読み進める。