もうAPI課金に怯えない！Antigravityの「推論」をローカルLLMに逃がすコスト削減術

2026年6月13日 11:49

こんにちは！高橋です(*'▽')
いつも記事を読んでいただき、ありがとうございます！

突然ですが、みなさんAntigravity IDEの「Settings - Models」の画面をじっくり見たことはありますか？

「Gemini 3.5 Flash」や「Claude Sonnet 4.6 (Thinking)」、さらには「GPT-OSS 120B」まで、最新の超強力なクラウドAIたちがズラリと並んでいて、見ているだけでワクワクしますよね。

カスタムモデルやAPI枠の管理も洗練されていて最高なのですが……
「あれ？自分のPCで動いてるローカルLLM（Ollamaとか）をメインモデルとして追加するボタンがなくない……？」と気づいた方も多いのではないでしょうか。

そうなんです。

以前も少し触れたことがあるのですが、
現在のAntigravityは、プロジェクト全体の文脈を理解する「司令塔」として、圧倒的な推論能力を持つクラウドの大型モデルを使う設計になっています。
そのため、設定UIからメインの頭脳をローカルLLMにまるごと差し替える機能は、今のところ用意されていません。

「じゃあ、AntigravityでローカルLLMは使えないの？」

いえいえ、諦めるのはまだ早いです！
メインモデルに指定できないなら、
「MCP（Model Context Protocol）」を使って、Antigravityの優秀なエージェントに「特化型ツール（外部の部下）」としてローカルLLMを認識させればいいんです！

今回は、あなたのPCのスペックに合わせた最適なローカルLLMの選び方から、Ollamaの導入、地味にハマりやすい設定ファイルの書き方。
そしてAntigravityとMCPで繋いで「API代完全無料で、動画（Sora/Kling）や音楽（Suno/Udio）の超ハイクオリティなプロンプトを無限に壁打ち生成する環境」を構築するまでを、一から十まで徹底的に解説します！

かなり長い内容ですので、ぜひお茶でも飲みながら一緒に手を動かしてみてくださいね！

1. なぜ「クラウド×ローカル」のハイブリッドなのか？

動画生成AI（Sora, Kling, Runway Gen-3など）や音楽生成AI（Suno, Udio）で神クオリティのコンテンツを作ろうとすると、
「情景の細かい指定」「カメラワーク」「ライティング」「音楽のジャンルタグ」「構成指示」を網羅した、長くて複雑な英語のプロンプトが必要になります。

これを人間が毎回ゼロから考えるのは大変なので、AIに考えてもらうのが一番手っ取り早いです。

しかし、納得がいくまで

「もっとサイバーパンク風にして」
「ドラムのキックを強める指示を入れて」

と何度もクラウドAI（Sonnet 4.6など）と壁打ちしていると、
あっという間に利用枠（Model Quota）を使い果たしたり、APIの従量課金が跳ね上がったりします。
（設定画面のトークン制限のバーが真っ黒になる恐怖、ありますよね……笑）

そこで役割分担です。

司令塔（Antigravity / クラウドLLM）：ファイル作成や全体のタスク進行、ユーザー（人間）との対話を担当。
作業員（Ollama / ローカルLLM）：APIコストを気にせず、英語プロンプトのアイデアを10パターンでも20パターンでも、手元のPCパワーだけで完全無料で大量生産する。

この「ハイブリッド運用」こそが、賢いAI使いのトレンドです！

2. 【PCスペック別】おすすめローカルLLM選定ガイド

ローカルLLMを動かすとなると、
「爆速のゲーミングPCやMac Studioが必要なんでしょ？」と思われがちですが、最近のモデルは軽量化が進んでいて、普通のノートPCでも十分に動きます。
特に今回は「プロンプト（英語テキスト）の生成」が目的なので、英語の表現力が豊かで、指示に従う能力（Instructionチューニング）が高い以下のモデルがおすすめです。

あなたのマシンスペックに合わせて選んでみてください！

💡 ライト層：メモリ 8GB 〜 16GB のPC

「手軽にローカルLLMを試してみたい」「普段使いのノートPCしか無い」という方は、3B〜7B（30億〜70億パラメータ）の超軽量モデルを選びましょう。

Llama 3.2 3B (Instruct)
- 特徴：Meta製。驚くほど軽量なのに、英語の指示理解力が非常に高いです。プロンプトのベースを作るならこれで十分サクサク動きます。
Qwen 2.5 7B (Instruct)
- 特徴：Alibaba製。同サイズ帯の中では圧倒的な性能を誇ります。多言語に強く、日本語で指示を出して「英語のプロンプト」を出力させる能力に長けています。

🚀 ミドル層：メモリ 32GB のPC（MacのProチップ、RTX 3060/4060/4070等のWindows）

グラフィックボードを搭載したPCや、Pro以上のMacをお持ちなら、一番実用的な8B〜14Bのモデルが快適に動かせます。

Llama 3.1 8B (Instruct)
- 特徴：世界中の開発者が基準にしている大定番モデル。英語のクリエイティブな表現力が素晴らしく、映画のようなカメラワークや、エモーショナルな音楽表現の英単語をバンバン出してくれます。
Qwen 2.5 14B (Instruct / 量子化版)
- 特徴：少し重いですが、VRAM 12GB前後のグラフィックボードに綺麗に収まるサイズ。賢さはクラウド級に片足を突っ込んでいます。

👑 ガチ勢：メモリ 64GB 〜 128GB以上のPC（Mac Studio、RTX 4090搭載Windows）

「ローカルこそ至高」というガチ環境の方は、クラウドモデルに匹敵する大型モデルをフルパワーで回しましょう。

Qwen 2.5 72B (Instruct / GGUF Q4_K_M) や Llama 3.1 70B
- 特徴：プロンプト生成だけでなく、小説の執筆や複雑なコード生成までローカルでこなせる化物モデル。圧倒的な語彙力で、生成AIが最も喜ぶ「刺さるプロンプト」を紡ぎ出してくれます。

3. 【導入方法】ステップバイステップで環境構築

それでは、実際に環境を作っていきましょう！手順は大きく分けて3つです。

ステップ1：Ollamaのインストールとモデルの準備

まずはローカルLLMを動かすためのエンジン「Ollama」を導入します。

Ollama公式サイト（ https://ollama.com ）にアクセスし、お使いのOS用のインストーラーをダウンロードしてインストールします。
インストールが完了したら、ターミナル（Windowsの場合はPowerShellやコマンドプロンプト）を開きます。

3. 今回はバランスの最高な Llama 3.1 (8B)をダウンロードしてみましょう。以下のコマンドを入力してEnterを押します。

  ollama run llama3.1

4、初回はモデルのダウンロードが始まります（数GBあるので数分待ちます）。ダウンロードが終わり、>>> というプロンプトが表示されれば、ローカルLLMの起動は成功です！

5、確認のために Hello! と打ってみてください。爆速で返答が来ればバッチリです。確認できたら /exit と打って一度終了します。
※Ollama自体はバックグラウンドで常駐（ポート11434で待機）しているので、ターミナルを閉じても大丈夫です。

ステップ2：AntigravityにMCP設定を仕込む

ここからが本番です！ Antigravityに外部ツール（MCPサーバー）としてOllamaを登録します。 MCPのエコシステムは非常に成熟しており、npx（Node.js）経由で一発でOllama用のMCPサーバーを起動できます。

PCに Node.js がインストールされていることを確認してください（まだの方はNode.js公式サイトから推奨版をいれておいてください）。
Antigravityを開き、今回の作業用フォルダ（例：prompt-factory）をワークスペースとして開きます。
ワークスペースのルート直下に、.antigravity というフォルダを作成し、その中に mcp_config.json というファイルを作成します。
mcp_config.json に、以下の設定を記述して保存します。

{
  "mcpServers": {
    "ollama-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-ollama",
        "--endpoint",
        "http://localhost:11434"
      ]
    }
  }
}

この設定を書くだけで、Antigravityのエージェントは「自分はOllamaっていうローカルAIをツールとして呼び出せるんだ！」と自動的に理解してくれます。MCP、本当に美しすぎる規格ですよね……！

4. 実践！「完全無料プロンプト生成器」を動かす

設定ができたら、Antigravityのエージェントチャット（Cmd + E または Ctrl + E）を開きましょう。
メインモデルは、設定画面にある「Gemini 3.5 Flash」や「Claude Sonnet 4.6」のままで大丈夫です。彼らには「監督（プロンプトマネージャー）」になってもらいます。

チャット欄に、以下の指示（システムプロンプトを兼ねた命令）を打ち込んでみてください。

🤖 エージェントへの指示プロンプト あなたは一流のAIコンテンツディレクターです。私の指示に従って、外部ツールであるローカルのOllama（llama3.1）をMCP経由で呼び出し、動画生成AIおよび音楽生成AI用のプロンプトを作成してください。

【今回のテーマ】
新しい動画作品を作りたいです。テーマは「近未来のネオ東京、雨の降るサイバーパンクな裏路地を悠然と歩く、サイボーグ化された三毛猫」です。【タスク】ローカルのOllamaに対し、「SoraやKlingで使える、カメラワークやライティング、ディテールにこだわった英語の動画プロンプトを3パターン」生成させてください。次に、その動画に合わせるBGMとして「Sunoで使えるLo-Fi / Synthwave風の音楽プロンプト（ジャンルタグと構成指示）」を2パターン生成させてください。Ollamaから返ってきた結果を整理し、このプロジェクトフォルダ内に generated_prompts.md という名前でマークダウンファイルとして綺麗に保存してください。

5. 【検証】実際に動かしてみた！感動の体験ドキュメント

プロンプトを入力して送信ボタンを押した瞬間、Antigravityのログ画面に心地よい動きが現れました。

[MCP] Calling tool: ollama-mcp/generate_text...

クラウドAI（監督）が「よし、じゃあ具体的な英語の書き出しは、手元のOllama（作業員）にやらせよう」と判断し、瞬時にMCP経由でローカルLLMにタスクを投げたのです！

私のMacBook Proのファンが「シュー…」と静かに回り始め、タスクマネージャーを見るとGPU/NPUがフル稼働しています。
クラウドのAPIトークン制限を消費していない、つまり「完全にタダで、自分のPCの電気代だけでAIが超高速で思考している」というこの全能感、一度味わうと癖になります（笑）。

数十秒後、Antigravityが「タスクが完了しました！ファイルを保存しました」と報告してきました。
生成された generated_prompts.md を開いてみると……そこには驚くべきクオリティのテキストが並んでいました。

📄 生成されたファイルの中身（一部抜粋）

# 🎬 Video Generation Prompts (for Sora / Kling)

## Pattern 1: Cinematic Alleyway Follow Shot
"Cinematic low-angle tracking shot following a cybernetic calico cat walking through a rain-slicked Neo-Tokyo backalley. Neon signs flashing in cyan, magenta, and electric amber reflecting on wet puddles. The cat has a subtle glowing prosthetic eye and metallic plating along its spine. Volumetric fog, steam rising from grates, high-tech dystopian atmosphere, photorealistic, 8k resolution, shot on 35mm lens."

## Pattern 2: Dramatic Macro & Neon Lighting
"Close-up macro shot of a sleek cybernetic calico cat's face. One eye is natural green, the other is an intricate glowing blue HUD lens spinning gently. Raindrops clinging to its whiskers and metallic fur. Background blurred with beautiful circular neon bokeh of futuristic Tokyo towers. Moody lighting, cyberpunk aesthetic, Unreal Engine 5 render quality, ultra-detailed."

---

# 🎵 Music Generation Prompts (for Suno)

## Track 1: Cyber-Rain Chillhop
- **Prompt (Style/Tags)**: lo-fi cyberpunk, retro synthwave, rainy mood, slow chillhop beat, nostalgic analog synthesizer, crisp vinyl crackle, 80bpm
- **Structure**: 
  [Intro: Distant rain and neon hum] -> [Verse: Soft melancholic synth melody with a fat lo-fi drum beat] -> [Chorus: Dreamy arpeggiator swells]

……完璧じゃないですか！？

「Cybernetic calico cat（サイボーグ化された三毛猫）」という表現や、「Neon signs flashing in cyan, magenta（シアンとマゼンタに点滅するネオン）」など、動画生成AIが最も得意とする具体的な色彩・機材（35mmレンズ、Unreal Engine 5など）のキーワードがこれでもかと盛り込まれています。

音楽プロンプトも、Sunoの文字数制限やタグの特性をしっかりと捉えた綺麗な構成になっています。

これをそのままSoraやSunoにコピペするだけで、自分の脳内にあるイメージがそのまま形になったようなハイクオリティなMVの素材が、一発で生成できてしまいました。

6. まとめ：制約をアイデアで超える楽しさ

今回の構成のポイントを振り返ると、以下のようになります。

UIに機能がなくても、MCPというオープンな規格を使えば、Antigravityの可能性は無限に広がる。
「考えるフェーズ（クラウド）」と「大量生産するフェーズ（ローカル）」を分けることで、クオリティを維持したままAPIコストを極限まで抑えられる。
PCスペックに合わせた適切なモデル（Llama 3.1やQwen 2.5）を選べば、どんな開発環境でも今すぐハイブリッドAIの恩恵を受けられる。

設定画面のモデル一覧にOllamaが追加できない仕様を見たときは「ちぇっ」と思ったものですが（笑）
こうしてMCPで繋いでみると、むしろ「最強のAI（ClaudeやGemini）が、自分のPCのローカルAIを部下としてコき使って成果物を作る」という、とんでもなく未来的で面白い開発体験を手に入れることができました。

ダミーデータの作成、長大なドキュメントの下書き、そして今回のプロンプト量産など、使い道は無限大です。
ぜひ皆さんも、眠っているPCのグラフィックボードや統合メモリを叩き起こして、自分だけの「完全無料プロンプトファクトリー」を構築してみてください！

今回は動画などを例としてあげてますが、別に制約はないのでウェブサイト作成や普段のお困りごとまでなんでもつかってみてくださいね♪

それでは今回はここまで(*'▽')ﾉｼ

いいなと思ったら応援しよう！

よろしければ応援お願いします！