ローカル執行環境を構築した「設計者」の記録

未分類

はじめに

2026年、AI界隈は「ChatGPT 5.5」や「Claude 4.7」の登場で沸いています。しかし、私はあえて月額3,000円のサブスクを手放す道を選びました。 自作PCとローカルLLMを組み合わせ、AIを「サービス」として享受するのではなく、自分のマシンの「OSの一部」として組み込んだ記録をここに残します。


■ 1. 28GB VRAMが叩き出す「20 tokens/sec」の衝撃

私の環境は、個人クリエイターとして極限まで最適化したデュアルGPU構成です。

(図1:ハードウェア構成定義。LLMと画像生成の物理分離を明文化)
  • GPU 1 (AMD Radeon RX 9070 XT / 16GB): LLMおよびVLMの推論を専ら担当。
  • GPU 2 (NVIDIA GeForce RTX 3060 / 12GB): 画像生成(ComfyUI)やCUDA関連タスクを担当。

このハードウェア資産(計28GB VRAM)を、AIが直接操作できる環境こそが私の「武器」です。 実際に google/gemma-4-e4b を動かした際のログがこちらです。

Model loaded successfully in 5.16s. (5.89 GiB)

わずか5秒で知能が立ち上がり、実測値で 20.55 tokens/sec という速度を記録しました。これは、ローカルのエージェントとして十分すぎるほど実用的なレスポンス速度です。


■ 2. 「壁打ち」の果てに辿り着いた、クラウドとローカルの境界線

当初は「ChatGPT Plus」や「Claude Pro」への課金を検討し、秘書(AI)と徹底的に比較検討を行いました。

(図2:課金先を悩んでいた際の比較表。情緒か効率か、という視点で分析した)

しかし、対話の中で気づいたのは、「クラウドの砂場」ではなく「ローカルの書斎」にこそ、真の創造性があるということです。 クラウドAIは強力ですが、私のPCにある動画素材を直接整理したり、その場で ffmpeg を叩いて動画を書き出したりすることはできません。この「実環境への干渉力」の差が、サブスク卒業の決定打となりました。


■ 3. 実践:Claude Codeを100%ローカルで動かす「技術的アプローチ」

Claude Codeをクラウドから切り離し、完全にローカルで制御するために行った具体的な手順は以下の通りです。

① インフラ:LM StudioによるローカルAPIサーバーの構築

知能の供給源として「LM Studio」を採用し、Anthropic互換APIをローカルホスト(http://localhost:1234)で立ち上げます。これにより、Claude Codeは「クラウドのAnthropicサーバー」ではなく「自分のPCの1234ポート」へリクエストを送るようになります。

② 接続:環境変数のハック

ターミナル上でClaude Codeを起動する際、以下の環境変数を注入することで、接続先を強制的にローカルへ変更しました。

  • ANTHROPIC_BASE_URL=”http://localhost:1234″
  • ANTHROPIC_AUTH_TOKEN=”lmstudio”

③ 自動化:ワンクリックで知能をロードするバッチファイル

制作のリズムを崩さないよう、デスクトップに起動用バッチファイルを作成しました。

起動シーケンス:

  1. LM Studio GUI をバックグラウンドで起動。
  2. LM Studio Server を自動開始。
  3. モデルの自動ロード: lms load “google/gemma-4-e4b” コマンドを実行。
  4. Claude Code を起動し、effort high 設定で推論精度を確保。
(図3:LM StudioとClaude Codeの実動ログ。ローカルホスト経由での通信が成功している)

これにより、ログインやアップロードの手間なく、即座に作業を開始できる体制が整いました。

実行した内容


■ 4. CLAUDE.md:ローカル優先の鉄則

ローカル執行環境を維持するため、プロジェクトの直下には「ルール」としての CLAUDE.md を配備しています。

  • プライバシーの絶対保護: クラウドAPIへコード、画像、ログを送信しない。
  • OS・コマンドの最適化: Windows環境に合わせ、PowerShellを優先し、バックスラッシュ(\)形式のパスを使用する。
  • GPUの役割分担: LLM推論はAMD、画像生成はNVIDIAという「役割を混ぜない」運用を徹底。
  • エージェントの姿勢: ローカルモデルの特性に合わせ、「日本語で簡潔に」応答し、不要な推論を省かせる。

■ おわりに:ユーザーからアーキテクトへ

現在は、Google AI Plus (1,200円) を基盤に「知識(NotebookLM)」を確保しつつ、執行は100%ローカルで行うというハイブリッドな体制に落ち着いています。

AIを「使わせてもらっている」うちは、まだユーザーです。 AIを自分のPCの「一部品」として設計し、コントロール下に置く。その瞬間、あなたは真の「アーキテクト」になります。

不満が出るまでは、この自分だけの「城」で、制作中の「Black Prayer 魔法少女」の世界観を形にしていこうと思います。

コメント