MyAI  ·  Linux Lite でオープンソース LLM をローカル実行

Linux Lite の MyAI アシスタントでワンクリックインストールできる、キュレーション済みのオープンソース大規模言語モデルカタログです。すべてのモデルは Ollama 経由でローカル実行されます — クラウド不要、テレメトリなし、アカウント不要。サイズは Q4_K_M 量子化を前提とし、最小 VRAM は GPU アクセラレーションによる実用的な推論に必要な値です(VRAM が不足する場合は CPU+RAM にフォールバックしますが、大幅に低速になります)。正式な仕様: /usr/share/myai/hardware-profiles.json。更新日: 2026/05/12。

なぜ LLM をローカルで実行するのか?

Linux 上でローカルに大規模言語モデルを実行すると、プロンプト・ファイル・会話内容がすべてマシン内に留まります。API キー不要、レート制限なし、サブスクリプションなし、センシティブなデータをサードパーティサーバーにアップロードする必要もありません。MyAI は、プライバシー・オフラインアクセス・使用するオープンソースモデルの完全なコントロールを望むユーザーにとって、最もシンプルな無料の ChatGPT 代替です — 普通のノートPCで動く Gemma 3 Mini(1B)のような小型言語モデル(SLM)から、ワークステーション GPU 向けの 70B 以上のフラッグシップモデルまで対応しています。

MyAI にはハードウェア対応の推薦エンジンが搭載されており、お使いの CPU・RAM・NVIDIA/AMD GPU・VRAM を検出し、実際に快適に動作するモデルだけを表示します。コーディング向けの最高の AI、文章作成、数学、エージェント型ワークフロー、または日常的な高速アシスタントのどれをお探しでも、下のキュレーション済みテーブルにすべてのティアに対応した厳選オプションがあります。

キュレーション済みオープンソース LLM カタログ
モデル サイズ (Q4) 最小 VRAM 最小 RAM 備考
Gemma 3 Mini
gemma3:1b
815 MB 4 GB Google   Google のコンパクトな 1B オープンソース LLM。どこでも高速動作し、古い Linux ノートPCでのカジュアルなチャットやオンデバイス AI に最適。
smallcpu-friendly
Llama 3.2
llama3.2:3b
2.0 GB 6 GB Meta   3B のオールラウンダー。一般的な Linux デスクトップ向けのデフォルトオープンソース LLM として最適。速度と品質のバランスが優れている。
balanced
Mistral 7B
mistral:7b
4.1 GB 6 GB 8 GB Mistral AI   優れたオープンソースの推論・指示追従モデル。汎用的な文章作成や Q&A ワークフローで人気。
quality
GLM 4.7 Flash
glm-4.7-flash
5.5 GB 6 GB 10 GB Zhipu AI   Zhipu AI による軽量な GLM 4.7「flash」バリアント。バランスの取れた品質で高速レスポンスに最適化 — テンポの良いチャットに最適。
balanced
Llama 3.1 8B
llama3.1:8b
4.7 GB 6 GB 10 GB Meta   Meta のフラッグシップ小型モデル — サイズの割に非常に高性能。ミッドレンジハードウェアでのコーディング・文章作成・汎用 AI に最適。
quality
Qwen 2.5 14B
qwen2.5:14b
9.0 GB 12 GB 16 GB Alibaba   14B のオールラウンダー。長文コンテキスト・多言語プロンプト・数学に優れている。12 GB 以上の VRAM または大量の RAM が必要。
heavy
Devstral Small 2
devstral-small-2
14 GB 14 GB 28 GB Mistral AI   コード特化型 24B モデル — コーディングとエージェント型ワークフロー向けの最高のオープンソース AI。複数ファイルの編集やリファクタリングが得意。
quality
Gemma 2 27B
gemma2:27b
16 GB 18 GB 32 GB Google   Google の中〜大型密モデル。ワークステーションスケールでの文章作成・要約・エッセイタスクに優れた品質を発揮。
largegpu-recommended
Mixtral 8x7B
mixtral:8x7b
26 GB 28 GB 48 GB Mistral AI   Mixture-of-Experts(総計 47 B、トークンあたり約 13 B が活性化)。品質の割に高速 — 人気のローカル ChatGPT 代替。
largemoegpu-recommended
Llama 3.3 70B
llama3.3:70b
43 GB 42 GB 64 GB Meta   Meta の 2024年後半リリース 70B オープンソース LLM。シングル 48 GB GPU でフロンティアに近い品質 — 実行できる最強のローカル Llama。
xlargegpu-only
Qwen 3.6
qwen3.6:latest
47 GB 44 GB 64 GB Alibaba   最新の Qwen 3.6 リリース。強力な汎用・長文コンテキスト・多言語対応 — GPT クラスモデルへのトップオープンソース対抗馬。
xlargegpu-only
Mixtral 8x22B
mixtral:8x22b
80 GB 80 GB 128 GB Mistral AI   大型 Mixture-of-Experts(141 B)。ワークステーション/サーバークラス — 最大限の推論深度が必要な場合に最適。
xlargemoegpu-only
用途別おすすめオープンソース AI

コーディング向け最高の AI

Devstral Small 2(24B)はエージェント型コーディングと複数ファイルの編集でトップ。VRAM が少ない場合は Qwen 2.5 14BLlama 3.1 8B が有力な次点候補。すべて無料、すべてローカル、すべてオープンソース。

文章作成向け最高の AI

Gemma 2 27BLlama 3.3 70B が最も洗練された長文散文を生成します。普通のハードウェアでの日常的な文章作成なら、Mistral 7B はサイズ以上の実力を発揮します。

数学・推論向け最高の AI

Qwen 2.5 14BQwen 3.6 は数学・構造的推論・多言語タスクで突出しています。Mixtral 8x7B は最高の Mixture-of-Experts オプションです。

低スペックハードウェア向け最高の AI

Gemma 3 Mini(1B、約 815 MB)は GPU 不要で RAM 4 GB で動作 — カタログ内で最も軽量な信頼できる小型言語モデル。RAM が 6 GB あれば Llama 3.2(3B)がワンランク上の選択肢。

高速チャット向け最高の AI

GLM 4.7 Flash(Zhipu AI)はテンポの良いレスポンスに最適化されています。小型モデルでは Llama 3.2(3B)が優れたクイックリプライのデフォルトです。

最高の ChatGPT 代替

無料・プライベート・オフラインの ChatGPT 代替として: 24〜48 GB GPU なら Mixtral 8x7B、ワークステーションカードがあれば Llama 3.3 70B。アカウント不要、データはマシン外に出ない。

ハードウェアティア対応表
ティア 条件 推奨デフォルト 利用可能モデル
ライト RAM < 6 GB、GPU なし Gemma 3 Mini 1 モデル — Gemma 3 Mini
スタンダード RAM 6〜15 GB、GPU なし Llama 3.2 3 モデル — Llama 3.2 を追加
ゆとり CPU RAM 16〜31 GB、GPU なし Llama 3.2 5 モデル — Mistral 7B、GLM 4.7 Flash を追加
ワークステーション CPU RAM 32 GB 以上、GPU なし Llama 3.1 8B 7 モデル — Llama 3.1 8B、Qwen 2.5 14B を追加
GPU(小) VRAM < 6 GB(単体または合計) Llama 3.2 2 モデル — Gemma 3 Mini、Llama 3.2
GPU(中) VRAM 6〜11 GB Mistral 7B 6 モデル — Mistral 7B、GLM 4.7 Flash、Llama 3.1 8B を追加
GPU(高) VRAM 12〜23 GB Qwen 2.5 14B 8 モデル — Qwen 2.5 14B、Devstral Small 2 を追加
GPU(非常に高い) VRAM 24〜47 GB Mixtral 8x7B 10 モデル — Gemma 2 27B、Mixtral 8x7B を追加
GPU(エクストリーム) VRAM 48 GB 以上 Llama 3.3 70B 全 13 モデル — Llama 3.3 70B、Qwen 3.6、Mixtral 8x22B を追加
よくある質問
ローカルで実行できるコーディング向け最高の AI は何ですか?

Devstral Small 2(24B)は Mistral のコード特化型オープンソースモデルで、エージェント型コーディング・コードレビュー・複数ファイルの編集に最適なローカルモデルです。VRAM が少ない場合は Llama 3.1 8BQwen 2.5 14B が有力な汎用代替候補です。いずれも Linux Lite の MyAI 経由でクラウドやアカウント不要で動作します。

Linux で LLM をローカル実行できますか?

はい。Linux Lite の MyAI は内部で Ollama を使用し、オープンソース LLM を完全にお使いのハードウェア上で実行します。Gemma 3 Mini のような小型モデルは RAM わずか 4 GB で CPU 上でも動作し、Llama 3.3 70B のような大型フラッグシップモデルはワークステーション GPU が必要です。MyAI のハードウェア対応ピッカーが、お使いのマシンで実際に動作するモデルを選択します。

2026年のベストなオープンソース LLM は何ですか?

ローカル推論向けの最強オープンソース LLM は Meta Llama 3.3 70BMistral Mixtral 8x7B / 8x22BGoogle Gemma 2 27BAlibaba Qwen 3.6Mistral Devstral Small 2(コーディング最強)です。高速チャットには Zhipu GLM 4.7 Flash が優秀です。低スペックハードウェア向けの最高の小型言語モデル(SLM)は Gemma 3 Mini です。

Linux Lite で DeepSeek などの LLM をローカル実行するには?

MyAI には厳選されたモデルカタログが付属していますが、DeepSeek バリアントを含む任意の Ollama 互換モデルは、MyAI インストール後に ollama pull <model> で直接ダウンロードできます。推薦エンジンがお使いの CPU・RAM・GPU・VRAM に応じて利用可能なモデルを自動的に選択します。

ローカル LLM を実行するにはどのようなハードウェアが必要ですか?

小型言語モデル(1〜3B): RAM 2〜6 GB、最新の CPU。中型モデル(7〜14B): RAM 10〜16 GB または VRAM 6〜12 GB の GPU。大型モデル(27B〜70B+): RAM 32 GB 以上と VRAM 18〜48 GB。MyAI はマルチ GPU の NVIDIA セットアップ(常時)と ROCm 対応 AMD カードの VRAM を合算します。

MCP(Model Context Protocol)とは何ですか?

MCP は 2024年に普及した、AI アシスタントを外部ツール・ファイル・データソースに接続するためのオープン標準です。MyAI は Ollama の HTTP API 経由でモデルをローカル実行しており、MCP 互換クライアントやエージェント型ワークフローが直接通信できます。これにより、クラウドを経由せずに自分のデータ上で動作するプライベート AI エージェントを構築できます。

MyAI は無料の ChatGPT 代替ですか?

はい。MyAI は無料のオープンソースで、すべて自分のコンピュータ上で動作します。アカウント不要。サブスクリプション不要。クラウド不要。テレメトリなし。最初のモデルダウンロード後は完全オフラインで動作します — データの所有権を重視するユーザーにとって、ChatGPT・Claude・Gemini の真のプライベート代替です。

Llama vs Mistral vs Qwen — どのオープンソース LLM を選べばよいですか?

Llama 3.1 8B は一般的なデスクトップ向けの最高の汎用オールラウンダーです。Mistral 7B は小型サイズで指示追従と推論が得意です。Qwen 2.5 14B / Qwen 3.6 は多言語タスク・長いコンテキスト・数学に最も優れています。コーディング専用なら、Devstral Small 2(同じく Mistral)が三者すべてを上回ります。

RAG(Retrieval-Augmented Generation)とは何ですか?

RAG はローカル LLM と自分のドキュメントに対する検索ステップを組み合わせることで、データをどこにもアップロードせずに自分のデータに基づいた質問に答えられるようにする技術です。MyAI は 127.0.0.1:7070 で Ollama の HTTP API を公開しており、任意の RAG フレームワーク(LangChain、LlamaIndex など)が完全ローカルの検索拡張ワークフローのターゲットとして使用できます。

MyAI はオフラインで動作しますか?

はい。ネットワーク通信は最初のモデルダウンロード時のみです(選択するモデルに応じて通常 0.6〜80 GB)。モデルがディスクに保存されると、MyAI は完全オフラインで動作します — チャット・コーディング支援・その他の AI タスクにインターネット接続は不要です。