Llama vs Mistral vs Qwen — どれを選べばよいですか？

Llama 3.1 8B は汎用オールラウンダーとして最適です。Mistral 7B は指示追従と推論が得意です。Qwen 2.5 14B は多言語タスクと長いコンテキストに最も優れています。コーディング専用なら、Devstral Small 2（同じく Mistral）が三者を上回ります。

Linux でローカル実行できるオープンソース LLM まとめ

Linux Lite の MyAI アシスタントでワンクリックインストールできる、キュレーション済みのオープンソース大規模言語モデルカタログです。すべてのモデルは Ollama 経由でローカル実行されます — クラウド不要、テレメトリなし、アカウント不要。サイズは Q4_K_M 量子化を前提とし、最小 VRAM は GPU アクセラレーションによる実用的な推論に必要な値です（VRAM が不足する場合は CPU＋RAM にフォールバックしますが、大幅に低速になります）。正式な仕様: /usr/share/myai/hardware-profiles.json。更新日: 2026/05/12。

なぜ LLM をローカルで実行するのか？

Linux 上でローカルに大規模言語モデルを実行すると、プロンプト・ファイル・会話内容がすべてマシン内に留まります。API キー不要、レート制限なし、サブスクリプションなし、センシティブなデータをサードパーティサーバーにアップロードする必要もありません。MyAI は、プライバシー・オフラインアクセス・使用するオープンソースモデルの完全なコントロールを望むユーザーにとって、最もシンプルな無料の ChatGPT 代替です — 普通のノートPCで動く Gemma 3 Mini（1B）のような小型言語モデル（SLM）から、ワークステーション GPU 向けの 70B 以上のフラッグシップモデルまで対応しています。

MyAI にはハードウェア対応の推薦エンジンが搭載されており、お使いの CPU・RAM・NVIDIA/AMD GPU・VRAM を検出し、実際に快適に動作するモデルだけを表示します。コーディング向けの最高の AI、文章作成、数学、エージェント型ワークフロー、または日常的な高速アシスタントのどれをお探しでも、下のキュレーション済みテーブルにすべてのティアに対応した厳選オプションがあります。

キュレーション済みオープンソース LLM カタログ

モデル	サイズ (Q4)	最小 VRAM	最小 RAM	備考
Gemma 3 Mini gemma3:1b	815 MB	—	4 GB	Google Google のコンパクトな 1B オープンソース LLM。どこでも高速動作し、古い Linux ノートPCでのカジュアルなチャットやオンデバイス AI に最適。 smallcpu-friendly
Llama 3.2 llama3.2:3b	2.0 GB	—	6 GB	Meta 3B のオールラウンダー。一般的な Linux デスクトップ向けのデフォルトオープンソース LLM として最適。速度と品質のバランスが優れている。 balanced
Mistral 7B mistral:7b	4.1 GB	6 GB	8 GB	Mistral AI 優れたオープンソースの推論・指示追従モデル。汎用的な文章作成や Q&A ワークフローで人気。 quality
GLM 4.7 Flash glm-4.7-flash	5.5 GB	6 GB	10 GB	Zhipu AI Zhipu AI による軽量な GLM 4.7「flash」バリアント。バランスの取れた品質で高速レスポンスに最適化 — テンポの良いチャットに最適。 balanced
Llama 3.1 8B llama3.1:8b	4.7 GB	6 GB	10 GB	Meta Meta のフラッグシップ小型モデル — サイズの割に非常に高性能。ミッドレンジハードウェアでのコーディング・文章作成・汎用 AI に最適。 quality
Qwen 2.5 14B qwen2.5:14b	9.0 GB	12 GB	16 GB	Alibaba 14B のオールラウンダー。長文コンテキスト・多言語プロンプト・数学に優れている。12 GB 以上の VRAM または大量の RAM が必要。 heavy
Devstral Small 2 devstral-small-2	14 GB	14 GB	28 GB	Mistral AI コード特化型 24B モデル — コーディングとエージェント型ワークフロー向けの最高のオープンソース AI。複数ファイルの編集やリファクタリングが得意。 quality
Gemma 2 27B gemma2:27b	16 GB	18 GB	32 GB	Google Google の中〜大型密モデル。ワークステーションスケールでの文章作成・要約・エッセイタスクに優れた品質を発揮。 largegpu-recommended
Mixtral 8x7B mixtral:8x7b	26 GB	28 GB	48 GB	Mistral AI Mixture-of-Experts（総計 47 B、トークンあたり約 13 B が活性化）。品質の割に高速 — 人気のローカル ChatGPT 代替。 largemoegpu-recommended
Llama 3.3 70B llama3.3:70b	43 GB	42 GB	64 GB	Meta Meta の 2024年後半リリース 70B オープンソース LLM。シングル 48 GB GPU でフロンティアに近い品質 — 実行できる最強のローカル Llama。 xlargegpu-only
Qwen 3.6 qwen3.6:latest	47 GB	44 GB	64 GB	Alibaba 最新の Qwen 3.6 リリース。強力な汎用・長文コンテキスト・多言語対応 — GPT クラスモデルへのトップオープンソース対抗馬。 xlargegpu-only
Mixtral 8x22B mixtral:8x22b	80 GB	80 GB	128 GB	Mistral AI 大型 Mixture-of-Experts（141 B）。ワークステーション／サーバークラス — 最大限の推論深度が必要な場合に最適。 xlargemoegpu-only

用途別おすすめオープンソース AI

コーディング向け最高の AI

Devstral Small 2（24B）はエージェント型コーディングと複数ファイルの編集でトップ。VRAM が少ない場合は Qwen 2.5 14B と Llama 3.1 8B が有力な次点候補。すべて無料、すべてローカル、すべてオープンソース。

文章作成向け最高の AI

Gemma 2 27B と Llama 3.3 70B が最も洗練された長文散文を生成します。普通のハードウェアでの日常的な文章作成なら、Mistral 7B はサイズ以上の実力を発揮します。

数学・推論向け最高の AI

Qwen 2.5 14B と Qwen 3.6 は数学・構造的推論・多言語タスクで突出しています。Mixtral 8x7B は最高の Mixture-of-Experts オプションです。

低スペックハードウェア向け最高の AI

Gemma 3 Mini（1B、約 815 MB）は GPU 不要で RAM 4 GB で動作 — カタログ内で最も軽量な信頼できる小型言語モデル。RAM が 6 GB あれば Llama 3.2（3B）がワンランク上の選択肢。

高速チャット向け最高の AI

GLM 4.7 Flash（Zhipu AI）はテンポの良いレスポンスに最適化されています。小型モデルでは Llama 3.2（3B）が優れたクイックリプライのデフォルトです。

最高の ChatGPT 代替

無料・プライベート・オフラインの ChatGPT 代替として: 24〜48 GB GPU なら Mixtral 8x7B、ワークステーションカードがあれば Llama 3.3 70B。アカウント不要、データはマシン外に出ない。

ティア	条件	推奨デフォルト	利用可能モデル
ライト	RAM < 6 GB、GPU なし	Gemma 3 Mini	1 モデル — Gemma 3 Mini
スタンダード	RAM 6〜15 GB、GPU なし	Llama 3.2	3 モデル — Llama 3.2 を追加
ゆとり CPU	RAM 16〜31 GB、GPU なし	Llama 3.2	5 モデル — Mistral 7B、GLM 4.7 Flash を追加
ワークステーション CPU	RAM 32 GB 以上、GPU なし	Llama 3.1 8B	7 モデル — Llama 3.1 8B、Qwen 2.5 14B を追加
GPU（小）	VRAM < 6 GB（単体または合計）	Llama 3.2	2 モデル — Gemma 3 Mini、Llama 3.2
GPU（中）	VRAM 6〜11 GB	Mistral 7B	6 モデル — Mistral 7B、GLM 4.7 Flash、Llama 3.1 8B を追加
GPU（高）	VRAM 12〜23 GB	Qwen 2.5 14B	8 モデル — Qwen 2.5 14B、Devstral Small 2 を追加
GPU（非常に高い）	VRAM 24〜47 GB	Mixtral 8x7B	10 モデル — Gemma 2 27B、Mixtral 8x7B を追加
GPU（エクストリーム）	VRAM 48 GB 以上	Llama 3.3 70B	全 13 モデル — Llama 3.3 70B、Qwen 3.6、Mixtral 8x22B を追加

よくある質問

ローカルで実行できるコーディング向け最高の AI は何ですか？

Devstral Small 2（24B）は Mistral のコード特化型オープンソースモデルで、エージェント型コーディング・コードレビュー・複数ファイルの編集に最適なローカルモデルです。VRAM が少ない場合は Llama 3.1 8B と Qwen 2.5 14B が有力な汎用代替候補です。いずれも Linux Lite の MyAI 経由でクラウドやアカウント不要で動作します。

Linux で LLM をローカル実行できますか？

はい。Linux Lite の MyAI は内部で Ollama を使用し、オープンソース LLM を完全にお使いのハードウェア上で実行します。Gemma 3 Mini のような小型モデルは RAM わずか 4 GB で CPU 上でも動作し、Llama 3.3 70B のような大型フラッグシップモデルはワークステーション GPU が必要です。MyAI のハードウェア対応ピッカーが、お使いのマシンで実際に動作するモデルを選択します。

2026年のベストなオープンソース LLM は何ですか？

ローカル推論向けの最強オープンソース LLM は Meta Llama 3.3 70B、Mistral Mixtral 8x7B / 8x22B、Google Gemma 2 27B、Alibaba Qwen 3.6、Mistral Devstral Small 2（コーディング最強）です。高速チャットには Zhipu GLM 4.7 Flash が優秀です。低スペックハードウェア向けの最高の小型言語モデル（SLM）は Gemma 3 Mini です。

Linux Lite で DeepSeek などの LLM をローカル実行するには？

MyAI には厳選されたモデルカタログが付属していますが、DeepSeek バリアントを含む任意の Ollama 互換モデルは、MyAI インストール後に ollama pull <model> で直接ダウンロードできます。推薦エンジンがお使いの CPU・RAM・GPU・VRAM に応じて利用可能なモデルを自動的に選択します。

ローカル LLM を実行するにはどのようなハードウェアが必要ですか？

小型言語モデル（1〜3B）: RAM 2〜6 GB、最新の CPU。中型モデル（7〜14B）: RAM 10〜16 GB または VRAM 6〜12 GB の GPU。大型モデル（27B〜70B+）: RAM 32 GB 以上と VRAM 18〜48 GB。MyAI はマルチ GPU の NVIDIA セットアップ（常時）と ROCm 対応 AMD カードの VRAM を合算します。

MCP（Model Context Protocol）とは何ですか？

MCP は 2024年に普及した、AI アシスタントを外部ツール・ファイル・データソースに接続するためのオープン標準です。MyAI は Ollama の HTTP API 経由でモデルをローカル実行しており、MCP 互換クライアントやエージェント型ワークフローが直接通信できます。これにより、クラウドを経由せずに自分のデータ上で動作するプライベート AI エージェントを構築できます。

MyAI は無料の ChatGPT 代替ですか？

はい。MyAI は無料のオープンソースで、すべて自分のコンピュータ上で動作します。アカウント不要。サブスクリプション不要。クラウド不要。テレメトリなし。最初のモデルダウンロード後は完全オフラインで動作します — データの所有権を重視するユーザーにとって、ChatGPT・Claude・Gemini の真のプライベート代替です。

Llama vs Mistral vs Qwen — どのオープンソース LLM を選べばよいですか？

Llama 3.1 8B は一般的なデスクトップ向けの最高の汎用オールラウンダーです。Mistral 7B は小型サイズで指示追従と推論が得意です。Qwen 2.5 14B / Qwen 3.6 は多言語タスク・長いコンテキスト・数学に最も優れています。コーディング専用なら、Devstral Small 2（同じく Mistral）が三者すべてを上回ります。

RAG（Retrieval-Augmented Generation）とは何ですか？

RAG はローカル LLM と自分のドキュメントに対する検索ステップを組み合わせることで、データをどこにもアップロードせずに自分のデータに基づいた質問に答えられるようにする技術です。MyAI は 127.0.0.1:7070 で Ollama の HTTP API を公開しており、任意の RAG フレームワーク（LangChain、LlamaIndex など）が完全ローカルの検索拡張ワークフローのターゲットとして使用できます。

MyAI はオフラインで動作しますか？

はい。ネットワーク通信は最初のモデルダウンロード時のみです（選択するモデルに応じて通常 0.6〜80 GB）。モデルがディスクに保存されると、MyAI は完全オフラインで動作します — チャット・コーディング支援・その他の AI タスクにインターネット接続は不要です。