Linux Lite の MyAI アシスタントでワンクリックインストールできる、キュレーション済みのオープンソース大規模言語モデルカタログです。すべてのモデルは Ollama 経由でローカル実行されます — クラウド不要、テレメトリなし、アカウント不要。サイズは Q4_K_M 量子化を前提とし、最小 VRAM は GPU アクセラレーションによる実用的な推論に必要な値です(VRAM が不足する場合は CPU+RAM にフォールバックしますが、大幅に低速になります)。正式な仕様: /usr/share/myai/hardware-profiles.json。更新日: 2026/05/12。
Linux 上でローカルに大規模言語モデルを実行すると、プロンプト・ファイル・会話内容がすべてマシン内に留まります。API キー不要、レート制限なし、サブスクリプションなし、センシティブなデータをサードパーティサーバーにアップロードする必要もありません。MyAI は、プライバシー・オフラインアクセス・使用するオープンソースモデルの完全なコントロールを望むユーザーにとって、最もシンプルな無料の ChatGPT 代替です — 普通のノートPCで動く Gemma 3 Mini(1B)のような小型言語モデル(SLM)から、ワークステーション GPU 向けの 70B 以上のフラッグシップモデルまで対応しています。
MyAI にはハードウェア対応の推薦エンジンが搭載されており、お使いの CPU・RAM・NVIDIA/AMD GPU・VRAM を検出し、実際に快適に動作するモデルだけを表示します。コーディング向けの最高の AI、文章作成、数学、エージェント型ワークフロー、または日常的な高速アシスタントのどれをお探しでも、下のキュレーション済みテーブルにすべてのティアに対応した厳選オプションがあります。
| モデル | サイズ (Q4) | 最小 VRAM | 最小 RAM | 備考 |
|---|---|---|---|---|
|
Gemma 3 Mini
gemma3:1b
|
815 MB | — | 4 GB |
Google
Google のコンパクトな 1B オープンソース LLM。どこでも高速動作し、古い Linux ノートPCでのカジュアルなチャットやオンデバイス AI に最適。
smallcpu-friendly
|
|
Llama 3.2
llama3.2:3b
|
2.0 GB | — | 6 GB |
Meta
3B のオールラウンダー。一般的な Linux デスクトップ向けのデフォルトオープンソース LLM として最適。速度と品質のバランスが優れている。
balanced
|
|
Mistral 7B
mistral:7b
|
4.1 GB | 6 GB | 8 GB |
Mistral AI
優れたオープンソースの推論・指示追従モデル。汎用的な文章作成や Q&A ワークフローで人気。
quality
|
|
GLM 4.7 Flash
glm-4.7-flash
|
5.5 GB | 6 GB | 10 GB |
Zhipu AI
Zhipu AI による軽量な GLM 4.7「flash」バリアント。バランスの取れた品質で高速レスポンスに最適化 — テンポの良いチャットに最適。
balanced
|
|
Llama 3.1 8B
llama3.1:8b
|
4.7 GB | 6 GB | 10 GB |
Meta
Meta のフラッグシップ小型モデル — サイズの割に非常に高性能。ミッドレンジハードウェアでのコーディング・文章作成・汎用 AI に最適。
quality
|
|
Qwen 2.5 14B
qwen2.5:14b
|
9.0 GB | 12 GB | 16 GB |
Alibaba
14B のオールラウンダー。長文コンテキスト・多言語プロンプト・数学に優れている。12 GB 以上の VRAM または大量の RAM が必要。
heavy
|
|
Devstral Small 2
devstral-small-2
|
14 GB | 14 GB | 28 GB |
Mistral AI
コード特化型 24B モデル — コーディングとエージェント型ワークフロー向けの最高のオープンソース AI。複数ファイルの編集やリファクタリングが得意。
quality
|
|
Gemma 2 27B
gemma2:27b
|
16 GB | 18 GB | 32 GB |
Google
Google の中〜大型密モデル。ワークステーションスケールでの文章作成・要約・エッセイタスクに優れた品質を発揮。
largegpu-recommended
|
|
Mixtral 8x7B
mixtral:8x7b
|
26 GB | 28 GB | 48 GB |
Mistral AI
Mixture-of-Experts(総計 47 B、トークンあたり約 13 B が活性化)。品質の割に高速 — 人気のローカル ChatGPT 代替。
largemoegpu-recommended
|
|
Llama 3.3 70B
llama3.3:70b
|
43 GB | 42 GB | 64 GB |
Meta
Meta の 2024年後半リリース 70B オープンソース LLM。シングル 48 GB GPU でフロンティアに近い品質 — 実行できる最強のローカル Llama。
xlargegpu-only
|
|
Qwen 3.6
qwen3.6:latest
|
47 GB | 44 GB | 64 GB |
Alibaba
最新の Qwen 3.6 リリース。強力な汎用・長文コンテキスト・多言語対応 — GPT クラスモデルへのトップオープンソース対抗馬。
xlargegpu-only
|
|
Mixtral 8x22B
mixtral:8x22b
|
80 GB | 80 GB | 128 GB |
Mistral AI
大型 Mixture-of-Experts(141 B)。ワークステーション/サーバークラス — 最大限の推論深度が必要な場合に最適。
xlargemoegpu-only
|
Devstral Small 2(24B)はエージェント型コーディングと複数ファイルの編集でトップ。VRAM が少ない場合は Qwen 2.5 14B と Llama 3.1 8B が有力な次点候補。すべて無料、すべてローカル、すべてオープンソース。
Gemma 2 27B と Llama 3.3 70B が最も洗練された長文散文を生成します。普通のハードウェアでの日常的な文章作成なら、Mistral 7B はサイズ以上の実力を発揮します。
Qwen 2.5 14B と Qwen 3.6 は数学・構造的推論・多言語タスクで突出しています。Mixtral 8x7B は最高の Mixture-of-Experts オプションです。
Gemma 3 Mini(1B、約 815 MB)は GPU 不要で RAM 4 GB で動作 — カタログ内で最も軽量な信頼できる小型言語モデル。RAM が 6 GB あれば Llama 3.2(3B)がワンランク上の選択肢。
GLM 4.7 Flash(Zhipu AI)はテンポの良いレスポンスに最適化されています。小型モデルでは Llama 3.2(3B)が優れたクイックリプライのデフォルトです。
無料・プライベート・オフラインの ChatGPT 代替として: 24〜48 GB GPU なら Mixtral 8x7B、ワークステーションカードがあれば Llama 3.3 70B。アカウント不要、データはマシン外に出ない。
| ティア | 条件 | 推奨デフォルト | 利用可能モデル |
|---|---|---|---|
| ライト | RAM < 6 GB、GPU なし | Gemma 3 Mini | 1 モデル — Gemma 3 Mini |
| スタンダード | RAM 6〜15 GB、GPU なし | Llama 3.2 | 3 モデル — Llama 3.2 を追加 |
| ゆとり CPU | RAM 16〜31 GB、GPU なし | Llama 3.2 | 5 モデル — Mistral 7B、GLM 4.7 Flash を追加 |
| ワークステーション CPU | RAM 32 GB 以上、GPU なし | Llama 3.1 8B | 7 モデル — Llama 3.1 8B、Qwen 2.5 14B を追加 |
| GPU(小) | VRAM < 6 GB(単体または合計) | Llama 3.2 | 2 モデル — Gemma 3 Mini、Llama 3.2 |
| GPU(中) | VRAM 6〜11 GB | Mistral 7B | 6 モデル — Mistral 7B、GLM 4.7 Flash、Llama 3.1 8B を追加 |
| GPU(高) | VRAM 12〜23 GB | Qwen 2.5 14B | 8 モデル — Qwen 2.5 14B、Devstral Small 2 を追加 |
| GPU(非常に高い) | VRAM 24〜47 GB | Mixtral 8x7B | 10 モデル — Gemma 2 27B、Mixtral 8x7B を追加 |
| GPU(エクストリーム) | VRAM 48 GB 以上 | Llama 3.3 70B | 全 13 モデル — Llama 3.3 70B、Qwen 3.6、Mixtral 8x22B を追加 |
Devstral Small 2(24B)は Mistral のコード特化型オープンソースモデルで、エージェント型コーディング・コードレビュー・複数ファイルの編集に最適なローカルモデルです。VRAM が少ない場合は Llama 3.1 8B と Qwen 2.5 14B が有力な汎用代替候補です。いずれも Linux Lite の MyAI 経由でクラウドやアカウント不要で動作します。
はい。Linux Lite の MyAI は内部で Ollama を使用し、オープンソース LLM を完全にお使いのハードウェア上で実行します。Gemma 3 Mini のような小型モデルは RAM わずか 4 GB で CPU 上でも動作し、Llama 3.3 70B のような大型フラッグシップモデルはワークステーション GPU が必要です。MyAI のハードウェア対応ピッカーが、お使いのマシンで実際に動作するモデルを選択します。
ローカル推論向けの最強オープンソース LLM は Meta Llama 3.3 70B、Mistral Mixtral 8x7B / 8x22B、Google Gemma 2 27B、Alibaba Qwen 3.6、Mistral Devstral Small 2(コーディング最強)です。高速チャットには Zhipu GLM 4.7 Flash が優秀です。低スペックハードウェア向けの最高の小型言語モデル(SLM)は Gemma 3 Mini です。
MyAI には厳選されたモデルカタログが付属していますが、DeepSeek バリアントを含む任意の Ollama 互換モデルは、MyAI インストール後に ollama pull <model> で直接ダウンロードできます。推薦エンジンがお使いの CPU・RAM・GPU・VRAM に応じて利用可能なモデルを自動的に選択します。
小型言語モデル(1〜3B): RAM 2〜6 GB、最新の CPU。中型モデル(7〜14B): RAM 10〜16 GB または VRAM 6〜12 GB の GPU。大型モデル(27B〜70B+): RAM 32 GB 以上と VRAM 18〜48 GB。MyAI はマルチ GPU の NVIDIA セットアップ(常時)と ROCm 対応 AMD カードの VRAM を合算します。
MCP は 2024年に普及した、AI アシスタントを外部ツール・ファイル・データソースに接続するためのオープン標準です。MyAI は Ollama の HTTP API 経由でモデルをローカル実行しており、MCP 互換クライアントやエージェント型ワークフローが直接通信できます。これにより、クラウドを経由せずに自分のデータ上で動作するプライベート AI エージェントを構築できます。
はい。MyAI は無料のオープンソースで、すべて自分のコンピュータ上で動作します。アカウント不要。サブスクリプション不要。クラウド不要。テレメトリなし。最初のモデルダウンロード後は完全オフラインで動作します — データの所有権を重視するユーザーにとって、ChatGPT・Claude・Gemini の真のプライベート代替です。
Llama 3.1 8B は一般的なデスクトップ向けの最高の汎用オールラウンダーです。Mistral 7B は小型サイズで指示追従と推論が得意です。Qwen 2.5 14B / Qwen 3.6 は多言語タスク・長いコンテキスト・数学に最も優れています。コーディング専用なら、Devstral Small 2(同じく Mistral)が三者すべてを上回ります。
RAG はローカル LLM と自分のドキュメントに対する検索ステップを組み合わせることで、データをどこにもアップロードせずに自分のデータに基づいた質問に答えられるようにする技術です。MyAI は 127.0.0.1:7070 で Ollama の HTTP API を公開しており、任意の RAG フレームワーク(LangChain、LlamaIndex など)が完全ローカルの検索拡張ワークフローのターゲットとして使用できます。
はい。ネットワーク通信は最初のモデルダウンロード時のみです(選択するモデルに応じて通常 0.6〜80 GB)。モデルがディスクに保存されると、MyAI は完全オフラインで動作します — チャット・コーディング支援・その他の AI タスクにインターネット接続は不要です。