Katalog pilihan model bahasa besar open-source yang dapat Anda instal dengan satu klik di asisten MyAI Linux Lite. Semua model berjalan secara lokal melalui Ollama — tanpa cloud, tanpa telemetri, tanpa akun. Ukuran mengasumsikan kuantisasi Q4_K_M; VRAM minimum adalah untuk inferensi yang dipercepat GPU (VRAM lebih rendah akan beralih ke CPU+RAM, jauh lebih lambat). Sumber kebenaran: /usr/share/myai/hardware-profiles.json. Diperbarui 12/05/26.
Menjalankan model bahasa besar secara lokal di Linux berarti prompt, file, dan percakapan Anda tidak pernah meninggalkan mesin. Tidak ada kunci API, tidak ada batas laju, tidak ada langganan, dan tidak ada unggahan data sensitif ke server pihak ketiga. MyAI adalah alternatif ChatGPT gratis paling sederhana bagi pengguna yang menginginkan privasi, akses offline, dan kontrol penuh atas model open-source yang mereka gunakan — mulai dari model bahasa kecil (SLM) seperti Gemma 3 Mini (1B) yang berjalan di laptop dasar, hingga model 70B+ unggulan di GPU workstation.
MyAI hadir dengan mesin rekomendasi berbasis perangkat keras yang mendeteksi CPU, RAM, GPU NVIDIA/AMD, dan VRAM Anda, lalu hanya menampilkan model yang benar-benar akan berjalan dengan baik. Baik Anda mencari AI terbaik untuk coding, menulis, matematika, alur kerja agentik, atau asisten cepat sehari-hari, tabel kurasi di bawah ini memiliki pilihan yang tepat untuk setiap tingkatan.
| Model | Ukuran (Q4) | VRAM Min | RAM Min | Catatan |
|---|---|---|---|---|
|
Gemma 3 Mini
gemma3:1b
|
815 MB | — | 4 GB |
Google
LLM open-source 1B kompak dari Google. Cepat di mana saja, ideal untuk obrolan kasual dan AI on-device di laptop Linux lama.
smallcpu-friendly
|
|
Llama 3.2
llama3.2:3b
|
2.0 GB | — | 6 GB |
Meta
Serba guna 3B. LLM open-source default terbaik untuk desktop Linux biasa. Keseimbangan kecepatan dan kualitas yang bagus.
balanced
|
|
Mistral 7B
mistral:7b
|
4.1 GB | 6 GB | 8 GB |
Mistral AI
Penalaran dan mengikuti instruksi open-source yang kuat. Favorit untuk penulisan serba guna dan alur kerja tanya jawab.
quality
|
|
GLM 4.7 Flash
glm-4.7-flash
|
5.5 GB | 6 GB | 10 GB |
Zhipu AI
Varian GLM 4.7 "flash" ringan dari Zhipu AI. Dioptimalkan untuk respons cepat dengan kualitas seimbang — bagus untuk obrolan responsif.
balanced
|
|
Llama 3.1 8B
llama3.1:8b
|
4.7 GB | 6 GB | 10 GB |
Meta
Model kecil unggulan Meta — sangat mampu untuk ukurannya. Pilihan kuat untuk coding, menulis, dan AI serba guna di perangkat keras kelas menengah.
quality
|
|
Qwen 2.5 14B
qwen2.5:14b
|
9.0 GB | 12 GB | 16 GB |
Alibaba
Serba guna 14B. Sangat baik untuk konteks panjang, prompt multibahasa, dan matematika. Membutuhkan VRAM 12 GB+ atau RAM yang banyak.
heavy
|
|
Devstral Small 2
devstral-small-2
|
14 GB | 14 GB | 28 GB |
Mistral AI
Model 24B fokus kode — AI open-source terbaik untuk coding dan alur kerja agentik. Kuat dalam pengeditan multi-file dan refactoring.
quality
|
|
Gemma 2 27B
gemma2:27b
|
16 GB | 18 GB | 32 GB |
Google
Model dense menengah-besar dari Google. Kualitas sangat baik untuk penulisan, peringkasan, dan tugas esai di skala workstation.
largegpu-recommended
|
|
Mixtral 8x7B
mixtral:8x7b
|
26 GB | 28 GB | 48 GB |
Mistral AI
Mixture-of-experts (47 B total, ~13 B aktif per token). Cepat untuk kualitasnya — alternatif ChatGPT lokal yang populer.
largemoegpu-recommended
|
|
Llama 3.3 70B
llama3.3:70b
|
43 GB | 42 GB | 64 GB |
Meta
LLM open-source 70B Meta akhir 2024. Kualitas mendekati frontier di GPU 48 GB tunggal — Llama lokal terkuat yang bisa Anda jalankan.
xlargegpu-only
|
|
Qwen 3.6
qwen3.6:latest
|
47 GB | 44 GB | 64 GB |
Alibaba
Rilis Qwen 3.6 terbaru. Serba guna yang kuat, konteks panjang, multibahasa — pesaing open-source teratas untuk model kelas GPT.
xlargegpu-only
|
|
Mixtral 8x22B
mixtral:8x22b
|
80 GB | 80 GB | 128 GB |
Mistral AI
Mixture-of-experts besar (141 B). Kelas workstation/server — terbaik saat Anda membutuhkan kedalaman penalaran maksimum.
xlargemoegpu-only
|
Devstral Small 2 (24B) unggul untuk coding agentik dan pengeditan multi-file. Qwen 2.5 14B dan Llama 3.1 8B adalah pilihan runner-up yang kuat saat VRAM terbatas. Semua gratis, semua lokal, semua open-source.
Gemma 2 27B dan Llama 3.3 70B menghasilkan prosa panjang yang paling halus. Untuk penulisan sehari-hari di perangkat keras sederhana, Mistral 7B jauh melampaui ukurannya.
Qwen 2.5 14B dan Qwen 3.6 menonjol untuk matematika, penalaran terstruktur, dan tugas multibahasa. Mixtral 8x7B adalah pilihan mixture-of-experts terbaik.
Gemma 3 Mini (1B, ~815 MB) berjalan di 4 GB RAM tanpa GPU — model bahasa kecil paling ringan dan andal dalam katalog. Llama 3.2 (3B) adalah langkah lebih tinggi jika Anda memiliki 6 GB.
GLM 4.7 Flash (Zhipu AI) dioptimalkan untuk respons yang responsif. Di sisi yang lebih kecil, Llama 3.2 (3B) adalah default balasan cepat yang bagus.
Untuk pengganti ChatGPT yang gratis, privat, dan offline: Mixtral 8x7B di GPU 24–48 GB, atau Llama 3.3 70B jika Anda memiliki kartu workstation. Nol akun, nol data yang meninggalkan mesin Anda.
| Tingkatan | Dipicu oleh | Default yang direkomendasikan | Model yang ditawarkan |
|---|---|---|---|
| Ringan | < 6 GB RAM, tanpa GPU | Gemma 3 Mini | 1 model — Gemma 3 Mini |
| Standar | 6–15 GB RAM, tanpa GPU | Llama 3.2 | 3 model — menambahkan Llama 3.2 |
| CPU Lega | 16–31 GB RAM, tanpa GPU | Llama 3.2 | 5 model — menambahkan Mistral 7B, GLM 4.7 Flash |
| CPU Workstation | 32 GB+ RAM, tanpa GPU | Llama 3.1 8B | 7 model — menambahkan Llama 3.1 8B, Qwen 2.5 14B |
| GPU (kecil) | < 6 GB VRAM (tunggal atau dijumlahkan) | Llama 3.2 | 2 model — Gemma 3 Mini, Llama 3.2 |
| GPU (menengah) | 6–11 GB VRAM | Mistral 7B | 6 model — menambahkan Mistral 7B, GLM 4.7 Flash, Llama 3.1 8B |
| GPU (tinggi) | 12–23 GB VRAM | Qwen 2.5 14B | 8 model — menambahkan Qwen 2.5 14B, Devstral Small 2 |
| GPU (sangat tinggi) | 24–47 GB VRAM | Mixtral 8x7B | 10 model — menambahkan Gemma 2 27B, Mixtral 8x7B |
| GPU (ekstrem) | 48 GB+ VRAM | Llama 3.3 70B | Semua 13 model — menambahkan Llama 3.3 70B, Qwen 3.6, Mixtral 8x22B |
Devstral Small 2 (24B) adalah model open-source fokus kode dari Mistral — pilihan lokal terbaik untuk coding agentik, tinjauan kode, dan pengeditan multi-file. Llama 3.1 8B dan Qwen 2.5 14B adalah alternatif serba guna yang kuat saat VRAM terbatas. Semua berjalan di Linux Lite melalui MyAI tanpa cloud atau akun yang diperlukan.
Ya. MyAI di Linux Lite menggunakan Ollama di balik layar untuk menjalankan LLM open-source sepenuhnya di perangkat keras Anda. Model kecil seperti Gemma 3 Mini berjalan di CPU dengan hanya 4 GB RAM; model unggulan yang lebih besar seperti Llama 3.3 70B membutuhkan GPU workstation. Pemilih berbasis perangkat keras MyAI memilih model yang benar-benar akan berjalan di mesin Anda.
LLM open-source terkuat untuk inferensi lokal adalah Meta Llama 3.3 70B, Mistral Mixtral 8x7B / 8x22B, Google Gemma 2 27B, Alibaba Qwen 3.6, dan Mistral Devstral Small 2 (terbaik untuk coding). Untuk obrolan cepat, Zhipu GLM 4.7 Flash sangat baik. Model bahasa kecil (SLM) terbaik untuk perangkat keras low-end adalah Gemma 3 Mini.
MyAI hadir dengan katalog model yang telah dikurasi, tetapi model apa pun yang kompatibel dengan Ollama — termasuk varian DeepSeek — dapat diunduh langsung dengan ollama pull <model> setelah menginstal MyAI. Mesin rekomendasi mencocokkan model yang tersedia dengan CPU, RAM, GPU, dan VRAM Anda secara otomatis.
Untuk model bahasa kecil (1–3B): 2–6 GB RAM, CPU modern apa pun. Untuk model berukuran sedang (7–14B): 10–16 GB RAM atau GPU 6–12 GB. Untuk model besar (27B–70B+): RAM 32 GB+ dan VRAM 18–48 GB. MyAI menjumlahkan VRAM dari konfigurasi multi-GPU NVIDIA (selalu) dan kartu AMD yang mendukung ROCm.
MCP adalah standar terbuka untuk menghubungkan asisten AI ke alat eksternal, file, dan sumber data, yang dipopulerkan pada tahun 2024. MyAI menjalankan model secara lokal melalui API HTTP Ollama, yang dapat diakses langsung oleh klien kompatibel MCP dan alur kerja agentik. Ini memungkinkan Anda membangun agen AI privat yang beroperasi pada data Anda sendiri tanpa perjalanan bolak-balik ke cloud.
Ya. MyAI gratis, open-source, dan berjalan sepenuhnya di komputer Anda sendiri. Tanpa akun. Tanpa langganan. Tanpa cloud. Tanpa telemetri. Setelah unduhan model pertama, ia bekerja sepenuhnya offline — alternatif privat sejati untuk ChatGPT, Claude, atau Gemini bagi pengguna yang peduli tentang kepemilikan data.
Llama 3.1 8B adalah pilihan serba guna terbaik untuk desktop biasa. Mistral 7B unggul dalam mengikuti instruksi dan penalaran di ukuran yang lebih kecil. Qwen 2.5 14B / Qwen 3.6 paling kuat untuk tugas multibahasa, konteks panjang, dan matematika. Untuk coding secara khusus, Devstral Small 2 (juga dari Mistral) mengungguli ketiganya.
RAG menggabungkan LLM lokal dengan langkah pencarian di seluruh dokumen Anda sendiri, sehingga model dapat menjawab pertanyaan berdasarkan data Anda tanpa mengunggahnya ke mana pun. MyAI mengekspos API HTTP Ollama di 127.0.0.1:7070, yang dapat ditargetkan oleh kerangka kerja RAG apa pun (LangChain, LlamaIndex, dll.) untuk alur kerja retrieval-augmented yang sepenuhnya lokal.
Ya. Satu-satunya aktivitas jaringan adalah unduhan model awal (biasanya 0,6–80 GB tergantung model yang Anda pilih). Setelah model ada di disk, MyAI berjalan sepenuhnya offline — tidak diperlukan koneksi internet untuk obrolan, bantuan coding, atau tugas AI lainnya.