MyAI  ·  Jalankan LLM Open-Source Secara Lokal di Linux Lite

Katalog pilihan model bahasa besar open-source yang dapat Anda instal dengan satu klik di asisten MyAI Linux Lite. Semua model berjalan secara lokal melalui Ollama — tanpa cloud, tanpa telemetri, tanpa akun. Ukuran mengasumsikan kuantisasi Q4_K_M; VRAM minimum adalah untuk inferensi yang dipercepat GPU (VRAM lebih rendah akan beralih ke CPU+RAM, jauh lebih lambat). Sumber kebenaran: /usr/share/myai/hardware-profiles.json. Diperbarui 12/05/26.

Mengapa menjalankan LLM secara lokal?

Menjalankan model bahasa besar secara lokal di Linux berarti prompt, file, dan percakapan Anda tidak pernah meninggalkan mesin. Tidak ada kunci API, tidak ada batas laju, tidak ada langganan, dan tidak ada unggahan data sensitif ke server pihak ketiga. MyAI adalah alternatif ChatGPT gratis paling sederhana bagi pengguna yang menginginkan privasi, akses offline, dan kontrol penuh atas model open-source yang mereka gunakan — mulai dari model bahasa kecil (SLM) seperti Gemma 3 Mini (1B) yang berjalan di laptop dasar, hingga model 70B+ unggulan di GPU workstation.

MyAI hadir dengan mesin rekomendasi berbasis perangkat keras yang mendeteksi CPU, RAM, GPU NVIDIA/AMD, dan VRAM Anda, lalu hanya menampilkan model yang benar-benar akan berjalan dengan baik. Baik Anda mencari AI terbaik untuk coding, menulis, matematika, alur kerja agentik, atau asisten cepat sehari-hari, tabel kurasi di bawah ini memiliki pilihan yang tepat untuk setiap tingkatan.

Katalog LLM Open-Source Pilihan
Model Ukuran (Q4) VRAM Min RAM Min Catatan
Gemma 3 Mini
gemma3:1b
815 MB 4 GB Google   LLM open-source 1B kompak dari Google. Cepat di mana saja, ideal untuk obrolan kasual dan AI on-device di laptop Linux lama.
smallcpu-friendly
Llama 3.2
llama3.2:3b
2.0 GB 6 GB Meta   Serba guna 3B. LLM open-source default terbaik untuk desktop Linux biasa. Keseimbangan kecepatan dan kualitas yang bagus.
balanced
Mistral 7B
mistral:7b
4.1 GB 6 GB 8 GB Mistral AI   Penalaran dan mengikuti instruksi open-source yang kuat. Favorit untuk penulisan serba guna dan alur kerja tanya jawab.
quality
GLM 4.7 Flash
glm-4.7-flash
5.5 GB 6 GB 10 GB Zhipu AI   Varian GLM 4.7 "flash" ringan dari Zhipu AI. Dioptimalkan untuk respons cepat dengan kualitas seimbang — bagus untuk obrolan responsif.
balanced
Llama 3.1 8B
llama3.1:8b
4.7 GB 6 GB 10 GB Meta   Model kecil unggulan Meta — sangat mampu untuk ukurannya. Pilihan kuat untuk coding, menulis, dan AI serba guna di perangkat keras kelas menengah.
quality
Qwen 2.5 14B
qwen2.5:14b
9.0 GB 12 GB 16 GB Alibaba   Serba guna 14B. Sangat baik untuk konteks panjang, prompt multibahasa, dan matematika. Membutuhkan VRAM 12 GB+ atau RAM yang banyak.
heavy
Devstral Small 2
devstral-small-2
14 GB 14 GB 28 GB Mistral AI   Model 24B fokus kode — AI open-source terbaik untuk coding dan alur kerja agentik. Kuat dalam pengeditan multi-file dan refactoring.
quality
Gemma 2 27B
gemma2:27b
16 GB 18 GB 32 GB Google   Model dense menengah-besar dari Google. Kualitas sangat baik untuk penulisan, peringkasan, dan tugas esai di skala workstation.
largegpu-recommended
Mixtral 8x7B
mixtral:8x7b
26 GB 28 GB 48 GB Mistral AI   Mixture-of-experts (47 B total, ~13 B aktif per token). Cepat untuk kualitasnya — alternatif ChatGPT lokal yang populer.
largemoegpu-recommended
Llama 3.3 70B
llama3.3:70b
43 GB 42 GB 64 GB Meta   LLM open-source 70B Meta akhir 2024. Kualitas mendekati frontier di GPU 48 GB tunggal — Llama lokal terkuat yang bisa Anda jalankan.
xlargegpu-only
Qwen 3.6
qwen3.6:latest
47 GB 44 GB 64 GB Alibaba   Rilis Qwen 3.6 terbaru. Serba guna yang kuat, konteks panjang, multibahasa — pesaing open-source teratas untuk model kelas GPT.
xlargegpu-only
Mixtral 8x22B
mixtral:8x22b
80 GB 80 GB 128 GB Mistral AI   Mixture-of-experts besar (141 B). Kelas workstation/server — terbaik saat Anda membutuhkan kedalaman penalaran maksimum.
xlargemoegpu-only
AI Open-Source Terbaik Berdasarkan Kasus Penggunaan

AI terbaik untuk coding

Devstral Small 2 (24B) unggul untuk coding agentik dan pengeditan multi-file. Qwen 2.5 14B dan Llama 3.1 8B adalah pilihan runner-up yang kuat saat VRAM terbatas. Semua gratis, semua lokal, semua open-source.

AI terbaik untuk menulis

Gemma 2 27B dan Llama 3.3 70B menghasilkan prosa panjang yang paling halus. Untuk penulisan sehari-hari di perangkat keras sederhana, Mistral 7B jauh melampaui ukurannya.

AI terbaik untuk matematika & penalaran

Qwen 2.5 14B dan Qwen 3.6 menonjol untuk matematika, penalaran terstruktur, dan tugas multibahasa. Mixtral 8x7B adalah pilihan mixture-of-experts terbaik.

AI terbaik untuk perangkat keras low-end

Gemma 3 Mini (1B, ~815 MB) berjalan di 4 GB RAM tanpa GPU — model bahasa kecil paling ringan dan andal dalam katalog. Llama 3.2 (3B) adalah langkah lebih tinggi jika Anda memiliki 6 GB.

AI terbaik untuk obrolan cepat

GLM 4.7 Flash (Zhipu AI) dioptimalkan untuk respons yang responsif. Di sisi yang lebih kecil, Llama 3.2 (3B) adalah default balasan cepat yang bagus.

Alternatif ChatGPT terbaik

Untuk pengganti ChatGPT yang gratis, privat, dan offline: Mixtral 8x7B di GPU 24–48 GB, atau Llama 3.3 70B jika Anda memiliki kartu workstation. Nol akun, nol data yang meninggalkan mesin Anda.

Pemetaan Tingkatan Perangkat Keras
Tingkatan Dipicu oleh Default yang direkomendasikan Model yang ditawarkan
Ringan < 6 GB RAM, tanpa GPU Gemma 3 Mini 1 model — Gemma 3 Mini
Standar 6–15 GB RAM, tanpa GPU Llama 3.2 3 model — menambahkan Llama 3.2
CPU Lega 16–31 GB RAM, tanpa GPU Llama 3.2 5 model — menambahkan Mistral 7B, GLM 4.7 Flash
CPU Workstation 32 GB+ RAM, tanpa GPU Llama 3.1 8B 7 model — menambahkan Llama 3.1 8B, Qwen 2.5 14B
GPU (kecil) < 6 GB VRAM (tunggal atau dijumlahkan) Llama 3.2 2 model — Gemma 3 Mini, Llama 3.2
GPU (menengah) 6–11 GB VRAM Mistral 7B 6 model — menambahkan Mistral 7B, GLM 4.7 Flash, Llama 3.1 8B
GPU (tinggi) 12–23 GB VRAM Qwen 2.5 14B 8 model — menambahkan Qwen 2.5 14B, Devstral Small 2
GPU (sangat tinggi) 24–47 GB VRAM Mixtral 8x7B 10 model — menambahkan Gemma 2 27B, Mixtral 8x7B
GPU (ekstrem) 48 GB+ VRAM Llama 3.3 70B Semua 13 model — menambahkan Llama 3.3 70B, Qwen 3.6, Mixtral 8x22B
Pertanyaan yang Sering Diajukan
Apa AI terbaik untuk coding yang bisa dijalankan secara lokal?

Devstral Small 2 (24B) adalah model open-source fokus kode dari Mistral — pilihan lokal terbaik untuk coding agentik, tinjauan kode, dan pengeditan multi-file. Llama 3.1 8B dan Qwen 2.5 14B adalah alternatif serba guna yang kuat saat VRAM terbatas. Semua berjalan di Linux Lite melalui MyAI tanpa cloud atau akun yang diperlukan.

Bisakah saya menjalankan LLM secara lokal di Linux?

Ya. MyAI di Linux Lite menggunakan Ollama di balik layar untuk menjalankan LLM open-source sepenuhnya di perangkat keras Anda. Model kecil seperti Gemma 3 Mini berjalan di CPU dengan hanya 4 GB RAM; model unggulan yang lebih besar seperti Llama 3.3 70B membutuhkan GPU workstation. Pemilih berbasis perangkat keras MyAI memilih model yang benar-benar akan berjalan di mesin Anda.

Apa LLM open-source terbaik di tahun 2026?

LLM open-source terkuat untuk inferensi lokal adalah Meta Llama 3.3 70B, Mistral Mixtral 8x7B / 8x22B, Google Gemma 2 27B, Alibaba Qwen 3.6, dan Mistral Devstral Small 2 (terbaik untuk coding). Untuk obrolan cepat, Zhipu GLM 4.7 Flash sangat baik. Model bahasa kecil (SLM) terbaik untuk perangkat keras low-end adalah Gemma 3 Mini.

Bagaimana cara menjalankan DeepSeek atau LLM lain secara lokal di Linux Lite?

MyAI hadir dengan katalog model yang telah dikurasi, tetapi model apa pun yang kompatibel dengan Ollama — termasuk varian DeepSeek — dapat diunduh langsung dengan ollama pull <model> setelah menginstal MyAI. Mesin rekomendasi mencocokkan model yang tersedia dengan CPU, RAM, GPU, dan VRAM Anda secara otomatis.

Perangkat keras apa yang saya butuhkan untuk menjalankan LLM lokal?

Untuk model bahasa kecil (1–3B): 2–6 GB RAM, CPU modern apa pun. Untuk model berukuran sedang (7–14B): 10–16 GB RAM atau GPU 6–12 GB. Untuk model besar (27B–70B+): RAM 32 GB+ dan VRAM 18–48 GB. MyAI menjumlahkan VRAM dari konfigurasi multi-GPU NVIDIA (selalu) dan kartu AMD yang mendukung ROCm.

Apa itu MCP (Model Context Protocol)?

MCP adalah standar terbuka untuk menghubungkan asisten AI ke alat eksternal, file, dan sumber data, yang dipopulerkan pada tahun 2024. MyAI menjalankan model secara lokal melalui API HTTP Ollama, yang dapat diakses langsung oleh klien kompatibel MCP dan alur kerja agentik. Ini memungkinkan Anda membangun agen AI privat yang beroperasi pada data Anda sendiri tanpa perjalanan bolak-balik ke cloud.

Apakah MyAI merupakan alternatif ChatGPT yang gratis?

Ya. MyAI gratis, open-source, dan berjalan sepenuhnya di komputer Anda sendiri. Tanpa akun. Tanpa langganan. Tanpa cloud. Tanpa telemetri. Setelah unduhan model pertama, ia bekerja sepenuhnya offline — alternatif privat sejati untuk ChatGPT, Claude, atau Gemini bagi pengguna yang peduli tentang kepemilikan data.

Llama vs Mistral vs Qwen — LLM open-source mana yang harus saya pilih?

Llama 3.1 8B adalah pilihan serba guna terbaik untuk desktop biasa. Mistral 7B unggul dalam mengikuti instruksi dan penalaran di ukuran yang lebih kecil. Qwen 2.5 14B / Qwen 3.6 paling kuat untuk tugas multibahasa, konteks panjang, dan matematika. Untuk coding secara khusus, Devstral Small 2 (juga dari Mistral) mengungguli ketiganya.

Apa itu RAG (Retrieval-Augmented Generation)?

RAG menggabungkan LLM lokal dengan langkah pencarian di seluruh dokumen Anda sendiri, sehingga model dapat menjawab pertanyaan berdasarkan data Anda tanpa mengunggahnya ke mana pun. MyAI mengekspos API HTTP Ollama di 127.0.0.1:7070, yang dapat ditargetkan oleh kerangka kerja RAG apa pun (LangChain, LlamaIndex, dll.) untuk alur kerja retrieval-augmented yang sepenuhnya lokal.

Apakah MyAI bekerja secara offline?

Ya. Satu-satunya aktivitas jaringan adalah unduhan model awal (biasanya 0,6–80 GB tergantung model yang Anda pilih). Setelah model ada di disk, MyAI berjalan sepenuhnya offline — tidak diperlukan koneksi internet untuk obrolan, bantuan coding, atau tugas AI lainnya.