Wyselekcjonowany katalog open-source'owych dużych modeli językowych, które można zainstalować jednym kliknięciem w asystencie MyAI Linux Lite. Wszystkie modele działają lokalnie przez Ollama — bez chmury, bez telemetrii, bez konta. Rozmiary zakładają kwantyzację Q4_K_M; minimalne VRAM dotyczy użytecznego wnioskowania przyspieszonego przez GPU (niższe VRAM przełącza na CPU+RAM, znacznie wolniej). Źródło prawdy: /usr/share/myai/hardware-profiles.json. Aktualizacja: 12.05.26.
Uruchamianie dużych modeli językowych lokalnie na Linux oznacza, że Twoje zapytania, pliki i rozmowy nigdy nie opuszczają maszyny. Nie ma klucza API, limitu zapytań, subskrypcji ani przesyłania wrażliwych danych na serwer strony trzeciej. MyAI to najprostsza darmowa alternatywa dla ChatGPT dla użytkowników, którym zależy na prywatności, dostępie offline i pełnej kontroli nad wyborem open-source'owego modelu — od małych modeli językowych (SLM) jak Gemma 3 Mini (1B) działających na zwykłym laptopie, aż po flagowe modele 70B+ na stacjonarnej karcie GPU.
MyAI posiada silnik rekomendacji uwzględniający sprzęt, który wykrywa Twój CPU, RAM, kartę NVIDIA / AMD GPU i VRAM, a następnie pokazuje tylko te modele, które faktycznie będą działać sprawnie. Niezależnie od tego, czy szukasz najlepszego AI do kodowania, pisania, matematyki, agentycznych przepływów pracy, czy szybkiego codziennego asystenta — poniższa wyselekcjonowana tabela zawiera ręcznie wybraną opcję dla każdego poziomu sprzętu.
| Model | Rozmiar (Q4) | Min. VRAM | Min. RAM | Uwagi |
|---|---|---|---|---|
|
Gemma 3 Mini
gemma3:1b
|
815 MB | — | 4 GB |
Google
Kompaktowy open-source'owy model 1B od Google. Szybki wszędzie, idealny do swobodnej rozmowy i lokalnego AI na starszych laptopach z Linux.
małyprzyjazny CPU
|
|
Llama 3.2
llama3.2:3b
|
2.0 GB | — | 6 GB |
Meta
Wszechstronny model 3B. Najlepszy domyślny open-source'owy LLM dla typowych komputerów z Linux. Świetna równowaga między szybkością a jakością.
zbalansowany
|
|
Mistral 7B
mistral:7b
|
4.1 GB | 6 GB | 8 GB |
Mistral AI
Mocne open-source'owe rozumowanie i śledzenie instrukcji. Ulubiony model do pisania i przepływów pracy Q&A ogólnego przeznaczenia.
jakość
|
|
GLM 4.7 Flash
glm-4.7-flash
|
5.5 GB | 6 GB | 10 GB |
Zhipu AI
Lekki wariant GLM 4.7 „flash" od Zhipu AI. Zoptymalizowany pod kątem szybkich odpowiedzi przy zbalansowanej jakości — świetny do żwawej rozmowy.
zbalansowany
|
|
Llama 3.1 8B
llama3.1:8b
|
4.7 GB | 6 GB | 10 GB |
Meta
Flagowy mały model Meta — bardzo wydajny jak na swój rozmiar. Świetny wybór do kodowania, pisania i AI ogólnego przeznaczenia na sprzęcie średniej klasy.
jakość
|
|
Qwen 2.5 14B
qwen2.5:14b
|
9.0 GB | 12 GB | 16 GB |
Alibaba
Wszechstronny model 14B. Doskonały do długich kontekstów, wielojęzycznych zapytań i matematyki. Wymaga 12 GB+ VRAM lub dużej ilości RAM.
wymagający
|
|
Devstral Small 2
devstral-small-2
|
14 GB | 14 GB | 28 GB |
Mistral AI
Skoncentrowany na kodowaniu model 24B — najlepsze open-source'owe AI do kodowania i agentycznych przepływów pracy. Mocny w edycji wielu plików i refaktoryzacji.
jakość
|
|
Gemma 2 27B
gemma2:27b
|
16 GB | 18 GB | 32 GB |
Google
Średnio-duży gęsty model Google. Doskonała jakość do pisania, podsumowywania i zadań eseistycznych na poziomie stacji roboczej.
dużyzalecany GPU
|
|
Mixtral 8x7B
mixtral:8x7b
|
26 GB | 28 GB | 48 GB |
Mistral AI
Mixture-of-experts (47 B łącznie, ~13 B aktywnych na token). Szybki jak na swoją jakość — popularna lokalna alternatywa dla ChatGPT.
dużymoezalecany GPU
|
|
Llama 3.3 70B
llama3.3:70b
|
43 GB | 42 GB | 64 GB |
Meta
Open-source'owy LLM Meta z końca 2024 roku o parametrach 70B. Jakość zbliżona do czołowych modeli na pojedynczym GPU 48 GB — najmocniejsza lokalna Llama, jaką możesz uruchomić.
bardzo dużytylko GPU
|
|
Qwen 3.6
qwen3.6:latest
|
47 GB | 44 GB | 64 GB |
Alibaba
Najnowsze wydanie Qwen 3.6. Mocny model ogólnego przeznaczenia, długi kontekst, wielojęzyczny — czołowy open-source'owy konkurent dla modeli klasy GPT.
bardzo dużytylko GPU
|
|
Mixtral 8x22B
mixtral:8x22b
|
80 GB | 80 GB | 128 GB |
Mistral AI
Duży mixture-of-experts (141 B). Klasa stacji roboczej / serwera — najlepszy, gdy potrzebujesz maksymalnej głębokości rozumowania.
bardzo dużymoetylko GPU
|
Devstral Small 2 (24B) prowadzi w agentycznym kodowaniu i edycji wielu plików. Qwen 2.5 14B i Llama 3.1 8B to mocne alternatywy, gdy VRAM jest ograniczony. Wszystkie darmowe, lokalne, open-source'owe.
Gemma 2 27B i Llama 3.3 70B generują najbardziej dopracowaną długą prozę. Do codziennego pisania na skromnym sprzęcie Mistral 7B sprawuje się znacznie powyżej swoich możliwości.
Qwen 2.5 14B i Qwen 3.6 wyróżniają się w matematyce, strukturalnym rozumowaniu i zadaniach wielojęzycznych. Mixtral 8x7B to najlepsza opcja mixture-of-experts.
Gemma 3 Mini (1B, ~815 MB) działa na 4 GB RAM bez potrzeby GPU — najlżejszy niezawodny mały model językowy w katalogu. Llama 3.2 (3B) to krok wyżej, jeśli masz 6 GB.
GLM 4.7 Flash (Zhipu AI) jest zoptymalizowany pod kątem żwawych odpowiedzi. Na mniejszym końcu Llama 3.2 (3B) to świetny domyślny wybór do szybkich odpowiedzi.
Darmowy, prywatny, offline zamiennik ChatGPT: Mixtral 8x7B na GPU 24–48 GB lub Llama 3.3 70B jeśli masz kartę stacji roboczej. Zero konta, żadne dane nie opuszczają Twojej maszyny.
| Poziom | Wyzwalany przez | Zalecany domyślny | Dostępne modele |
|---|---|---|---|
| Lekki | < 6 GB RAM, brak GPU | Gemma 3 Mini | 1 model — Gemma 3 Mini |
| Standardowy | 6–15 GB RAM, brak GPU | Llama 3.2 | 3 modele — dodaje Llama 3.2 |
| Przestronny CPU | 16–31 GB RAM, brak GPU | Llama 3.2 | 5 modeli — dodaje Mistral 7B, GLM 4.7 Flash |
| Stacja robocza CPU | 32 GB+ RAM, brak GPU | Llama 3.1 8B | 7 modeli — dodaje Llama 3.1 8B, Qwen 2.5 14B |
| GPU (mały) | < 6 GB VRAM (jeden lub zsumowany) | Llama 3.2 | 2 modele — Gemma 3 Mini, Llama 3.2 |
| GPU (średni) | 6–11 GB VRAM | Mistral 7B | 6 modeli — dodaje Mistral 7B, GLM 4.7 Flash, Llama 3.1 8B |
| GPU (wysoki) | 12–23 GB VRAM | Qwen 2.5 14B | 8 modeli — dodaje Qwen 2.5 14B, Devstral Small 2 |
| GPU (bardzo wysoki) | 24–47 GB VRAM | Mixtral 8x7B | 10 modeli — dodaje Gemma 2 27B, Mixtral 8x7B |
| GPU (ekstremalny) | 48 GB+ VRAM | Llama 3.3 70B | Wszystkie 13 modeli — dodaje Llama 3.3 70B, Qwen 3.6, Mixtral 8x22B |
Devstral Small 2 (24B) to skoncentrowany na kodowaniu open-source'owy model Mistrala — najlepsza lokalna opcja do agentycznego kodowania, przeglądu kodu i edycji wielu plików. Llama 3.1 8B i Qwen 2.5 14B to mocne alternatywy ogólnego przeznaczenia, gdy VRAM jest ograniczony. Wszystkie działają na Linux Lite przez MyAI bez potrzeby chmury czy konta.
Tak. MyAI na Linux Lite używa Ollama do uruchamiania open-source'owych LLM w całości na Twoim sprzęcie. Mniejsze modele jak Gemma 3 Mini działają na CPU przy zaledwie 4 GB RAM; większe flagowe modele jak Llama 3.3 70B wymagają stacjonarnej karty GPU. Uwzględniający sprzęt wybieracz modeli MyAI dobiera modele, które faktycznie zadziałają na Twoim komputerze.
Najmocniejsze open-source'owe LLM do lokalnego wnioskowania to Meta Llama 3.3 70B, Mistral Mixtral 8x7B / 8x22B, Google Gemma 2 27B, Alibaba Qwen 3.6 i Mistral Devstral Small 2 (najlepszy do kodowania). Do szybkiej rozmowy doskonały jest Zhipu GLM 4.7 Flash. Najlepszym małym modelem językowym (SLM) dla słabego sprzętu jest Gemma 3 Mini.
MyAI zawiera wyselekcjonowany katalog zweryfikowanych modeli, ale każdy model zgodny z Ollama — w tym warianty DeepSeek — można pobrać bezpośrednio poleceniem ollama pull <model> po zainstalowaniu MyAI. Silnik rekomendacji automatycznie dopasowuje dostępne modele do Twojego CPU, RAM, GPU i VRAM.
Dla małych modeli językowych (1–3B): 2–6 GB RAM, dowolny nowoczesny CPU. Dla modeli średniej wielkości (7–14B): 10–16 GB RAM lub GPU z 6–12 GB. Dla dużych modeli (27B–70B+): 32 GB+ RAM i 18–48 GB VRAM. MyAI sumuje VRAM z wielu kart NVIDIA (zawsze) i kwalifikujących się kart AMD ROCm.
MCP to otwarty standard łączenia asystentów AI z zewnętrznymi narzędziami, plikami i źródłami danych, który zyskał popularność w 2024 roku. MyAI uruchamia modele lokalnie przez API HTTP Ollama, z którym klienci zgodni z MCP i agentyczne przepływy pracy mogą komunikować się bezpośrednio. Pozwala to budować prywatne agenty AI operujące na własnych danych bez pośrednictwa chmury.
Tak. MyAI jest darmowy, open-source i działa w całości na Twoim własnym komputerze. Bez kont. Bez subskrypcji. Bez chmury. Bez telemetrii. Po pierwszym pobraniu modelu działa w pełni offline — prawdziwa prywatna alternatywa dla ChatGPT, Claude czy Gemini dla użytkowników dbających o własność danych.
Llama 3.1 8B to najlepszy wszechstronny model ogólnego przeznaczenia dla typowych komputerów. Mistral 7B wyróżnia się w śledzeniu instrukcji i rozumowaniu przy mniejszych rozmiarach. Qwen 2.5 14B / Qwen 3.6 są najmocniejsze w zadaniach wielojęzycznych, długim kontekście i matematyce. Do kodowania Devstral Small 2 (również od Mistrala) przewyższa wszystkie trzy.
RAG łączy lokalny LLM z krokiem wyszukiwania w Twoich własnych dokumentach, dzięki czemu model może odpowiadać na pytania oparte na Twoich danych bez ich przesyłania gdziekolwiek. MyAI udostępnia API HTTP Ollama na 127.0.0.1:7070, które może być celem dowolnego frameworka RAG (LangChain, LlamaIndex itp.) dla w pełni lokalnych przepływów pracy z rozszerzonym pobieraniem informacji.
Tak. Jedyną aktywnością sieciową jest pierwsze pobranie modelu (zazwyczaj 0,6–80 GB w zależności od wybranego modelu). Po zapisaniu modelu na dysku MyAI działa w całości offline — do rozmowy, pomocy przy kodowaniu ani żadnego innego zadania AI nie jest wymagane połączenie internetowe.