Za dostęp do najgłośniejszych zagranicznych chatbotów trzeba dziś płacić abonament, tymczasem w Polsce powstała cała rodzina modeli językowych, które można pobrać i używać całkowicie bez opłat. System nazwany PLLuM został zaprojektowany z myślą o specyfice naszej administracji i prawa: potrafi tworzyć pisma w kilkudziesięciu urzędowych szablonach, upraszcza prawniczy żargon i pomaga od ręki przeformułować skomplikowane akty prawne na zrozumiały język. Najnowsza paczka to jedenaście różnych wariantów – od lekkich, które zmieszczą się na pojedynczej karcie graficznej, po potężną wersję obsługującą złożone analizy bez dodatkowego treningu.
Co dokładnie udostępniono i co to daje?
Zespół odpowiedzialny za projekt wypuścił jedenaście modeli różniących się liczbą parametrów i trybem działania. Najlżejsza odmiana ma około czterech miliardów parametrów; do pracy wystarcza jej przeciętna karta graficzna, lecz przed wdrożeniem wymaga drobnego „dostrojenia” do konkretnej roli, na przykład do klasyfikacji dokumentów firmowych. Warianty 8B i 12B plasują się w środku stawki – są adresowane do przedsiębiorstw, które chcą analizować własne repozytoria wiedzy w architekturze RAG, tworzyć bota helpdeskowego czy przyspieszyć obsługę korespondencji z klientami. Najmocniejszy model, 70B, jest już na tyle pojemny, że radzi sobie z zaawansowanymi zadaniami prawnymi i translatorskimi praktycznie od ręki.
Każda wielkość występuje w trzech odmianach funkcjonalnych. Wersja bazowa (tzw. raw) przypomina surowy silnik – generuje tekst dowolnego rodzaju, ale nie ma wgranych reguł dialogu. Wersja instrukcyjna została podszkolona na zestawie poleceń, więc precyzyjnie reaguje na komendy typu „streszcz”, „przetłumacz” czy „wypełnij szablon umowy”. Z kolei tryb dialogowy wyposażono w filtry bezpieczeństwa i naturalny styl konwersacji, co czyni go gotowym zamiennikiem płatnych chatbotów. Dzięki temu administracja publiczna może wykorzystać modele w aplikacji mObywatel, a firmy – zaimplementować je w czatach dla klientów bez ryzyka, że system wygeneruje niepożądane treści.
Skąd AI czerpie wiedzę?
Nad rozwojem PLLuM pracuje konsorcjum badawcze, którego trzon stanowi instytut NASK i wyspecjalizowane spółki technologiczne. W przeciwieństwie do komercyjnych, zamkniętych rozwiązań, twórcy ujawnili pełną kartę danych treningowych. Łącznie wykorzystano siedem milionów polskojęzycznych dokumentów pochodzących z domeny publicznej – od Dziennika Ustaw i Monitora Polskiego, przez stenogramy sejmowe, po licencjonowane otwarcie portale edukacyjne. Na etapie fine-tune dołożono około 80 000 ręcznie opracowanych przykładów rozmów i poleceń, aby model pisał po ludzku, a nie urzędowym stylem.
Rzetelne źródła i jawny proces anotacji były kluczowe z perspektywy unijnego rozporządzenia AI Act, które stawia na przejrzystość i kontrolę ryzyka. Dzięki temu instytucje publiczne mogą integrować PLLuM bez czasochłonnych audytów prawnych, a przedsiębiorstwa – udowodnić kontrahentom, skąd pochodzą dane używane przez ich cyfrowego asystenta.
Licencja i dostępność
Wszystkie warianty zostały udostępnione w modelu open source, co oznacza brak opłat licencyjnych i możliwość modyfikacji kodu. Pliki z wagami sieci neuronowych można pobrać z popularnego repozytorium modeli AI, a osoby, które nie dysponują własną infrastrukturą GPU, mogą sprawdzić możliwości systemu na otwartym czacie działającym w przeglądarce. Twórcy zachęcają do samodzielnego hostowania modeli offline, co eliminuje ryzyko wycieku poufnych danych do zewnętrznego dostawcy.
Kto skorzysta najbardziej i jak zacząć
Dla startupu tworzącego rozwiązania „papierless” mniejsza wersja 4B to tania droga do budowy inteligentnej wyszukiwarki w dokumentach. Średnie modele 8B–12B mogą usprawnić pracę kancelarii prawnych: jednym zapytaniem wygenerują projekt umowy, podsumują kluczowe zapisy i zasugerują ewentualne luki. Z kolei sektor publiczny i duże korporacje, dysponujące serwerami z kilkoma kartami graficznymi, sięgną po wersję 70B, aby zautomatyzować obsługę tysięcy zapytań obywateli lub klientów w wielu kanałach jednocześnie. W praktyce rozpoczęcie pracy sprowadza się do pobrania wybranego pliku z repozytorium, uruchomienia skryptu startowego i podania pierwszych poleceń – reszta to już kwestia kreatywności oraz wymagań biznesowych.