Model działa bardzo ładnie po polsku, najlepiej spośród tych, które do tej pory testowałem.

Uwaga, poniżej zamieszczone są "halucynacje" modelu, który przygotowywał merge, był to Qwen 3.6 27B w Pi.dev

🇵🇱 Whisper Large V3 Turbo PL — Model GGML do whisper.cpp

Gotowy, skwantyzowany model Whisper Large V3 Turbo z fine-tunem na języku polskim (z elementami medycznymi), przygotowany specjalnie do działania z whisper.cpp.

📋 Opis modelu

Model powstał przez scalenie (merge) LoRy dostosowanej do języka polskiego z bazowym modelem Whisper Large V3 Turbo:

Element	Źródło	Opis
Model bazowy	openai/whisper-large-v3-turbo	Oficjalny model OpenAI, wersja turbo
LoRA adapter	AleksanderObuchowski/whisper-large-v3-turbo-med-pl-lora	Fine-tune na polskim korpusie medycznym (whisper_bigos_all_fair)
Format wyjściowy	GGML Q8_0	Optymalny balans precyzji i szybkości dla whisper.cpp

Proces tworzenia

Pobrano bazowy model openai/whisper-large-v3-turbo
Pobrano LoRę z adapterem polskim od AleksanderObuchowski
Scalono oba modele za pomocą PEFT (merge_and_unload())
Skonwertowano scalony model do formatu GGML (FP16 → 1.6 GB)
Skwantyzowano do Q8_0 (834 MB, oszczędność 73%)

Model jest kompatybilny z whisper.cpp

📁 Pliki w repozytorium

Plik	Rozmiar	Opis
`ggml-large-v3-turbo-pl-q8_0.bin`	834 MB	Model skwantyzowany Q8_0 — zalecany
`ggml-large-v3-turbo-pl-f16.bin`	1.6 GB	Model pełnej precyzji FP16

📊 Jakość

Model zachowuje wysoką jakość transkrypcji:

✅ Doskonała obsługa języka polskiego
✅ Terminologia medyczna (dzięki fine-tunowi LoRy)
✅ Obsługa języka angielskiego (dziedziczona z bazowego modelu)
✅ Minimalna utrata jakości po kwantyzacji Q8_0

⚠️ Uwagi

Model jest tylko do transkrypcji (speech-to-text), nie generuje mowy
Kwantyzacja Q8_0 powoduje minimalną utratę precyzji, ale znacząco przyspiesza działanie
Do działania z GPU wymagana jest kompilacja whisper.cpp z włączonym CUDA
Model został przetestowany i działa poprawnie z serwerem whisper-server.exe

📜 Licencja

Bazowy model OpenAI Whisper: MIT License
LoRA adapter: Sprawdź licencję na oryginalnym repozytorium
Ten scalony model GGML: Udostępniany w celach społecznościowych

🔗 Linki

Stworzone przez @kokoso | Model GGML gotowy do użycia z whisper.cpp 🇵🇱

Downloads last month: -; Downloads are not tracked for this model. How to track

Model tree for kokoso/whisper-large-v3-turbo_pl

Base model

openai/whisper-large-v3

Finetuned

openai/whisper-large-v3-turbo

Finetuned

(542)

this model