Model działa bardzo ładnie po polsku, najlepiej spośród tych, które do tej pory testowałem.
Uwaga, poniżej zamieszczone są "halucynacje" modelu, który przygotowywał merge, był to Qwen 3.6 27B w Pi.dev
🇵🇱 Whisper Large V3 Turbo PL — Model GGML do whisper.cpp
Gotowy, skwantyzowany model Whisper Large V3 Turbo z fine-tunem na języku polskim (z elementami medycznymi), przygotowany specjalnie do działania z whisper.cpp.
📋 Opis modelu
Model powstał przez scalenie (merge) LoRy dostosowanej do języka polskiego z bazowym modelem Whisper Large V3 Turbo:
| Element | Źródło | Opis |
|---|---|---|
| Model bazowy | openai/whisper-large-v3-turbo | Oficjalny model OpenAI, wersja turbo |
| LoRA adapter | AleksanderObuchowski/whisper-large-v3-turbo-med-pl-lora | Fine-tune na polskim korpusie medycznym (whisper_bigos_all_fair) |
| Format wyjściowy | GGML Q8_0 | Optymalny balans precyzji i szybkości dla whisper.cpp |
Proces tworzenia
- Pobrano bazowy model
openai/whisper-large-v3-turbo - Pobrano LoRę z adapterem polskim od AleksanderObuchowski
- Scalono oba modele za pomocą PEFT (
merge_and_unload()) - Skonwertowano scalony model do formatu GGML (FP16 → 1.6 GB)
- Skwantyzowano do Q8_0 (834 MB, oszczędność 73%)
Model jest kompatybilny z whisper.cpp
📁 Pliki w repozytorium
| Plik | Rozmiar | Opis |
|---|---|---|
ggml-large-v3-turbo-pl-q8_0.bin |
834 MB | Model skwantyzowany Q8_0 — zalecany |
ggml-large-v3-turbo-pl-f16.bin |
1.6 GB | Model pełnej precyzji FP16 |
📊 Jakość
Model zachowuje wysoką jakość transkrypcji:
- ✅ Doskonała obsługa języka polskiego
- ✅ Terminologia medyczna (dzięki fine-tunowi LoRy)
- ✅ Obsługa języka angielskiego (dziedziczona z bazowego modelu)
- ✅ Minimalna utrata jakości po kwantyzacji Q8_0
⚠️ Uwagi
- Model jest tylko do transkrypcji (speech-to-text), nie generuje mowy
- Kwantyzacja Q8_0 powoduje minimalną utratę precyzji, ale znacząco przyspiesza działanie
- Do działania z GPU wymagana jest kompilacja whisper.cpp z włączonym CUDA
- Model został przetestowany i działa poprawnie z serwerem whisper-server.exe
📜 Licencja
- Bazowy model OpenAI Whisper: MIT License
- LoRA adapter: Sprawdź licencję na oryginalnym repozytorium
- Ten scalony model GGML: Udostępniany w celach społecznościowych
🔗 Linki
Stworzone przez @kokoso | Model GGML gotowy do użycia z whisper.cpp 🇵🇱
Model tree for kokoso/whisper-large-v3-turbo_pl
Base model
openai/whisper-large-v3 Finetuned
openai/whisper-large-v3-turbo