Model działa bardzo ładnie po polsku, najlepiej spośród tych, które do tej pory testowałem.

Uwaga, poniżej zamieszczone są "halucynacje" modelu, który przygotowywał merge, był to Qwen 3.6 27B w Pi.dev

🇵🇱 Whisper Large V3 Turbo PL — Model GGML do whisper.cpp

Gotowy, skwantyzowany model Whisper Large V3 Turbo z fine-tunem na języku polskim (z elementami medycznymi), przygotowany specjalnie do działania z whisper.cpp.

📋 Opis modelu

Model powstał przez scalenie (merge) LoRy dostosowanej do języka polskiego z bazowym modelem Whisper Large V3 Turbo:

Element Źródło Opis
Model bazowy openai/whisper-large-v3-turbo Oficjalny model OpenAI, wersja turbo
LoRA adapter AleksanderObuchowski/whisper-large-v3-turbo-med-pl-lora Fine-tune na polskim korpusie medycznym (whisper_bigos_all_fair)
Format wyjściowy GGML Q8_0 Optymalny balans precyzji i szybkości dla whisper.cpp

Proces tworzenia

  1. Pobrano bazowy model openai/whisper-large-v3-turbo
  2. Pobrano LoRę z adapterem polskim od AleksanderObuchowski
  3. Scalono oba modele za pomocą PEFT (merge_and_unload())
  4. Skonwertowano scalony model do formatu GGML (FP16 → 1.6 GB)
  5. Skwantyzowano do Q8_0 (834 MB, oszczędność 73%)

Model jest kompatybilny z whisper.cpp

📁 Pliki w repozytorium

Plik Rozmiar Opis
ggml-large-v3-turbo-pl-q8_0.bin 834 MB Model skwantyzowany Q8_0 — zalecany
ggml-large-v3-turbo-pl-f16.bin 1.6 GB Model pełnej precyzji FP16

📊 Jakość

Model zachowuje wysoką jakość transkrypcji:

  • ✅ Doskonała obsługa języka polskiego
  • ✅ Terminologia medyczna (dzięki fine-tunowi LoRy)
  • ✅ Obsługa języka angielskiego (dziedziczona z bazowego modelu)
  • ✅ Minimalna utrata jakości po kwantyzacji Q8_0

⚠️ Uwagi

  • Model jest tylko do transkrypcji (speech-to-text), nie generuje mowy
  • Kwantyzacja Q8_0 powoduje minimalną utratę precyzji, ale znacząco przyspiesza działanie
  • Do działania z GPU wymagana jest kompilacja whisper.cpp z włączonym CUDA
  • Model został przetestowany i działa poprawnie z serwerem whisper-server.exe

📜 Licencja

  • Bazowy model OpenAI Whisper: MIT License
  • LoRA adapter: Sprawdź licencję na oryginalnym repozytorium
  • Ten scalony model GGML: Udostępniany w celach społecznościowych

🔗 Linki


Stworzone przez @kokoso | Model GGML gotowy do użycia z whisper.cpp 🇵🇱

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for kokoso/whisper-large-v3-turbo_pl

Finetuned
(542)
this model