gemma-4-E2B-it-Uncensored-MAX → LiteRT-LM

Conversión de prithivMLmods/gemma-4-E2B-it-Uncensored-MAX a formato .litertlm para Google AI Edge Gallery en Android.

🚀 Cómo convertir (Google Colab, gratis)

El notebook está probado y listo para ejecutar en Colab:

📓 gemma4_to_litertlm.ipynb

Pasos:

Descarga el notebook y ábrelo en Google Colab
Selecciona runtime: GPU (T4) + RAM Alta (hm)
→ Entorno de ejecución → Cambiar tipo → T4 + RAM Alta
Pon tu token de HuggingFace (con permisos de escritura) en la primera celda
Ejecuta todas las celdas (~30-45 min)
El .litertlm se sube automáticamente aquí

¿Qué hace?

Extrae solo el decoder de texto del modelo multimodal (4.8 GB vs 9.6 GB total)
→ Mantiene la key naming correcta (model.language_model.*)
Crea config modificado con vision_config=None, audio_config=None
→ Gemma4ForConditionalGeneration solo instancia el language model
Convierte a TFLite via litert-torch con cuantización INT8
Empaqueta como .litertlm con externalize_embedder=True (requerido por Gemma4)
Sube a HuggingFace

Si pesa >2 GB

Cambia "dynamic_wi8_afp32" → "dynamic_wi4_afp32" en la celda 4 (INT4 en vez de INT8, mitad de tamaño)

📱 Uso (una vez convertido)

Edge Gallery (Android)

Instala Google AI Edge Gallery
Añade modelo via URL de HuggingFace
¡Chatea!

CLI

pip install litert-lm
litert-lm import --from-huggingface-repo RedSparkie/gemma-4-E2B-it-Uncensored-MAX-litert-lm gemma-4-E2B-it-Uncensored-MAX.litertlm uncensored-max
litert-lm run uncensored-max

Detalles técnicos


Modelo base	prithivMLmods/gemma-4-E2B-it-Uncensored-MAX
Arquitectura	Gemma 4 E2B (text decoder only, ~1.4B params)
Formato	LiteRT-LM (`.litertlm`)
Cuantización	INT8 dynamic (`dynamic_wi8_afp32`)
Contexto	4096 tokens
Tamaño estimado	~1.5-2.0 GB
Convertido con	`litert-torch` v0.9.0

⚠️ Modelo abliterated/uncensored. Úsalo con responsabilidad.

Downloads last month: -

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for RedSparkie/gemma-4-E2B-it-Uncensored-MAX-litert-lm

Base model

google/gemma-4-E2B

Finetuned

google/gemma-4-E2B-it

Finetuned

prithivMLmods/gemma-4-E2B-it-Uncensored-MAX

Finetuned

(4)

this model