Instructions to use chenjn168/gemma-4-E2B-it-Uncensored-MAX-litert-lm with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- LiteRT-LM
How to use chenjn168/gemma-4-E2B-it-Uncensored-MAX-litert-lm with LiteRT-LM:
# LiteRT-LM runs on various platforms (Android, iOS, Windows, Linux, macOS, IoT, Web/WASM) # and supports many APIs (C++, Python, Kotlin, Swift, JavaScript, Flutter). # For platform-specific integration guides, please refer to the official developer website: # https://ai.google.dev/edge/litert-lm # To try LiteRT-LM, the easiest way is to use our CLI tool. # 1. Install the LiteRT-LM CLI tool: pip install litert-lm # 2. Download and run this model locally: # See: https://ai.google.dev/edge/litert-lm/cli litert-lm run \ --from-huggingface-repo=chenjn168/gemma-4-E2B-it-Uncensored-MAX-litert-lm \ model.litertlm \ --prompt="Write me a poem"
- Notebooks
- Google Colab
- Kaggle
gemma-4-E2B-it-Uncensored-MAX → LiteRT-LM
Conversión de prithivMLmods/gemma-4-E2B-it-Uncensored-MAX a formato .litertlm para Google AI Edge Gallery en Android.
🚀 Cómo convertir (Google Colab, gratis)
El notebook está probado y listo para ejecutar en Colab:
Pasos:
- Descarga el notebook y ábrelo en Google Colab
- Selecciona runtime: GPU (T4) + RAM Alta (
hm)
→ Entorno de ejecución → Cambiar tipo → T4 + RAM Alta - Pon tu token de HuggingFace (con permisos de escritura) en la primera celda
- Ejecuta todas las celdas (~30-45 min)
- El
.litertlmse sube automáticamente aquí
¿Qué hace?
- Extrae solo el decoder de texto del modelo multimodal (4.8 GB vs 9.6 GB total)
→ Mantiene la key naming correcta (model.language_model.*) - Crea config modificado con
vision_config=None,audio_config=None
→Gemma4ForConditionalGenerationsolo instancia el language model - Convierte a TFLite via
litert-torchcon cuantización INT8 - Empaqueta como
.litertlmconexternalize_embedder=True(requerido por Gemma4) - Sube a HuggingFace
Si pesa >2 GB
Cambia "dynamic_wi8_afp32" → "dynamic_wi4_afp32" en la celda 4 (INT4 en vez de INT8, mitad de tamaño)
📱 Uso (una vez convertido)
Edge Gallery (Android)
- Instala Google AI Edge Gallery
- Añade modelo via URL de HuggingFace
- ¡Chatea!
CLI
pip install litert-lm
litert-lm import --from-huggingface-repo RedSparkie/gemma-4-E2B-it-Uncensored-MAX-litert-lm gemma-4-E2B-it-Uncensored-MAX.litertlm uncensored-max
litert-lm run uncensored-max
Detalles técnicos
| Modelo base | prithivMLmods/gemma-4-E2B-it-Uncensored-MAX |
| Arquitectura | Gemma 4 E2B (text decoder only, ~1.4B params) |
| Formato | LiteRT-LM (.litertlm) |
| Cuantización | INT8 dynamic (dynamic_wi8_afp32) |
| Contexto | 4096 tokens |
| Tamaño estimado | ~1.5-2.0 GB |
| Convertido con | litert-torch v0.9.0 |
⚠️ Modelo abliterated/uncensored. Úsalo con responsabilidad.
- Downloads last month
- -
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support
Model tree for chenjn168/gemma-4-E2B-it-Uncensored-MAX-litert-lm
Base model
google/gemma-4-E2B Finetuned
google/gemma-4-E2B-it