--- language: - es - en license: apache-2.0 base_model: mistralai/Mistral-7B-Instruct-v0.2 tags: - fine-tuned - legal - audit - forensic - tax - atlas - amd - rocm - finance datasets: - custom pipeline_tag: text-generation --- # ATLAS Mistral-7B Legal — Auditoría Forense Fiscal Fine-tune de **Mistral-7B-Instruct-v0.2** especializado en auditoría forense y cumplimiento fiscal para México y USA, entrenado sobre **AMD Instinct MI300X** con ROCm 7.2. Parte del ecosistema **ATLAS** — sistema multi-agente de detección de anomalías financieras desarrollado para el AMD Hackathon 2026. ## Métricas de Entrenamiento | Métrica | Valor | |---------|-------| | Train Loss | **0.0584** | | Eval Loss | **0.0184** | | Epochs | 3 | | Tiempo | ~27 minutos | | Dataset | 3,502 ejemplos legales MX/USA | | Hardware | AMD Instinct MI300X (205GB VRAM) | ## Especialización El modelo fue entrenado para razonar sobre casos de auditoría fiscal con base en normativa específica: **México:** - Art. 69-B CFF — Operaciones Inexistentes (EFOS/EDOS) - RESICO — Régimen de Confianza (Personas Físicas) - Precios de Transferencia (Art. 59-G LISR) - Auditoría Electrónica y verificación de CFDI **USA:** - IRM 4.10 — Examination of Returns - IRM 4.23 — Employment Tax / Worker Classification - BSA/FBAR — Anti-Money Laundering - Bank Deposits Method, Economic Reality Test ## Uso ```python from transformers import AutoModelForCausalLM, AutoTokenizer model_id = "Rafaelcedav/atlas-mistral-7b-legal" tokenizer = AutoTokenizer.from_pretrained(model_id) model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype="bfloat16") messages = [ {"role": "system", "content": "Eres ATLAS, auditor forense especializado en derecho fiscal MX/USA."}, {"role": "user", "content": "Empresa con 1 empleado factura 50MDP en servicios de construcción. ¿Qué artículo aplica?"} ] input_ids = tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True) output = model.generate(input_ids, max_new_tokens=512, temperature=0.1) print(tokenizer.decode(output[0][input_ids.shape[-1]:], skip_special_tokens=True)) ``` ## Arquitectura ATLAS Este modelo opera como agente de razonamiento dentro del pipeline multi-agente ATLAS: ``` PDF → [Vision InternVL2-40B] → [Compliance Router] → [Mistral-7B / Reasoning] → [Validator] → [Explainer] → Reporte Forense ``` ## Hardware & Entorno - **GPU:** AMD Instinct MI300X VF (205.8 GB VRAM) - **Framework:** PyTorch 2.5.1 + ROCm 6.2 - **Optimizer:** AdamW (adamw_torch) - **Precisión:** bfloat16 - **Gradient Checkpointing:** ✅ ## Repositorio Código fuente, scripts de entrenamiento y pipeline completo: [atlas-amd-hackathon](https://github.com/rafaelcedilloav-eng/atlas-amd-hackathon) ## Modelos Relacionados - [atlas-r2-qwen3-14b](https://huggingface.co/Rafaelcedav/atlas-r2-qwen3-14b) — Motor principal de razonamiento (14B) - [atlas-finanzas-deepseek-r1-8b](https://huggingface.co/Rafaelcedav/atlas-finanzas-deepseek-r1-8b) — Análisis financiero profundo