ATLAS Mistral-7B Legal — Auditoría Forense Fiscal

Fine-tune de Mistral-7B-Instruct-v0.2 especializado en auditoría forense y cumplimiento fiscal para México y USA, entrenado sobre AMD Instinct MI300X con ROCm 7.2.

Parte del ecosistema ATLAS — sistema multi-agente de detección de anomalías financieras desarrollado para el AMD Hackathon 2026.

Métricas de Entrenamiento

Métrica Valor
Train Loss 0.0584
Eval Loss 0.0184
Epochs 3
Tiempo ~27 minutos
Dataset 3,502 ejemplos legales MX/USA
Hardware AMD Instinct MI300X (205GB VRAM)

Especialización

El modelo fue entrenado para razonar sobre casos de auditoría fiscal con base en normativa específica:

México:

  • Art. 69-B CFF — Operaciones Inexistentes (EFOS/EDOS)
  • RESICO — Régimen de Confianza (Personas Físicas)
  • Precios de Transferencia (Art. 59-G LISR)
  • Auditoría Electrónica y verificación de CFDI

USA:

  • IRM 4.10 — Examination of Returns
  • IRM 4.23 — Employment Tax / Worker Classification
  • BSA/FBAR — Anti-Money Laundering
  • Bank Deposits Method, Economic Reality Test

Uso

from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "Rafaelcedav/atlas-mistral-7b-legal"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype="bfloat16")

messages = [
    {"role": "system", "content": "Eres ATLAS, auditor forense especializado en derecho fiscal MX/USA."},
    {"role": "user", "content": "Empresa con 1 empleado factura 50MDP en servicios de construcción. ¿Qué artículo aplica?"}
]

input_ids = tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True)
output = model.generate(input_ids, max_new_tokens=512, temperature=0.1)
print(tokenizer.decode(output[0][input_ids.shape[-1]:], skip_special_tokens=True))

Arquitectura ATLAS

Este modelo opera como agente de razonamiento dentro del pipeline multi-agente ATLAS:

PDF → [Vision InternVL2-40B] → [Compliance Router] → [Mistral-7B / Reasoning]
    → [Validator] → [Explainer] → Reporte Forense

Hardware & Entorno

  • GPU: AMD Instinct MI300X VF (205.8 GB VRAM)
  • Framework: PyTorch 2.5.1 + ROCm 6.2
  • Optimizer: AdamW (adamw_torch)
  • Precisión: bfloat16
  • Gradient Checkpointing:

Repositorio

Código fuente, scripts de entrenamiento y pipeline completo: atlas-amd-hackathon

Modelos Relacionados

Downloads last month
8
Safetensors
Model size
7B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for Rafaelcedav/atlas-mistral-7b-legal

Finetuned
(1090)
this model