ATLAS Mistral-7B Legal — Auditoría Forense Fiscal

Fine-tune de Mistral-7B-Instruct-v0.2 especializado en auditoría forense y cumplimiento fiscal para México y USA, entrenado sobre AMD Instinct MI300X con ROCm 7.2.

Parte del ecosistema ATLAS — sistema multi-agente de detección de anomalías financieras desarrollado para el AMD Hackathon 2026.

Métricas de Entrenamiento

Métrica	Valor
Train Loss	0.0584
Eval Loss	0.0184
Epochs	3
Tiempo	~27 minutos
Dataset	3,502 ejemplos legales MX/USA
Hardware	AMD Instinct MI300X (205GB VRAM)

Especialización

El modelo fue entrenado para razonar sobre casos de auditoría fiscal con base en normativa específica:

México:

Art. 69-B CFF — Operaciones Inexistentes (EFOS/EDOS)
RESICO — Régimen de Confianza (Personas Físicas)
Precios de Transferencia (Art. 59-G LISR)
Auditoría Electrónica y verificación de CFDI

USA:

IRM 4.10 — Examination of Returns
IRM 4.23 — Employment Tax / Worker Classification
BSA/FBAR — Anti-Money Laundering
Bank Deposits Method, Economic Reality Test

Uso

from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "Rafaelcedav/atlas-mistral-7b-legal"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype="bfloat16")

messages = [
    {"role": "system", "content": "Eres ATLAS, auditor forense especializado en derecho fiscal MX/USA."},
    {"role": "user", "content": "Empresa con 1 empleado factura 50MDP en servicios de construcción. ¿Qué artículo aplica?"}
]

input_ids = tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True)
output = model.generate(input_ids, max_new_tokens=512, temperature=0.1)
print(tokenizer.decode(output[0][input_ids.shape[-1]:], skip_special_tokens=True))

Arquitectura ATLAS

Este modelo opera como agente de razonamiento dentro del pipeline multi-agente ATLAS:

PDF → [Vision InternVL2-40B] → [Compliance Router] → [Mistral-7B / Reasoning]
    → [Validator] → [Explainer] → Reporte Forense

Hardware & Entorno

GPU: AMD Instinct MI300X VF (205.8 GB VRAM)
Framework: PyTorch 2.5.1 + ROCm 6.2
Optimizer: AdamW (adamw_torch)
Precisión: bfloat16
Gradient Checkpointing: ✅

Repositorio

Código fuente, scripts de entrenamiento y pipeline completo: atlas-amd-hackathon

Modelos Relacionados

atlas-r2-qwen3-14b — Motor principal de razonamiento (14B)
atlas-finanzas-deepseek-r1-8b — Análisis financiero profundo

Downloads last month: 8

Safetensors

Model size

7B params

Tensor type

BF16

Model tree for Rafaelcedav/atlas-mistral-7b-legal

Base model

mistralai/Mistral-7B-Instruct-v0.2

Finetuned

(1090)

this model