ATLAS Qwen3-14B — Motor de Razonamiento Forense

14.7 mil millones de parámetros. Dos rondas de entrenamiento especializado. Un objetivo: pensar como el mejor auditor forense del mundo.

Fine-tune multi-ronda de Qwen3-14B para detección de anomalías financieras y auditoría fiscal forense en México y USA. Entrenado íntegramente sobre AMD Instinct MI300X (205GB VRAM) como parte del sistema ATLAS — AMD Hackathon 2025.


Historial de Entrenamiento

Este modelo no nació especializado. Fue construido en dos rondas de entrenamiento deliberadamente secuenciadas:

Ronda 1 — Fundamentos (Rama: main)

Dataset:   atlas_training_dataset_final.jsonl
Registros: 6,437 ejemplos financiero-legales MX/USA
Epochs:    3
Loss:      0.2697
Tiempo:    71 minutos
Hardware:  AMD MI300X (205GB VRAM)

Primera exposición al dominio. El modelo aprende el vocabulario fiscal, los patrones de riesgo y la estructura argumentativa de un auditor. Establece la base de conocimiento.

Ronda 2 — Especialización Legal (Rama: legal-v2)

Dataset:   atlas_audit_master_unified.jsonl
Registros: 3,502 casos legales de alta complejidad
Epochs:    3
Loss:      ~0.018 (train) | ~0.019 (eval)
Tiempo:    ~47 minutos
Hardware:  AMD MI300X (205GB VRAM)

Refinamiento sobre casos de mayor dificultad y especificidad normativa. El modelo profundiza en artículos específicos, cruces normativos MX/USA y construcción de argumentos forenses auditables. Loss 15x mejor que Ronda 1.


¿Por qué Qwen3-14B?

Qwen3-14B introduce thinking mode — la capacidad de razonar explícitamente antes de responder. En auditoría forense esto no es un lujo, es una necesidad:

<think>
Empresa reporta 50MDP en servicios de construcción con 1 empleado.
Ratio ingresos/empleado: inviable operativamente.
Domicilio: zona residencial → sin infraestructura industrial.
Patrón: EFOS clásico bajo Art. 69-B CFF, primer párrafo.
Procedimiento: verificación Art. 42 Fr. IX + solicitud documentación.
Riesgo estimado: ALTO. Requiere actuación inmediata.
</think>

RED FLAG CONFIRMADA — Art. 69-B CFF...

Un modelo que muestra su razonamiento es un modelo cuyos errores se pueden corregir. En contextos legales, eso es crítico.


Dominio de Conocimiento

México — Marco Normativo

Área Artículos
Operaciones Inexistentes (EFOS/EDOS) Art. 69-B CFF
Facultades de Comprobación SAT Art. 42 CFF
Infracciones y Sanciones Arts. 76, 81, 82 CFF
Deducibilidad de Gastos Art. 27 LISR
Precios de Transferencia Art. 59-G LISR
RESICO Personas Físicas Art. 140 LISR
Delitos Fiscales Art. 108 CFF

USA — Internal Revenue Manual

Área Referencia
Examination of Returns IRM 4.10
Employment Tax / Worker Classification IRM 4.23
Anti-Money Laundering / FBAR BSA, FinCEN 114
International Examinations IRM 4.61
Bank Deposits Method IRM 4.10.3

Taxonomía de Razonamiento Forense

El modelo opera en 3 niveles de abstracción:

┌─────────────────────────────────────────────────────────┐
│  NIVEL 1: DETECCIÓN DE PATRONES                         │
│  • Incoherencia material (capacidad vs. ingresos)       │
│  • Incoherencia geográfica (domicilio vs. actividad)    │
│  • Facturación circular (A→B→C→A sin flujo real)        │
│  • Structuring / Smurfing (depósitos sub-$10K)          │
│  • Márgenes anómalos (precios de transferencia)         │
└────────────────────────┬────────────────────────────────┘
                         ▼
┌─────────────────────────────────────────────────────────┐
│  NIVEL 2: CRUCE NORMATIVO                               │
│  • Mapeo hallazgo → artículo específico                 │
│  • Jurisdicción aplicable (MX / USA / ambas)            │
│  • Procedimiento de verificación recomendado            │
│  • Carga de la prueba y estándares de evidencia         │
└────────────────────────┬────────────────────────────────┘
                         ▼
┌─────────────────────────────────────────────────────────┐
│  NIVEL 3: CONSTRUCCIÓN DE CASO                          │
│  • Síntesis de evidencia con trazabilidad               │
│  • Cuantificación de riesgo fiscal estimado             │
│  • Acciones correctivas priorizadas                     │
│  • Reporte ejecutivo auditable                          │
└─────────────────────────────────────────────────────────┘

Uso

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# Cargar Ronda 2 (especialización legal)
model_id = "Rafaelcedav/atlas-r2-qwen3-14b"

tokenizer = AutoTokenizer.from_pretrained(model_id, revision="legal-v2")
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    revision="legal-v2",
    torch_dtype=torch.bfloat16,
    attn_implementation="eager",   # Requerido en ROCm / AMD
    device_map="auto"
)

messages = [
    {
        "role": "system",
        "content": "Eres ATLAS, auditor forense senior especializado en derecho fiscal MX/USA. Activa thinking mode para casos complejos. Cita artículos específicos y construye argumentos auditables."
    },
    {
        "role": "user",
        "content": "/think\n\nDistribuidora MX vende a filial en paraíso fiscal a precio 40% menor que mercado. Sin benchmarking documentado. Ingresos declarados inconsistentes con flujos bancarios. ¿Análisis completo?"
    }
]

inputs = tokenizer.apply_chat_template(
    messages, return_tensors="pt", add_generation_prompt=True
)

output = model.generate(
    inputs,
    max_new_tokens=2048,
    temperature=0.6,    # Recomendado por Qwen3 para thinking mode
    top_p=0.95,
    do_sample=True
)

print(tokenizer.decode(output[0][inputs.shape[-1]:], skip_special_tokens=True))

Rol en Pipeline ATLAS

PDF ──► [Vision · InternVL2-40B]
              │
              ▼
        [Compliance Router · Motor 11434]
              │
              ▼
┌─────────────────────────────────┐
│   Qwen3-14B  ·  Motor 8000     │  ◄── Este modelo
│                                 │
│   Recibe: campos extraídos      │
│   Cruza:  normativa aplicable   │
│   Genera: hipótesis de riesgo   │
│   Emite:  veredicto trazable    │
└────────────────┬────────────────┘
                 │
                 ▼
        [Validator · Integridad]
                 │
                 ▼
        [Explainer · Reporte PDF]

Sirve via vLLM con interfaz OpenAI-compatible en puerto 8000.


Ecosistema ATLAS

Modelo Rol en Pipeline Params Eval Loss
atlas-r2-qwen3-14b Razonamiento principal 14.7B ~0.019
atlas-finanzas-deepseek-r1-8b Análisis financiero profundo 8.3B 0.4829
atlas-mistral-7b-legal Agente legal MX/USA 7.2B 0.0184

Stack Técnico

GPU:          AMD Instinct MI300X VF
VRAM:         205.8 GB
OS:           Ubuntu 24.04 LTS
ROCm:         7.2
PyTorch:      2.5.1+rocm6.2
Transformers: 5.x
Optimizer:    adamw_torch          # Único estable en ROCm
Attention:    eager                # SDPA produce NaN en ROCm + bf16
Precision:    bfloat16             # Nativo en MI300X
Serving:      vLLM (OpenAI-compat)

Two rounds. One mission. Built on AMD.

Downloads last month
131
Safetensors
Model size
15B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for Rafaelcedav/atlas-r2-qwen3-14b

Finetuned
Qwen/Qwen3-14B
Finetuned
(269)
this model
Finetunes
1 model