ATLAS Qwen3-14B — Motor de Razonamiento Forense

14.7 mil millones de parámetros. Dos rondas de entrenamiento especializado. Un objetivo: pensar como el mejor auditor forense del mundo.

Fine-tune multi-ronda de Qwen3-14B para detección de anomalías financieras y auditoría fiscal forense en México y USA. Entrenado íntegramente sobre AMD Instinct MI300X (205GB VRAM) como parte del sistema ATLAS — AMD Hackathon 2025.

Historial de Entrenamiento

Este modelo no nació especializado. Fue construido en dos rondas de entrenamiento deliberadamente secuenciadas:

Ronda 1 — Fundamentos (Rama: `main`)

Dataset:   atlas_training_dataset_final.jsonl
Registros: 6,437 ejemplos financiero-legales MX/USA
Epochs:    3
Loss:      0.2697
Tiempo:    71 minutos
Hardware:  AMD MI300X (205GB VRAM)

Primera exposición al dominio. El modelo aprende el vocabulario fiscal, los patrones de riesgo y la estructura argumentativa de un auditor. Establece la base de conocimiento.

Ronda 2 — Especialización Legal (Rama: `legal-v2`)

Dataset:   atlas_audit_master_unified.jsonl
Registros: 3,502 casos legales de alta complejidad
Epochs:    3
Loss:      ~0.018 (train) | ~0.019 (eval)
Tiempo:    ~47 minutos
Hardware:  AMD MI300X (205GB VRAM)

Refinamiento sobre casos de mayor dificultad y especificidad normativa. El modelo profundiza en artículos específicos, cruces normativos MX/USA y construcción de argumentos forenses auditables. Loss 15x mejor que Ronda 1.

¿Por qué Qwen3-14B?

Qwen3-14B introduce thinking mode — la capacidad de razonar explícitamente antes de responder. En auditoría forense esto no es un lujo, es una necesidad:

<think>
Empresa reporta 50MDP en servicios de construcción con 1 empleado.
Ratio ingresos/empleado: inviable operativamente.
Domicilio: zona residencial → sin infraestructura industrial.
Patrón: EFOS clásico bajo Art. 69-B CFF, primer párrafo.
Procedimiento: verificación Art. 42 Fr. IX + solicitud documentación.
Riesgo estimado: ALTO. Requiere actuación inmediata.
</think>

RED FLAG CONFIRMADA — Art. 69-B CFF...

Un modelo que muestra su razonamiento es un modelo cuyos errores se pueden corregir. En contextos legales, eso es crítico.

Dominio de Conocimiento

México — Marco Normativo

Área	Artículos
Operaciones Inexistentes (EFOS/EDOS)	Art. 69-B CFF
Facultades de Comprobación SAT	Art. 42 CFF
Infracciones y Sanciones	Arts. 76, 81, 82 CFF
Deducibilidad de Gastos	Art. 27 LISR
Precios de Transferencia	Art. 59-G LISR
RESICO Personas Físicas	Art. 140 LISR
Delitos Fiscales	Art. 108 CFF

USA — Internal Revenue Manual

Área	Referencia
Examination of Returns	IRM 4.10
Employment Tax / Worker Classification	IRM 4.23
Anti-Money Laundering / FBAR	BSA, FinCEN 114
International Examinations	IRM 4.61
Bank Deposits Method	IRM 4.10.3

Taxonomía de Razonamiento Forense

El modelo opera en 3 niveles de abstracción:

┌─────────────────────────────────────────────────────────┐
│  NIVEL 1: DETECCIÓN DE PATRONES                         │
│  • Incoherencia material (capacidad vs. ingresos)       │
│  • Incoherencia geográfica (domicilio vs. actividad)    │
│  • Facturación circular (A→B→C→A sin flujo real)        │
│  • Structuring / Smurfing (depósitos sub-$10K)          │
│  • Márgenes anómalos (precios de transferencia)         │
└────────────────────────┬────────────────────────────────┘
                         ▼
┌─────────────────────────────────────────────────────────┐
│  NIVEL 2: CRUCE NORMATIVO                               │
│  • Mapeo hallazgo → artículo específico                 │
│  • Jurisdicción aplicable (MX / USA / ambas)            │
│  • Procedimiento de verificación recomendado            │
│  • Carga de la prueba y estándares de evidencia         │
└────────────────────────┬────────────────────────────────┘
                         ▼
┌─────────────────────────────────────────────────────────┐
│  NIVEL 3: CONSTRUCCIÓN DE CASO                          │
│  • Síntesis de evidencia con trazabilidad               │
│  • Cuantificación de riesgo fiscal estimado             │
│  • Acciones correctivas priorizadas                     │
│  • Reporte ejecutivo auditable                          │
└─────────────────────────────────────────────────────────┘

Uso

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# Cargar Ronda 2 (especialización legal)
model_id = "Rafaelcedav/atlas-r2-qwen3-14b"

tokenizer = AutoTokenizer.from_pretrained(model_id, revision="legal-v2")
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    revision="legal-v2",
    torch_dtype=torch.bfloat16,
    attn_implementation="eager",   # Requerido en ROCm / AMD
    device_map="auto"
)

messages = [
    {
        "role": "system",
        "content": "Eres ATLAS, auditor forense senior especializado en derecho fiscal MX/USA. Activa thinking mode para casos complejos. Cita artículos específicos y construye argumentos auditables."
    },
    {
        "role": "user",
        "content": "/think\n\nDistribuidora MX vende a filial en paraíso fiscal a precio 40% menor que mercado. Sin benchmarking documentado. Ingresos declarados inconsistentes con flujos bancarios. ¿Análisis completo?"
    }
]

inputs = tokenizer.apply_chat_template(
    messages, return_tensors="pt", add_generation_prompt=True
)

output = model.generate(
    inputs,
    max_new_tokens=2048,
    temperature=0.6,    # Recomendado por Qwen3 para thinking mode
    top_p=0.95,
    do_sample=True
)

print(tokenizer.decode(output[0][inputs.shape[-1]:], skip_special_tokens=True))

Rol en Pipeline ATLAS

PDF ──► [Vision · InternVL2-40B]
              │
              ▼
        [Compliance Router · Motor 11434]
              │
              ▼
┌─────────────────────────────────┐
│   Qwen3-14B  ·  Motor 8000     │  ◄── Este modelo
│                                 │
│   Recibe: campos extraídos      │
│   Cruza:  normativa aplicable   │
│   Genera: hipótesis de riesgo   │
│   Emite:  veredicto trazable    │
└────────────────┬────────────────┘
                 │
                 ▼
        [Validator · Integridad]
                 │
                 ▼
        [Explainer · Reporte PDF]

Sirve via vLLM con interfaz OpenAI-compatible en puerto 8000.

Ecosistema ATLAS

Modelo	Rol en Pipeline	Params	Eval Loss
atlas-r2-qwen3-14b	Razonamiento principal	14.7B	~0.019
atlas-finanzas-deepseek-r1-8b	Análisis financiero profundo	8.3B	0.4829
atlas-mistral-7b-legal	Agente legal MX/USA	7.2B	0.0184

Stack Técnico

GPU:          AMD Instinct MI300X VF
VRAM:         205.8 GB
OS:           Ubuntu 24.04 LTS
ROCm:         7.2
PyTorch:      2.5.1+rocm6.2
Transformers: 5.x
Optimizer:    adamw_torch          # Único estable en ROCm
Attention:    eager                # SDPA produce NaN en ROCm + bf16
Precision:    bfloat16             # Nativo en MI300X
Serving:      vLLM (OpenAI-compat)

Two rounds. One mission. Built on AMD.

Downloads last month: 131

Safetensors

Model size

15B params

Tensor type

BF16

Model tree for Rafaelcedav/atlas-r2-qwen3-14b

Base model

Qwen/Qwen3-14B-Base

Finetuned

Qwen/Qwen3-14B