ATLAS Qwen3-14B Legal — Motor de Razonamiento Forense

Segunda ronda de fine-tuning de Qwen3-14B especializada en derecho fiscal forense MX/USA, entrenada sobre AMD Instinct MI300X en el marco del AMD Hackathon 2025.

El modelo más capaz del ecosistema ATLAS. 14 mil millones de parámetros alineados para pensar como un auditor forense senior.

¿Qué hace diferente a Qwen3-14B?

Qwen3-14B introduce una distinción arquitectónica que lo separa de la mayoría de los LLMs de su categoría: modo de pensamiento explícito (thinking mode).

Cuando el modelo necesita resolver un problema complejo — como determinar si una empresa con incoherencias materiales califica para presunción bajo Art. 69-B CFF — puede generar un bloque de razonamiento interno antes de responder:

<think>
La empresa reporta ingresos por 50MDP en servicios de construcción especializada.
Verifico capacidad operativa: 1 empleado registrado en IMSS.
Razón ingresos/empleado: 50,000,000 MXN por trabajador → inviable operativamente.
Domicilio fiscal: zona residencial → sin infraestructura industrial visible.
Patrón: coincide con perfil EFOS (Art. 69-B, primer párrafo CFF).
Procedimiento aplicable: facultades de verificación Art. 42 Fr. IX.
</think>

ANÁLISIS FORENSE — Art. 69-B CFF ...

Este fine-tune entrena explícitamente ese patrón de razonamiento sobre 3,502 casos reales de auditoría fiscal en derecho mexicano y americano.

Métricas de Entrenamiento

Métrica	Valor
Base Model	Qwen/Qwen3-14B
Parámetros	14,768,307,200
Train Loss	en progreso
Eval Loss	en progreso
Epochs	3
Dataset	3,502 ejemplos legales MX/USA
Hardware	AMD Instinct MI300X (205.8 GB VRAM)
Optimizer	adamw_torch (ROCm-native)
Precisión	bfloat16

Arquitectura de Razonamiento en Auditoría

El modelo fue entrenado en una taxonomía de razonamiento forense de 3 niveles:

Nivel 1 — Detección de Patrones

Reconocimiento de red flags documentadas en normativa:

Incoherencia material — capacidad operativa vs. ingresos declarados
Incoherencia geográfica — domicilio fiscal vs. naturaleza del servicio
Patrones de carrusel — redes de facturación circular A→B→C→A
Structuring (smurfing) — depósitos sistemáticos sub-$10K en múltiples cuentas

Nivel 2 — Cruce Normativo

Mapeo automático de hallazgos a artículos específicos:

CFF: Arts. 42, 69-B, 76, 81, 82, 108
LISR: Arts. 27, 59-G, 140 (RESICO)
IRC: Secciones 61, 162, 482, 6038
IRM: Parts 4.10, 4.23, 4.31

Nivel 3 — Construcción de Caso

Síntesis de evidencia en estructura argumentativa auditable:

Hallazgos primarios con fuente
Artículos aplicables con justificación
Procedimiento de verificación recomendado
Riesgo estimado y acción correctiva

Uso

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_id = "Rafaelcedav/atlas-qwen3-14b-legal"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    attn_implementation="eager",  # Requerido en ROCm
    device_map="auto"
)

# Habilitar thinking mode para casos complejos
messages = [
    {
        "role": "system",
        "content": "Eres ATLAS, auditor forense senior especializado en derecho fiscal MX/USA. Razona exhaustivamente antes de emitir conclusiones. Cita artículos específicos."
    },
    {
        "role": "user",
        "content": "/think\n\nEmpresa distribuidora vende a filial extranjera a precio 40% por debajo del mercado. No existe documentación de benchmarking. Ingresos declarados inconsistentes con patrones del sector. ¿Análisis completo?"
    }
]

inputs = tokenizer.apply_chat_template(
    messages,
    return_tensors="pt",
    add_generation_prompt=True
)

with torch.no_grad():
    output = model.generate(
        inputs,
        max_new_tokens=2048,
        temperature=0.6,    # Qwen3 recomienda 0.6 para thinking mode
        top_p=0.95,
        do_sample=True
    )

response = tokenizer.decode(output[0][inputs.shape[-1]:], skip_special_tokens=True)
print(response)

Rol en Pipeline ATLAS

                    ┌─────────────────────────────────┐
PDF ──► Vision ──►  │  Qwen3-14B Legal (Motor 8000)   │ ──► Validator
        InternVL2   │                                 │
                    │  • Recibe campos extraídos       │
                    │  • Cruza con compliance router   │
                    │  • Genera hipótesis de riesgo    │
                    │  • Construye argumento legal     │
                    │  • Emite veredicto normalizado   │
                    └─────────────────────────────────┘

Opera sobre el Motor 8000 del stack ATLAS, sirviendo via vLLM con interfaz OpenAI-compatible para integración con el pipeline de agentes.

Ecosistema Completo ATLAS

Modelo	Rol	Params	Loss
atlas-qwen3-14b-legal	Razonamiento principal	14.8B	—
atlas-r2-qwen3-14b	Razonamiento R1	14.8B	0.2697
atlas-finanzas-deepseek-r1-8b	Análisis financiero	8.3B	0.4829
atlas-mistral-7b-legal	Agente legal MX/USA	7.2B	0.0184

Hardware & Stack Técnico

GPU:        AMD Instinct MI300X VF
VRAM:       205.8 GB (bfloat16 nativo)
ROCm:       7.2 / PyTorch 2.5.1+rocm6.2
Optimizer:  adamw_torch (ROCm-compatible)
Attention:  eager (SDPA → NaN en ROCm + bf16)
Serving:    vLLM + OpenAI-compatible API

Trained with ❤️ on AMD silicon. Part of the ATLAS AMD Hackathon 2025 submission.

Downloads last month: 4

Safetensors

Model size

15B params

Tensor type

BF16

Model tree for Rafaelcedav/atlas-qwen3-14b-legal

Base model

Qwen/Qwen3-14B-Base

Finetuned

Qwen/Qwen3-14B

Finetuned

(269)

this model