README.md · Rafaelcedav/atlas-mistral-7b-legal at main

atlas-mistral-7b-legal / README.md

Rafaelcedav

Update README.md

e941fc8 verified about 2 months ago

preview code

Raw

History Blame Contribute Delete

3.07 kB

	---
	language:
	- es
	- en
	license: apache-2.0
	base_model: mistralai/Mistral-7B-Instruct-v0.2
	tags:
	- fine-tuned
	- legal
	- audit
	- forensic
	- tax
	- atlas
	- amd
	- rocm
	- finance
	datasets:
	- custom
	pipeline_tag: text-generation
	---

	# ATLAS Mistral-7B Legal — Auditoría Forense Fiscal

	Fine-tune de Mistral-7B-Instruct-v0.2 especializado en auditoría forense y cumplimiento fiscal para México y USA, entrenado sobre AMD Instinct MI300X con ROCm 7.2.

	Parte del ecosistema ATLAS — sistema multi-agente de detección de anomalías financieras desarrollado para el AMD Hackathon 2026.

	## Métricas de Entrenamiento

	\| Métrica \| Valor \|
	\|---------\|-------\|
	\| Train Loss \| 0.0584 \|
	\| Eval Loss \| 0.0184 \|
	\| Epochs \| 3 \|
	\| Tiempo \| ~27 minutos \|
	\| Dataset \| 3,502 ejemplos legales MX/USA \|
	\| Hardware \| AMD Instinct MI300X (205GB VRAM) \|

	## Especialización

	El modelo fue entrenado para razonar sobre casos de auditoría fiscal con base en normativa específica:

	México:
	- Art. 69-B CFF — Operaciones Inexistentes (EFOS/EDOS)
	- RESICO — Régimen de Confianza (Personas Físicas)
	- Precios de Transferencia (Art. 59-G LISR)
	- Auditoría Electrónica y verificación de CFDI

	USA:
	- IRM 4.10 — Examination of Returns
	- IRM 4.23 — Employment Tax / Worker Classification
	- BSA/FBAR — Anti-Money Laundering
	- Bank Deposits Method, Economic Reality Test

	## Uso

	```python
	from transformers import AutoModelForCausalLM, AutoTokenizer

	model_id = "Rafaelcedav/atlas-mistral-7b-legal"
	tokenizer = AutoTokenizer.from_pretrained(model_id)
	model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype="bfloat16")

	messages = [
	{"role": "system", "content": "Eres ATLAS, auditor forense especializado en derecho fiscal MX/USA."},
	{"role": "user", "content": "Empresa con 1 empleado factura 50MDP en servicios de construcción. ¿Qué artículo aplica?"}
	]

	input_ids = tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True)
	output = model.generate(input_ids, max_new_tokens=512, temperature=0.1)
	print(tokenizer.decode(output[0][input_ids.shape[-1]:], skip_special_tokens=True))
	```

	## Arquitectura ATLAS

	Este modelo opera como agente de razonamiento dentro del pipeline multi-agente ATLAS:

	```
	PDF → [Vision InternVL2-40B] → [Compliance Router] → [Mistral-7B / Reasoning]
	→ [Validator] → [Explainer] → Reporte Forense
	```

	## Hardware & Entorno

	- GPU: AMD Instinct MI300X VF (205.8 GB VRAM)
	- Framework: PyTorch 2.5.1 + ROCm 6.2
	- Optimizer: AdamW (adamw_torch)
	- Precisión: bfloat16
	- Gradient Checkpointing: ✅

	## Repositorio

	Código fuente, scripts de entrenamiento y pipeline completo:
	[atlas-amd-hackathon](https://github.com/rafaelcedilloav-eng/atlas-amd-hackathon)

	## Modelos Relacionados

	- [atlas-r2-qwen3-14b](https://huggingface.co/Rafaelcedav/atlas-r2-qwen3-14b) — Motor principal de razonamiento (14B)
	- [atlas-finanzas-deepseek-r1-8b](https://huggingface.co/Rafaelcedav/atlas-finanzas-deepseek-r1-8b) — Análisis financiero profundo