Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

1,821

Base only

Active filters: nvidia

nvidia/DeepSeek-V4-Pro-NVFP4

Text Generation • 910B • Updated 2 days ago • 81k • 62

cHunter789/Qwen3.6-27B-i1-IQ4_KS-GGUF

Text Generation • 27B • Updated 25 days ago • 5.43k • 18

AEON-7/Gemma-4-12B-it-AEON-Abliterated-K4-BF16

Text Generation • 12B • Updated 9 days ago • 2.62k • 25

r0b0tlab/nex-n2-mini-nvfp4

Text Generation • 18B • Updated 8 days ago • 1.5k • 6

nvidia/NVIDIA-Nemotron-Nano-9B-v2

Text Generation • 9B • Updated Mar 5 • 448k • 495

nvidia/Nemotron-Labs-Diffusion-3B

Text Generation • 4B • Updated 13 days ago • 36.2k • 31

nvidia/NVIDIA-Nemotron-3-Nano-4B-BF16

Text Generation • 4B • Updated Mar 20 • 798k • 93

nvidia/Nemotron-Cascade-2-30B-A3B

Text Generation • 32B • Updated May 1 • 30k • 505

nvidia/Kimodo-SOMA-RP-v1.1

0.3B • Updated Apr 10 • 1.73k • 25

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-FP8

Any-to-Any • 33B • Updated May 5 • 35.1k • 54

mlx-community/LocateAnything-3B-8bit

Image-Text-to-Text • 1B • Updated 18 days ago • 404 • 4

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-Base-BF16

Text Generation • 561B • Updated 11 days ago • 2.22k • 25

nvidia/nemotron-3-8b-base-4k

Text Generation • Updated Feb 9, 2024 • 1 • 105

nvidia/OpenMath-CodeLlama-70b-Python-hf

Text Generation • 69B • Updated Feb 16, 2024 • 23 • 12

nvidia/Llama-3.1-Minitron-4B-Width-Base

Text Generation • 5B • Updated Feb 14, 2025 • 1.6k • 195

nvidia/Nemotron-Mini-4B-Instruct

Text Generation • Updated Feb 14, 2025 • 292k • 183

bartowski/Open-Insurance-LLM-Llama3-8B-GGUF

Text Generation • 8B • Updated Nov 26, 2024 • 352 • 6

nvidia/Cosmos-1.0-Guardrail

Updated Jun 11, 2025 • 2.84k • 62

nvidia/Cosmos-Transfer1-7B

Updated Nov 19, 2025 • 357 • 65

bartowski/nvidia_Llama-3.1-Nemotron-Nano-8B-v1-GGUF

Text Generation • 8B • Updated Mar 20, 2025 • 1.08k • 11

nvidia/Cosmos-Reason1-7B

Image-Text-to-Text • 8B • Updated Dec 10, 2025 • 22.2k • 242

nvidia/Llama-3.1-Nemotron-Nano-4B-v1.1

Text Generation • 5B • Updated Oct 15, 2025 • 8.72k • 115

nvidia/AceReason-Nemotron-7B

Text Generation • 8B • Updated Jun 17, 2025 • 4.16k • • 22

nvidia/Cosmos-Embed1-448p

1B • Updated Mar 13 • 14.1k • 12

nvidia/Cosmos-Predict2-2B-Sample-Action-Conditioned

Updated Jun 17, 2025 • 37 • 10

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10, 2025 • 42k • 34

nvidia/Cosmos-Transfer2.5-2B

Updated Feb 12 • 7.65k • 66

nvidia/Cosmos-Predict2.5-2B

Updated Mar 3 • 61.4k • 134

cyankiwi/Llama-3_3-Nemotron-Super-49B-v1_5-AWQ-4bit

Text Generation • 8B • Updated Jul 31, 2025 • 202 • 4

NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4

Text Generation • 16B • Updated Aug 5, 2025 • 5.37k • 33