Inference Providers
Active filters: ModelOpt
nvidia/diffusiongemma-26B-A4B-it-NVFP4
Text Generation
• 14B • Updated • 117k
• 54
nvidia/Qwen3.6-35B-A3B-NVFP4
Text Generation
• 19B • Updated • 1.22M
• 225
nvidia/DeepSeek-V4-Flash-NVFP4
Text Generation
• 167B • Updated • 105k
• 26
nvidia/Qwen3.5-122B-A10B-NVFP4
Text Generation
• 65B • Updated • 9.73k
• 17
nvidia/Gemma-4-31B-IT-NVFP4
Text Generation
• 21B • Updated • 1.39M
• 509
nvidia/MiniMax-M2.7-NVFP4
Text Generation
• 116B • Updated • 274k
• 57
nvidia/Gemma-4-26B-A4B-NVFP4
Text Generation
• 14B • Updated • 1.06M
• 76
Text Generation
• 2B • Updated • 445
• 8
Text Generation
• 382B • Updated • 46.7k
• 36
NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4
Text Generation
• 16B • Updated • 5.36k
• 33
Text Generation
• Updated • 893k
• 37
nvidia/Wan2.2-T2V-A14B-Diffusers-NVFP4
Text-to-Video
• Updated • 11
nvidia/DeepSeek-V4-Pro-NVFP4
Text Generation
• 910B • Updated • 71.5k
• 61
nvidia/Qwen3-30B-A3B-NVFP4
Text Generation
• 16B • Updated • 41.1k
• 34
nvidia/Phi-4-multimodal-instruct-NVFP4
4B • Updated • 7.03k
• 12
nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4
Text Generation
• Updated • 29.1k
• 42
Text Generation
• Updated • 843k
• 86
Image-Text-to-Text
• 3B • Updated • 1.51k
• 4
Image-Text-to-Text
• 2B • Updated • 968
• 3
nvidia/Kimi-K2.5-Thinking-Eagle3
Text Generation
• 2B • Updated • 9.03k
• 16
nvidia/MiniMax-M2.5-NVFP4
Text Generation
• 116B • Updated • 75.1k
• 37
nvidia/DeepSeek-V3-0324-NVFP4
Text Generation
• 397B • Updated • 40.7k
• 17
nvidia/DeepSeek-R1-0528-NVFP4
Text Generation
• 397B • Updated • 2.1k
• 44
NVFP4/DeepSeek-Prover-V2-7B-FP4
4B • Updated • 7
• 1
NVFP4/DeepSeek-R1-0528-Qwen3-8B-FP4
5B • Updated • 13
• 1
Text Generation
• 19B • Updated • 399
• 4
NVFP4/Polaris-4B-Preview-FP4
2B • Updated • 105
• 1
NVFP4/Polaris-7B-Preview-FP4
5B • Updated • 3
• 1
nvidia/Qwen3-235B-A22B-FP8
Text Generation
• 235B • Updated • 162
• 5
nvidia/Qwen3-235B-A22B-NVFP4
Text Generation
• 133B • Updated • 41.1k
• 18