Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

235

Full-text search

Active filters: modelopt

nvidia/Qwen3.5-397B-A17B-NVFP4

Text Generation • Updated 15 days ago • 77.5k • 61

osoleve/Qwen3.5-27B-Text-NVFP4-MTP

Text Generation • 17B • Updated 5 days ago • 3.06k • 7

txn545/Qwen3.5-122B-A10B-NVFP4

Text Generation • 64B • Updated 4 days ago • 48.5k • 7

vpyn/Qwen3.5-397B-A17B-CARVE-v1-NVFP4

Updated 2 days ago • 387 • 6

nvidia/Kimi-K2.5-NVFP4

Text Generation • Updated about 23 hours ago • 156k • 58

lukealonso/MiniMax-M2.5-REAP-139B-A10B-NVFP4

80B • Updated 10 days ago • 13.5k • 22

NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4

Text Generation • 16B • Updated Aug 5, 2025 • 27k • 12

nvidia/Qwen3-32B-NVFP4

Text Generation • 17B • Updated Sep 9, 2025 • 27.1k • 11

lukealonso/MiniMax-M2.5-NVFP4

130B • Updated 17 days ago • 72.2k • 36

AxionML/Qwen3.5-9B-NVFP4

Image-Text-to-Text • 7B • Updated 3 days ago • 9.02k • 3

nvidia/Llama-4-Scout-17B-16E-Instruct-NVFP4

56B • Updated Dec 12, 2025 • 18.8k • 23

nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated 24 days ago • 50.6k • 32

nvidia/Phi-4-multimodal-instruct-FP8

6B • Updated Sep 5, 2025 • 15k • 5

nvidia/Qwen3-8B-FP8

Text Generation • 8B • Updated Sep 9, 2025 • 8.47k • 4

nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1-FP4-QAD

Image-Text-to-Text • Updated Oct 9, 2025 • 422 • 14

DataSnake/Muse-12B-NVFP4

Text Generation • 7B • Updated Dec 25, 2025 • 25 • 1

DataSnake/Wayfarer-12B-NVFP4

Text Generation • 7B • Updated Dec 25, 2025 • 4 • 1

DataSnake/Wayfarer-2-12B-NVFP4

Text Generation • 7B • Updated Dec 25, 2025 • 1 • 1

nvidia/Qwen3-235B-A22B-Instruct-2507-NVFP4

Text Generation • 120B • Updated Jan 30 • 3.35k • 4

nvidia/Qwen3-Coder-480B-A35B-Instruct-NVFP4

Text Generation • 241B • Updated 29 days ago • 1.27k • 3

baseten-admin/Kimi-2.5-text-nvfp4-v3

Updated 30 days ago • 2.19k • 1

lukealonso/GLM-5-NVFP4

425B • Updated 17 days ago • 26.4k • 9

vincentzed-hf/Qwen3.5-397B-A17B-NVFP4

Image-Text-to-Text • Updated 16 days ago • 21.4k • 11

pirola/GLM-4.7-Flash-REAP-23B-A3B-NVFP4

13B • Updated 5 days ago • 19 • 1

AxionML/Qwen3.5-27B-NVFP4

Image-Text-to-Text • 17B • Updated 3 days ago • 181 • 1

kleinpanic93/Nemotron-Terminal-32B-NVFP4

Text Generation • 17B • Updated 2 days ago • 113 • 1

kleinpanic93/Qwen3-Coder-30B-A3B-Instruct-NVFP4

Text Generation • 31B • Updated 1 day ago • 21 • 1

nvidia/Llama-4-Maverick-17B-128E-Instruct-FP8

402B • Updated Jul 29, 2025 • 735 • 12

nvidia/Llama-4-Scout-17B-16E-Instruct-FP8

109B • Updated Dec 12, 2025 • 46.7k • 11

ishan24/test_modelopt_quant

Updated Apr 25, 2025 • 5