← Home

oss-llms

OSS model pricing and availability across inference providers

Updated 1h 37m ago · 561 entries

sort:
A

Aion 1.0 Mini

other· ctx 131K

Allam 2 7b

other· ctx 4K· free
B

Baichuan M2 32b

other
C

Codellama 7b Solidity

llama· ctx 4K

Cogito V1 Llama 8B

llama· ctx 131K

Cogito V2 1 671b

other· ctx 164K

Cogito V2.1 671b

other· ctx 128K

Command A

command· ctx 256K

Command R 08 2024

command· ctx 128K

Command R7b 12 2024

command· ctx 128K

Cydonia 24b V4.1

other· ctx 131K
D

DeepCoder 14B

other· ctx 131K

Deepseek Coder 33b

deepseek· ctx 16K

Deepseek Prover V2 671b

deepseek

DeepSeek R1 Distill Qwen 7B

qwen· ctx 131K

Deepseek R1t2 Chimera

deepseek· ctx 164K
E

Ernie 4.5 21B A3b Thinking

other· ctx 131K

Ernie 4.5 300b A47b Paddle

other· ctx 123K

Ernie 4.5 Vl 28b A3b Thinking

other· ctx 30K

Ernie 4.5 Vl 424b A47b

other· ctx 123K
F

Fireworks/models/minimax M2p7

other· ctx 197K

FLUX 2 Klein 4b

other
G

Gemini 3.1 Flash Lite

other· ctx 1M

Gemma 2 9b

gemma· ctx 8K

Gemma 2b

gemma· ctx 8K

Gemma 3 12b

gemma· ctx 131K· free

Gemma 3 1b

gemma· ctx 33K

Gemma 3 270m

gemma· ctx 33K

Gemma 3 27b Pt

gemma· ctx 131K· free

Gemma 3 4b

gemma· ctx 66K· free

Gemma 4 E2B

gemma· ctx 131K· free

Gemma 4 E4B

gemma· ctx 131K· free

Glm 4 32b

other· ctx 128K

Granite 4.0 H Micro

other· ctx 131K

Granite 4.1 8b

other· ctx 131K
H

Hermes 4 405b

nous· ctx 131K

Hermes 4 70b

nous· ctx 131K

Holo3 35B A3B

other· ctx 262K

Hunyuan A13b

other· ctx 131K
J

Jamba Large 1.7

other· ctx 256K
L

L3 70b Euryale V2.1

other· ctx 131K

L3 8b Lunaris

other· ctx 8K

Lfm 2 24b A2b

other· ctx 33K

Lfm 2.5 1.2b Thinking

other· ctx 33K· free

LFM2 24B A2B

other· ctx 33K

Ling 2.6 Flash

other· ctx 262K· free

Llama 2 7b

llama· ctx 4K

Llama 3.1 405B

llama· ctx 131K· free

Llama 3.2 1B

llama· ctx 131K

Llama 3.2 3B

llama· ctx 131K· free

Llama 4 Scout

llama· ctx 328K

Llama Guard 4 12b

llama· ctx 164K
M

Magistral Small 2506

mistral· ctx 131K

Magnum V4 72b

other· ctx 16K

Meta Llama/llama 4 Scout 17b 16e

llama· ctx 262K· free

Meta Llama/llama Prompt Guard 2 22m

llama· ctx 512· free

Meta Llama/llama Prompt Guard 2 86m

llama· ctx 512· free

Meta/llama 3.1 70b

llama· ctx 131K

Meta/llama 3.2 11b Vision

llama· ctx 131K

Meta/llama 3.2 90b Vision

llama· ctx 16K

Ministral 14b 2512

mistral· ctx 262K

Ministral 3 14B 2512

mistral· ctx 262K

Ministral 3b 2512

mistral· ctx 131K

Ministral 8b 2512

mistral· ctx 262K

Mistral 7B V0.1

mistral· ctx 33K

Mistral Medium 3.1

mistral· ctx 131K

Mistral Small 24B 2501

mistral· ctx 33K· free

Mistral Small 3.1 24b

mistral· ctx 128K

Mistral Small 3.2 24b

mistral· ctx 128K

Mistralai/mixtral 8x22b V01

mistral· ctx 66K

Mixtral 8x7B V0.1

mistral· ctx 33K

Mythomax L2 13b

other· ctx 4K
N

Nemotron 3 Nano Omni 30b A3b Reasoning Fp8

other· ctx 262K· free

Nemotron Nano 12b V2 Vl

other· ctx 128K· free

Nv Mistralai/mistral Nemo 12b

mistral· ctx 16K

NVIDIA Nemotron 3 Super 120B A12B FP8

other· ctx 262K· free

NVIDIA Nemotron Nano 9B V2

other· ctx 131K· free

Nvidia/llama 3.3 Nemotron Super 49b V1

llama· ctx 131K
O

Olmo 3 32b Think

other· ctx 66K

Olmo 3.1 32b

other· ctx 66K

Openai/gpt Oss 120b

other· ctx 131K· free

Openai/gpt Oss 20b

other· ctx 131K· free
P

Phi 4

phi· ctx 16K
Q

Qwen 2 1.5b

qwen· ctx 33K

Qwen 2.5 72b

qwen· ctx 33K

Qwen 2.5 7b

qwen· ctx 33K

Qwen 2.5 Coder 32b

qwen· ctx 33K

Qwen 3 235b A22b 2507

qwen

Qwen Plus 2025 07 28:thinking

qwen· ctx 1M

Qwen2 1.5B

qwen· ctx 33K

Qwen2.5 3B

qwen· ctx 33K

Qwen3 0.6B

qwen· ctx 41K

Qwen3 1.7B

qwen· ctx 41K

Qwen3 4B Base

qwen· ctx 33K

Qwen3 Coder 480B A35B FP8

qwen· ctx 262K

Qwen3 Next 80B A3B FP8

qwen· ctx 262K· free

Qwen3 VL 235B A22B FP8

qwen· ctx 262K

Qwen3.5 27b

qwen· ctx 262K

Qwen3.5 9B FP8

qwen· ctx 262K

Qwen3.5 Flash 02 23

qwen· ctx 1M

Qwen3.5 Plus 02 15

qwen· ctx 1M
S

Seed 1.6 Flash

other· ctx 262K

Seed 2.0 Mini

other· ctx 262K

Skyfall 36b V2

other· ctx 33K

Solar Pro 3

solar· ctx 128K
T

Tongyi Deepresearch 30b A3b

yi· ctx 131K

Trilogy/models/cogsci Storytelling Llama32 3b Sft

llama
U

Ui Tars 1.5 7b

other· ctx 128K
W

Wizardlm 2 8x22b

wizard· ctx 66K