Available Models

Choose from our selection of state-of-the-art language models

Filters

Provider

Status

Sort by :

Showing 41 models

New

Latest

GPT-5 Chat

OpenAI | gpt-5-chat-latest

Context Window

400,000 tokens

Max Output

128,000 tokens

Released

2025.08.07

Knowledge

2024.05.31

Cost per million tokens

Input$1.25

Cache Read:$0.125

Output$10

New

Latest

CoT

GPT-5 nano

OpenAI | gpt-5-nano-2025-08-07

Context Window

400,000 tokens

Max Output

128,000 tokens

Released

2025.08.07

Knowledge

2024.05.31

Cost per million tokens

Input$0.05

Cache Read:$0.005

Output$0.4

New

Latest

CoT

GPT-5 mini

OpenAI | gpt-5-mini-2025-08-07

Context Window

400,000 tokens

Max Output

128,000 tokens

Released

2025.08.07

Knowledge

2024.05.31

Cost per million tokens

Input$0.25

Cache Read:$0.025

Output$2

New

Latest

CoT

GPT-5

OpenAI | gpt-5-2025-08-07

Context Window

400,000 tokens

Max Output

128,000 tokens

Released

2025.08.07

Knowledge

2024.05.31

Cost per million tokens

Input$1.25

Cache Read:$0.125

Output$10

New

Latest

CoT

Claude Opus 4.1

Anthropic | claude-opus-4-1-20250805

Context Window

200,000 tokens

Max Output

32,000 tokens

Released

2025.08.05

Knowledge

2025.03

Cost per million tokens

Input$15

Cache Read:$1.5

Cache Write (5 Minute):$18.75

Cache Write (1 Hour):$30

Output$75

New

Latest

CoT

Gemini 2.5 Flash-Lite

Google | gemini-2.5-flash-lite

Context Window

1,048,576 tokens

Max Output

65,535 tokens

Released

2025.07.22

Knowledge

2025.01

Cost per million tokens

Input$0.1

Cache Read:$0.025

Output$0.4

New

Latest

CoT

Grok 4

xAI | grok-4

Context Window

256,000 tokens

Max Output

256,000 tokens

Released

2025.07.09

Knowledge

Unknown

Cost per million tokens

Input$3

Cache Read:$0.75

Output$15

Latest

CoT

Gemini 2.5 Flash

Google | gemini-2.5-flash

Context Window

1,048,576 tokens

Max Output

65,535 tokens

Released

2025.06.05

Knowledge

2025.01

Cost per million tokens

Input$0.3

Cache Read:$0.75

Output$2.5

Latest

CoT

Gemini 2.5 Pro

Google | gemini-2.5-pro

Context Window

1,048,576 tokens

Max Output

65,535 tokens

Released

2025.06.05

Knowledge

2025.01

Cost per million tokens

Input$1.25

Cache Read:$0.31

> 200K tokens:$2.5

Cache Read:$0.625

Output$10

> 200K tokens:$20

Latest

CoT

DeepSeek-R1

DeepSeek | deepseek-reasoner

Context Window

64,000 tokens

Max Output

8,192 tokens

Released

2025.05.28

Knowledge

Unknown

Cost per million tokens

Input$0.55

Cache Read:$0.14

Output$2.19

Latest

CoT

Claude Sonnet 4

Anthropic | claude-sonnet-4-20250514

Context Window

1,000,000 tokens

Max Output

64,000 tokens

Released

2025.05.22

Knowledge

2024.11

Cost per million tokens

Input$3

Cache Read:$0.3

Cache Write (5 Minute):$3.75

Cache Write (1 Hour):$6

> 200K tokens:$6

Output$15

> 200K tokens:$22.5

CoT

Claude Opus 4

Anthropic | claude-opus-4-20250514

Context Window

200,000 tokens

Max Output

32,000 tokens

Released

2025.05.22

Knowledge

2025.03

Cost per million tokens

Input$15

Cache Read:$1.5

Cache Write (5 Minute):$18.75

Cache Write (1 Hour):$30

Output$75

CoT

o4-mini

OpenAI | o4-mini-2025-04-16

Context Window

200,000 tokens

Max Output

100,000 tokens

Released

2025.04.16

Knowledge

2024.01.01

Cost per million tokens

Input$1.1

Cache Read:$0.275

Output$4.4

CoT

o3

OpenAI | o3-2025-04-16

Context Window

200,000 tokens

Max Output

100,000 tokens

Released

2025.04.16

Knowledge

2024.01.01

Cost per million tokens

Input$2

Cache Read:$0.5

Output$8

GPT-4.1

OpenAI | gpt-4.1-2025-04-14

Context Window

1,047,476 tokens

Max Output

32,768 tokens

Released

2025.04.14

Knowledge

2024.06.01

Cost per million tokens

Input$2

Cache Read:$0.5

Output$8

GPT-4.1 mini

OpenAI | gpt-4.1-mini-2025-04-14

Context Window

1,047,476 tokens

Max Output

32,768 tokens

Released

2025.04.14

Knowledge

2024.06.01

Cost per million tokens

Input$0.4

Cache Read:$0.1

Output$1.6

GPT-4.1 nano

OpenAI | gpt-4.1-nano-2025-04-14

Context Window

1,047,476 tokens

Max Output

32,768 tokens

Released

2025.04.14

Knowledge

2024.06.01

Cost per million tokens

Input$0.1

Cache Read:$0.025

Output$0.4

Latest

DeepSeek-V3

DeepSeek | deepseek-chat

Context Window

64,000 tokens

Max Output

8,192 tokens

Released

2025.03.24

Knowledge

Unknown

Cost per million tokens

Input$0.27

Cache Read:$0.07

Output$1.1

Gemini 2.0 Flash Lite

Google | gemini-2.0-flash-lite-001

Context Window

1,048,576 tokens

Max Output

8,192 tokens

Released

2025.02.25

Knowledge

2024.08

Cost per million tokens

Input$0.075

Output$0.3

CoT

Claude 3.7 Sonnet

Anthropic | claude-3-7-sonnet-20250219

Context Window

200,000 tokens

Max Output

128,000 tokens

Released

2025.02.24

Knowledge

2024.11

Cost per million tokens

Input$3

Cache Read:$0.3

Cache Write (5 Minute):$3.75

Cache Write (1 Hour):$6

Output$15

Gemini 2.0 Flash

Google | gemini-2.0-flash-001

Context Window

1,048,576 tokens

Max Output

8,192 tokens

Released

2025.02.05

Knowledge

2024.08

Cost per million tokens

Input$0.1

Cache Read:$0.25

Output$0.4

Experimental

CoT

Gemini 2.0 Flash Thinking Experimental

Google | gemini-2.0-flash-thinking-exp

Context Window

1,048,576 tokens

Max Output

65,535 tokens

Updated

2025.01.21

Knowledge

2024.08

Cost per million tokens

Input$0

Output$0

CoT

o3-mini

OpenAI | o3-mini-2025-01-31

Context Window

200,000 tokens

Max Output

100,000 tokens

Released

2025.01.21

Knowledge

2023.10.01

Cost per million tokens

Input$1.1

Cache Read:$0.55

Output$4.4

CoT

OpenRouter

DeepSeek-R1 (250120)

DeepSeek | deepseek-r1-250120

Context Window

64,000 tokens

Max Output

8,192 tokens

Released

2025.01.20

Knowledge

Unknown

Cost per million tokens

Estimated Input$0.45

Estimated Output$2.15

OpenRouter

DeepSeek-V3 (241226)

DeepSeek | deepseek-v3-241226

Context Window

64,000 tokens

Max Output

8,192 tokens

Released

2024.12.26

Knowledge

Unknown

Cost per million tokens

Estimated Input$0.38

Estimated Output$0.89

CoT

o1

OpenAI | o1-2024-12-17

Context Window

200,000 tokens

Max Output

100,000 tokens

Released

2024.12.17

Knowledge

2023.10.01

Cost per million tokens

Input$15

Cache Read:$7.5

Output$60

Experimental

Gemini 2.0 Flash Experimental

Google | gemini-2.0-flash-exp

Context Window

1,048,576 tokens

Max Output

8,192 tokens

Updated

2024.12.11

Knowledge

Unknown

Cost per million tokens

Input$0

Output$0

OpenRouter

Llama 3.3 70B Instruct (free)

Meta | llama-3.3-70b-instruct:free

Context Window

131,072 tokens

Max Output

131,072 tokens

Released

2024.12.06

Knowledge

2023.12

Cost per million tokens

Input$0

Output$0

OpenRouter

Llama 3.3 70B Instruct

Meta | llama-3.3-70b-instruct

Context Window

131,072 tokens

Max Output

131,072 tokens

Released

2024.12.06

Knowledge

2023.12

Cost per million tokens

Estimated Input$0.12

Estimated Output$0.3

GPT-4o (2024-11-20)

OpenAI | gpt-4o-2024-11-20

Context Window

128,000 tokens

Max Output

16,384 tokens

Released

2024.11.20

Knowledge

2023.10.01

Cost per million tokens

Input$2.5

Cache Read:$1.25

Output$10

Latest

Claude 3.5 Haiku

Anthropic | claude-3-5-haiku-20241022

Context Window

200,000 tokens

Max Output

8,192 tokens

Released

2024.11.04

Knowledge

2024.07

Cost per million tokens

Input$0.8

Cache Read:$0.08

Cache Write (5 Minute):$1

Cache Write (1 Hour):$1.6

Output$4

Claude 3.5 Sonnet (New) (deprecated)

Anthropic | claude-3-5-sonnet-20241022

Context Window

200,000 tokens

Max Output

8,192 tokens

Released

2024.10.22

Knowledge

2024.04

Cost per million tokens

Input$3

Cache Read:$0.3

Cache Write (5 Minute):$3.75

Cache Write (1 Hour):$6

Output$15

Gemini 1.5 Flash

Google | gemini-1.5-flash-002

Context Window

1,000,000 tokens

Max Output

8,192 tokens

Released

2024.09.24

Knowledge

2024.09

Cost per million tokens

Input$0.075

Cache Read:$0.01875

> 128K tokens:$0.15

Cache Read:$0.0375

Output$0.3

> 128K tokens:$0.6

Gemini 1.5 Pro

Google | gemini-1.5-pro-002

Context Window

2,000,000 tokens

Max Output

8,192 tokens

Released

2024.09.24

Knowledge

2024.09

Cost per million tokens

Input$1.25

Cache Read:$0.3125

> 128K tokens:$2.5

Cache Read:$0.625

Output$5

> 128K tokens:$10

ChatGPT-4o

OpenAI | chatgpt-4o-latest

Context Window

128,000 tokens

Max Output

16,384 tokens

Released

2024.08.14

Knowledge

2024.06

Cost per million tokens

Input$5

Output$15

GPT-4o

OpenAI | gpt-4o-2024-08-06

Context Window

128,000 tokens

Max Output

16,384 tokens

Released

2024.08.06

Knowledge

2023.10.01

Cost per million tokens

Input$2.5

Cache Read:$1.25

Output$10

GPT-4o mini

OpenAI | gpt-4o-mini-2024-07-18

Context Window

128,000 tokens

Max Output

16,384 tokens

Released

2024.07.18

Knowledge

2023.10.01

Cost per million tokens

Input$0.15

Cache Read:$0.075

Output$0.6

Claude 3.5 Sonnet (deprecated)

Anthropic | claude-3-5-sonnet-20240620

Context Window

200,000 tokens

Max Output

8,192 tokens

Released

2024.06.20

Knowledge

2024.04

Cost per million tokens

Input$3

Cache Read:$0.3

Cache Write (5 Minute):$3.75

Cache Write (1 Hour):$6

Output$15

GPT-4o (2024-05-13)

OpenAI | gpt-4o-2024-05-13

Context Window

128,000 tokens

Max Output

4,096 tokens

Released

2024.05.13

Knowledge

2023.10.01

Cost per million tokens

Input$5

Output$15

Claude 3 Haiku (deprecated)

Anthropic | claude-3-haiku-20240307

Context Window

200,000 tokens

Max Output

4,096 tokens

Released

2024.03.27

Knowledge

2023.08

Cost per million tokens

Input$0.25

Cache Read:$0.03

Cache Write (5 Minute):$0.3

Cache Write (1 Hour):$0.5

Output$1.25

Claude 3 Opus (deprecated)

Anthropic | claude-3-opus-20240229

Context Window

200,000 tokens

Max Output

4,096 tokens

Released

2024.02.29

Knowledge

2023.08

Cost per million tokens

Input$15

Cache Read:$1.5

Cache Write (5 Minute):$18.75

Cache Write (1 Hour):$30

Output$75

Understanding Language Models

Available Models

Filters

Provider

Status

GPT-5 Chat

GPT-5 nano

GPT-5 mini

GPT-5

Claude Opus 4.1

Gemini 2.5 Flash-Lite

Grok 4

Gemini 2.5 Flash

Gemini 2.5 Pro

DeepSeek-R1

Claude Sonnet 4

Claude Opus 4

o4-mini

o3

GPT-4.1

GPT-4.1 mini

GPT-4.1 nano

DeepSeek-V3

Gemini 2.0 Flash Lite

Claude 3.7 Sonnet

Gemini 2.0 Flash

Gemini 2.0 Flash Thinking Experimental

o3-mini

DeepSeek-R1 (250120)

DeepSeek-V3 (241226)

o1

Gemini 2.0 Flash Experimental

Llama 3.3 70B Instruct (free)

Llama 3.3 70B Instruct

GPT-4o (2024-11-20)

Claude 3.5 Haiku

Claude 3.5 Sonnet (New) (deprecated)

Gemini 1.5 Flash

Gemini 1.5 Pro

ChatGPT-4o

GPT-4o

GPT-4o mini

Claude 3.5 Sonnet (deprecated)

GPT-4o (2024-05-13)

Claude 3 Haiku (deprecated)

Claude 3 Opus (deprecated)