type
status
date
slug
summary
tags
category
icon
password
以下是常见的 LLM API 调用的价格, 按输出价格从低到高排序.
更新时间: 2024.03.16
模型名称 | 上下文长度 (K) | 提供商 | 输入 1M tokens (USD) | 输出 1M tokens (USD) ⬆️ | 备注 |
Mistral 7B | 8 | Mistral | 0.25 | 0.25 | |
Mixtral 8x7B | 32 | Groq | 0.27 | 0.27 | |
yi-34b-chat-0205 | 4 | 零一万物 | 0.35 | 0.35 | |
abab5.5s | 8 | MINIMAX | 0.69 | 0.69 | |
GLM-3-Turbo | 128 | 智谱 | 0.69 | 0.69 | |
Mixtral 8x7B | 32 | Mistral | 0.7 | 0.7 | |
yi-vl-plus | 4 | 零一万物 | 0.83 | 0.83 | 支持视觉 |
qwen-turbo | 8 | 阿里云灵积 | 1.11 | 1.11 | 输入上下文限制 6K |
Baichuan2-Turbo | 8 | 百川 | 1.11 | 1.11 | |
Claude 3 Haiku | 200 | Anthropic | 0.25 | 1.25 | 支持视觉 |
Baichuan-NPC-Lite | 百川 | 1.38 | 1.38 | ||
Baichuan2-53B (0:00-8:00) | 百川 | 1.39 | 1.39 | 分时计费 | |
GPT-3.5-Turbo | 16 | OpenAI | 0.5 | 1.5 | |
Gemini 1.0 Pro | 32 | Google | 0.5 | 1.5 | |
GPT-3.5-Turbo-0125 | 16 | Azure | 0.5 | 1.5 | |
yi-34b-chat-200k | 200 | 零一万物 | 1.67 | 1.67 | |
GPT-3.5-Turbo-Instruct | 4 | OpenAI | 1.5 | 2 | |
GPT-3.5-Turbo-Instruct | 4 | Azure | 1.5 | 2 | |
Mistral Small | 32 | Mistral | 2 | 2 | |
abab5.5 | 16 | MINIMAX | 2.08 | 2.08 | |
CharGLM-3 | 32 | 智谱 | 2.08 | 2.08 | |
xingchen-base | 8 | 阿里云通义星尘 | 2.08 | 2.08 | 输入上下文限制 6.5K |
xingchen-plus | 8 | 阿里云通义星尘 | 2.08 | 2.08 | 限时折扣 |
Baichuan-NPC-Turbo | 百川 | 2.08 | 2.08 | ||
Baichuan2-Turbo-192k | 192 | 百川 | 2.22 | 2.22 | |
Claude Instant | 100 | Anthropic | 0.8 | 2.4 | |
qwen-plus | 32 | 阿里云灵积 | 2.78 | 2.78 | 2024.3.18 前为 ¥40/1M tokens; ; 输入上下文限制 30K |
Baichuan2-53B (8:00-24:00) | 百川 | 2.78 | 2.78 | 分时计费 | |
Mistral Medium | 32 | Mistral | 2.7 | 8.1 | |
abab6 | 32 | MINIMAX | 13.89 | 13.89 | |
GLM-4 | 128 | 智谱 | 13.89 | 13.89 | |
GLM-4V | 2 | 智谱 | 13.89 | 13.89 | 支持视觉 |
Claude 3 Sonnet | 200 | Anthropic | 3 | 15 | 支持视觉 |
qwen-max | 8 | 阿里云灵积 | 16.67 | 16.67 | 2024.3.18 前限时免费; 输入上下文限制 6K |
qwen-max-1201 | 8 | 阿里云灵积 | 16.67 | 16.67 | 2024.3.18 前限时免费; 输入上下文限制 6K |
qwen-max-longcontext | 30 | 阿里云灵积 | 16.67 | 16.67 | 2024.3.18 前限时免费; 输入上下文限制 28K |
Claude 2.1 | 200 | Anthropic | 8 | 24 | |
Mistral Large | 32 | Mistral | 8 | 24 | |
GPT-4-Turbo | 128 | OpenAI | 10 | 30 | |
GPT-4-Turbo-Vision | 128 | OpenAI | 10 | 30 | 支持视觉 |
GPT-4-Turbo | 128 | Azure | 10 | 30 | |
GPT-4-Turbo-Vision | 128 | Azure | 10 | 30 | 支持视觉 |
GPT-4 | 8 | OpenAI | 30 | 60 | |
GPT-4 | 8 | Azure | 30 | 60 | |
Claude 3 Opus | 200 | Anthropic | 15 | 75 | 支持视觉 |
GPT-4-32K | 32 | OpenAI | 60 | 120 | |
GPT-4-32K | 32 | Azure | 60 | 120 | |
xingchen-longcontext | 32 | 阿里云通义星尘 | ? | ? | 价格未知, 申请白名单使用; 输入上下文限制 6.5K |
xingchen-max | 8 | 阿里云通义星尘 | ? | ? | 价格未知, 申请白名单使用; 输入上下文限制 6.5K |
- 作者:ljw
- 链接:https://ljw.ink/article/llm-api-pricing
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。