API 概述
黔前智算 API 提供类似硅基流动的大模型统一调用服务。一个平台 API Key 可调用 DeepSeek、豆包、智谱清言 GLM、百度文心一言等主流模型,也可扩展到私有 GPUStack / LM Studio 模型。
Base URL:
https://api.qianqianai.com/v1
协议: HTTPS
数据格式: JSON
认证方式
所有 API 请求都需要在 Header 中携带 API Key:
Authorization: Bearer TK-xxxxxxxxxxxxxxxx
您可以在控制台「API 密钥」页面创建和管理 API Key,并为单个 Key 设置全部模型或指定模型白名单。调用记录和 Token 用量会展示在控制台调用日志中。
可用模型示例
实际可用模型以 GET /v1/models 返回为准。常见模型名包括:
deepseek-chat:DeepSeek 通用对话模型moonshot-v1-8k:Kimi Moonshot 对话模型glm-4-flash:智谱清言 GLM 模型doubao-seed-1-6:豆包模型abab6.5s-chat:MiniMax 对话模型ernie-4.0-turbo-8k:文心一言模型
API 端点
1. Chat Completions
创建聊天完成请求,支持流式(SSE)与非流式输出,兼容 OpenAI 格式。
POST
/v1/chat/completions
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| model | string | 是 | 模型名称,如 deepseek-chat、glm-4-flash、moonshot-v1-8k |
| messages | array | 是 | 消息数组,包含 role 和 content |
| temperature | float | 否 | 采样温度,0-2,默认 1 |
| max_tokens | integer | 否 | 最大生成 token 数 |
| stream | boolean | 否 | 是否流式输出,默认 false |
| top_p | float | 否 | 核采样概率阈值,默认 1 |
| frequency_penalty | float | 否 | 频率惩罚,-2.0 到 2.0 |
| presence_penalty | float | 否 | 存在惩罚,-2.0 到 2.0 |
请求示例(非流式)
curl https://api.qianqianai.com/v1/chat/completions \
-H "Authorization: Bearer TK-xxxxxxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-chat",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "你好,请用一句话介绍黔前智算的大模型 API 服务。"}
],
"temperature": 0.7,
"max_tokens": 1000
}'
响应示例(非流式)
{
"id": "chatcmpl-xxx",
"object": "chat.completion",
"created": 1677652288,
"model": "deepseek-chat",
"choices": [{
"index": 0,
"message": {
"role": "assistant",
"content": "黔前智算提供 OpenAI 兼容的大模型统一调用服务,可通过一个 API Key 接入多家主流模型。"
},
"finish_reason": "stop"
}],
"usage": {
"prompt_tokens": 20,
"completion_tokens": 10,
"total_tokens": 30
}
}
流式调用示例(SSE)
curl https://api.qianqianai.com/v1/chat/completions \
-H "Authorization: Bearer TK-xxxxxxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-chat",
"messages": [{"role": "user", "content": "你好"}],
"stream": true
}'
2. Models List
获取当前 API Key 可调用的模型列表。
GET
/v1/models
curl https://api.qianqianai.com/v1/models \
-H "Authorization: Bearer TK-xxxxxxxxxxxxxxxx"
3. Embeddings
获取文本的向量表示,适合知识库、语义搜索和 RAG 场景。
POST
/v1/embeddings
curl https://api.qianqianai.com/v1/embeddings \
-H "Authorization: Bearer TK-xxxxxxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "bge-large-zh",
"input": "黔前智算提供大模型 API 服务"
}'
4. Images Generation
根据文本描述生成图像。
POST
/v1/images/generations
curl https://api.qianqianai.com/v1/images/generations \
-H "Authorization: Bearer TK-xxxxxxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "flux-schnell",
"prompt": "一只在草原上奔跑的金色狐狸,油画风格",
"size": "1024x1024"
}'
5. Audio Transcription
将音频文件转录为文本。
POST
/v1/audio/transcriptions
curl https://api.qianqianai.com/v1/audio/transcriptions \
-H "Authorization: Bearer TK-xxxxxxxxxxxxxxxx" \
-F "model=whisper-1" \
-F "file=@recording.mp3"
6. Responses API(OpenAI 新协议)
兼容 OpenAI Responses API,支持原生 Responses 格式或 Chat Completions 桥接。
POST
/v1/responses
curl https://api.qianqianai.com/v1/responses \
-H "Authorization: Bearer TK-xxxxxxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-chat",
"input": "你好,请介绍黔前智算"
}'
错误码
| 状态码 | 错误类型 | 说明 |
|---|---|---|
| 200 | OK | 请求成功 |
| 400 | Bad Request | 请求参数错误 |
| 401 | Unauthorized | API Key 无效或已过期 |
| 403 | Forbidden | 权限不足 |
| 429 | Too Many Requests | 请求频率超限 |
| 500 | Internal Server Error | 服务器内部错误 |
| 503 | Service Unavailable | 服务暂时不可用 |
限流说明
为了保证服务稳定性,API 调用有以下限流规则:
- 免费用户:60 请求/分钟
- 付费用户:600 请求/分钟
- 企业用户:6000 请求/分钟(可调整)
超过限流将返回 429 状态码,请合理控制请求频率。