AI 模型广场
开箱即用的大模型 API:统一接入、按量计费、弹性扩展。选购资源包即可调用多系列主流模型,专注业务而非基建。
- 多系列模型一站式
- 兼容 OpenAI 风格接口
- 按需扩展与私有化选项
主流模型速览
> python ./chat.py
✓ Initialized.
✓ Running GLM-5 on Gitee AI!
模型列表
18 元/百万 Token or 或 0.05 元/次
智谱新一代旗舰对话模型,强化复杂推理、工具调用与长上下文一致性,适合企业客服、智能体与工作流编排;支持 Function Calling 与流式输出,便于对接现有业务系统。
3 元/百万 Token or 或 0.03 元/次
高性价比通用大模型,支持深度思考模式与长文本理解,在代码、数学与逻辑题上表现均衡;适合研发辅助、数据分析、批量推理与 A/B 成本敏感场景。
10 元/百万 Token or 或 0.04 元/次
通义 MoE 架构大模型,在效果与成本之间取得平衡;支持工具调用、多轮对话与长上下文检索,适合高并发 API、RAG 与多租户 SaaS。
免费
GLM-4.7-Flash 作为 30B 级 SOTA 模型,在效率与效果之间提供新选择;面向 Agentic Coding 场景强化了代码与工具调用。轻量高速、首 Token 延迟低,适合对话、摘要、分类与简单工具调用;在免费额度内可快速验证原型与灰度上线。
21 元/百万 Token or 或 0.08 元/次
Moonshot 长上下文与多模态能力突出,适合长文档理解、图文混合问答与复杂 Agent 流程;支持视觉输入与工具调用,便于构建企业知识助手。
4 元/百万 Token or 或 0.02 元/次
面向代码生成、重构与仓库级语义理解的编程专用模型,支持多种语言与目录结构上下文,适合 IDE 插件、CI 生成与代码评审辅助。
8 元/百万 Token or 或 0.03 元/次
DeepSeek 代码向指令模型,补全与跟随能力强,适合终端内联提示、脚本生成与单元测试草稿;兼容常见编程范式与注释风格。
免费
面向医疗问答与辅助决策场景的专用模型,强调合规表述与可解释性;适用于预问诊、文献摘要与科研辅助(不替代执业医师诊断)。
免费
小规模开源友好模型,推理与部署成本低,适合私有化、边缘设备与教学实验;支持常见推理框架与量化部署。
14 元/百万 Token or 或 0.04 元/次
腾讯混元系列通用对话模型,中文语境与业务表达自然,适合客服、营销文案与办公协作;支持工具调用与流式响应,便于接入微信生态相关业务。
12 元/百万 Token or 或 0.035 元/次
文心大模型 Turbo 版本,在推理速度与效果间折中,适合搜索增强、摘要与多轮对话;对中文知识覆盖与合规表述有较好支持。
6 元/百万 Token or 或 0.025 元/次
阶跃星辰轻量通用模型,适合对话、翻译与轻量 Agent;延迟与成本可控,便于与 Step 系列大模型组合成分层路由策略。
2 元/百万 Token or 或 0.015 元/次
书生·浦语开源系列对话模型,社区生态活跃,适合二次微调、私有化与学术研究;支持常见推理框架与 LoRA 微调流程。
8.4 元/百万 Token or 或 0.02 元/次
MiniMax 多模态与语音能力均衡,适合对话、播客脚本与实时交互场景;支持长上下文与工具调用,便于构建语音与文本一体化应用。
0.03 元/次
大规模视觉语言模型,在图文理解、OCR 与多模态推理上表现稳定;适合文档解析、屏幕问答与行业视觉智能体。
0.7 元/百万 Token or 或 0.005 元/次
轻量视觉指令模型,在图文对齐与工具调用上均衡,适合对话式图像理解、票据与报表抽取、低成本多模态 API。
0.04 元/次
【仅限体验】带深度推理能力的视觉模型,面向多模态对齐与跨域语义理解优化,适合评测、对齐实验与英文场景。
12 元/百万 Token or 或 0.05 元/次
旗舰级视觉语言模型,在图文混合推理、长文档与视频帧理解上能力强;适合复杂检索、多模态 Agent 与企业知识库。
8 元/百万 Token or 或 0.03 元/次
智谱多模态视觉模型,支持图像理解、图表与拍照解题;中文场景友好,适合企业文档、营销素材与客服辅助。
5 元/百万 Token or 或 0.02 元/次
DeepSeek 视觉语言系列,兼顾推理与成本;在图像问答、文档理解等任务上表现稳定,适合多模态研发与批量推理。
2.8 元/百万 Token or 或 0.02 元/次
MoE 架构指令模型,在效果与成本之间均衡;适合多轮对话、长上下文与通用推理任务。
免费
小规模开源友好模型,支持深度思考与 MindSpore 生态,适合私有化与边缘部署。
10 元/百万 Token or 或 0.05 元/次
大规模 MoE 旗舰模型,深度思考能力突出,适合复杂推理、长文分析与高要求 Agent。
0.02 元/次
通义 2 代 72B 指令模型,通用对话与指令跟随稳定,适合按次计费的轻量接入。
10 元/百万 Token or 或 0.05 元/次
旗舰 MoE 指令版,支持 Function Calling 与长上下文检索,适合企业 RAG 与多步工具调用。
免费
轻量 7B 指令模型,适合教学、原型验证与低延迟对话场景。
1.26 元/百万 Token or 或 0.015 元/次
Qwen2.5 系列中规模模型,通用能力均衡,适合客服、写作与多轮对话。
4 元/百万 Token or 或 0.02 元/次
强化推理与数学逻辑,支持深度思考模式与 MindSpore,适合复杂问题与科研辅助。
0.01 元/次
高性价比 14B 指令模型,支持工具调用,适合集成与按次计费场景。
16 元/百万 Token or 或 0.05 元/次
通义代码大模型旗舰,支持长代码上下文与仓库级理解,适合 IDE、CI 与大规模代码代理。
0.02 元/次
32B 代码指令模型,补全与跟随能力强,适合终端与脚本生成场景。
1.4 元/百万 Token or 或 0.01 元/次
面向界面与多端交互的轻量模型,适合 UI 语义理解、布局分析与低代码场景。
4 元/百万 Token or 或 0.02 元/次
MoE 代码模型,兼顾推理与成本;适合多语言仓库与中型团队研发流程。
8 元/百万 Token or 或 0.03 元/次
DeepSeek 第三代通用大模型满血版,约 685B 规模,0324 升级路线;支持工具调用与稳定长上下文,适合企业推理与复杂 Agent。
16 元/百万 Token or 或 0.05 元/次
强化推理与思维链能力,0528 升级路线;适合数学证明、代码推理与需要显式思考过程的问答场景。
免费
基于 Qwen 蒸馏的轻量推理模型,支持 MindSpore 等框架,适合私有化与边缘侧部署。
1.26 元/百万 Token or 或 0.02 元/次
32B 蒸馏推理模型,在效果与成本之间折中,适合研发辅助、批量推理与 A/B 实验。
3 元/百万 Token or 或 0.02 元/次
实验分支,MIT 协议友好;支持工具调用与较长上下文,适合尝鲜与对比评测(以官方说明为准)。
12 元/百万 Token or 或 0.05 元/次
V3 系列迭代版本,强化工具调用与多轮一致性;适合企业知识库、客服与中等长度上下文任务。
免费
7B 级蒸馏推理模型,延迟低、易部署,适合教学、原型与轻量推理场景。
免费
超小体量推理蒸馏模型,适合端侧、嵌入式与极低算力环境。
12 元/百万 Token or 或 0.05 元/次
V3.1 系列变体,面向长上下文与稳定工具调用;适合需要持续会话与检索增强的业务流程。