大模型聚合平台 · MaaS 服务枢纽

中国移动 MoMA
模型聚合与智能路由平台介绍

MoMA（Model Marketplace Aggregator）是中国移动推出的统一大模型接入平台。通过标准化 API 网关与智能路由层，向企业及开发者提供多模型调用、负载优化与安全隔离能力，构建面向 AI 应用的模型基础设施。

300+

可调用模型

30%

推理成本优化区间

5种

内置路由策略

九天基座 DeepSeek 豆包通义千问 GLM LLaMA

平台核心技术特性

MoMA 统一调度层能力说明

⚙️

智能路由引擎

内置成本优先、效果优先、负载均衡等多种路由模式。根据请求特征动态选择最优模型，支持自定义策略扩展，实现精度与成本的动态平衡。

支持模型级/请求级路由切换

🔒

机密计算隔离

基于硬件级TEE技术（Intel TDX / AMD SEV），为敏感数据提供独立执行环境。推理过程不暴露原始输入，满足金融、政务等高合规场景。

符合 GB/T 39786 安全标准

📡

统一网关与流式计费

单套API覆盖全部接入模型，统一鉴权与实时Token计量。端到端计费延迟≤1分钟，支持细粒度用量分析及预算控制。

QPS 弹性扩展至 10w+

🧩

模型适配层

标准化输入输出格式（与OpenAI API兼容），自动适配不同模型的prompt模板与参数差异，大幅降低模型迁移与切换成本。

已适配 210+ 不同模型接口

📊

全链路可观测性

提供Token消耗分解、模型响应延迟、成功率及成本分析等运维指标，原生支持Prometheus/Grafana集成，便于企业自建监控体系。

数据保留周期 90天

🌐

边缘云协同调度

结合中国移动算力网络，支持将推理任务分发至边缘节点，降低中心城市延迟，推理时延可降至15ms内，已覆盖全国300+边缘节点。

毫秒级边缘响应

接入模型名录（部分）

以下展示 MoMA 平台的代表性模型类型与生态覆盖示例，便于快速理解其多模型聚合能力：

九天-139B (自研)DeepSeek-V3豆包·Doubao-pro 通义千问2.5-MaxGLM-4-Plus文心一言4.0 Turbo 百川Baichuan4MiniMax abab6.5智谱CodeGeeX4 Stable Diffusion 3.5LLaMA-3.1-405BFalcon-180B Claude-3.5 Sonnet讯飞星火4.0混元Large Yi-34B-ChatQwen2-VL-72BDeepSeek-Coder 以及 280+ 其它模型

平台关键性能指标

300+

接入模型总数

30%

综合成本优化幅度

50%

资源占用降低比例

<1min

流式计费延迟

99.95%

可用性 SLA

15ms

边缘节点最低延迟

页面中的性能数据与模型示例用于技术介绍展示，实际效果会因模型组合、部署环境、调用策略与业务场景而有所差异。

平台架构与对接规范

技术对接标准及服务层级

🔌

接口兼容性

RESTful API / WebSocket 流式
OpenAI API 兼容格式
支持gRPC协议（高吞吐场景）
多租户鉴权 (AK/SK + JWT)

📦

调用层级

普惠级：共享资源池，标准模型
企业级：独立算力队列 + 路由优选
机密级：TEE硬件隔离，私有化部署形态

🛡️

数据与隐私

日志脱敏与数据最小化原则
支持VPC私有网络对接
通过网络安全等级保护三级认证

技术文档与版本信息

平台完整 API 参考、模型列表及 SDK 信息可结合官方开发者文档进一步查阅。本文侧重于对平台能力、接入方式与架构分层做概览性介绍。

文档版本: v2.4.0 最后更新: 2026.04 协议: 支持 HTTP/2 及 gRPC

中国移动 MoMA模型聚合与智能路由平台介绍

300+

30%

5种

平台核心技术特性

智能路由引擎

机密计算隔离

统一网关与流式计费

模型适配层

全链路可观测性

边缘云协同调度

接入模型名录（部分）

平台关键性能指标

平台架构与对接规范

接口兼容性

调用层级

数据与隐私

技术文档与版本信息

中国移动 MoMA
模型聚合与智能路由平台介绍