大模型聚合平台 · MaaS 服务枢纽

中国移动 MoMA
模型聚合与智能路由平台介绍

MoMA(Model Marketplace Aggregator)是中国移动推出的统一大模型接入平台。通过标准化 API 网关与智能路由层,向企业及开发者提供多模型调用、负载优化与安全隔离能力,构建面向 AI 应用的模型基础设施。

300+

可调用模型

30%

推理成本优化区间

5种

内置路由策略
MoMA 智能路由层
九天基座 DeepSeek 豆包 通义千问 GLM LLaMA

平台核心技术特性

MoMA 统一调度层能力说明

⚙️

智能路由引擎

内置成本优先、效果优先、负载均衡等多种路由模式。根据请求特征动态选择最优模型,支持自定义策略扩展,实现精度与成本的动态平衡。

支持模型级/请求级路由切换
🔒

机密计算隔离

基于硬件级TEE技术(Intel TDX / AMD SEV),为敏感数据提供独立执行环境。推理过程不暴露原始输入,满足金融、政务等高合规场景。

符合 GB/T 39786 安全标准
📡

统一网关与流式计费

单套API覆盖全部接入模型,统一鉴权与实时Token计量。端到端计费延迟≤1分钟,支持细粒度用量分析及预算控制。

QPS 弹性扩展至 10w+
🧩

模型适配层

标准化输入输出格式(与OpenAI API兼容),自动适配不同模型的prompt模板与参数差异,大幅降低模型迁移与切换成本。

已适配 210+ 不同模型接口
📊

全链路可观测性

提供Token消耗分解、模型响应延迟、成功率及成本分析等运维指标,原生支持Prometheus/Grafana集成,便于企业自建监控体系。

数据保留周期 90天
🌐

边缘云协同调度

结合中国移动算力网络,支持将推理任务分发至边缘节点,降低中心城市延迟,推理时延可降至15ms内,已覆盖全国300+边缘节点。

毫秒级边缘响应

接入模型名录(部分)

以下展示 MoMA 平台的代表性模型类型与生态覆盖示例,便于快速理解其多模型聚合能力:

九天-139B (自研)DeepSeek-V3豆包·Doubao-pro 通义千问2.5-MaxGLM-4-Plus文心一言4.0 Turbo 百川Baichuan4MiniMax abab6.5智谱CodeGeeX4 Stable Diffusion 3.5LLaMA-3.1-405BFalcon-180B Claude-3.5 Sonnet讯飞星火4.0混元Large Yi-34B-ChatQwen2-VL-72BDeepSeek-Coder 以及 280+ 其它模型
模型覆盖领域:通用对话 | 代码生成 | 多模态理解 | 文生图 | 金融分析 | 医疗问答 | 法律文书 等垂直场景。

平台关键性能指标

300+
接入模型总数
30%
综合成本优化幅度
50%
资源占用降低比例
<1min
流式计费延迟
99.95%
可用性 SLA
15ms
边缘节点最低延迟

页面中的性能数据与模型示例用于技术介绍展示,实际效果会因模型组合、部署环境、调用策略与业务场景而有所差异。

平台架构与对接规范

技术对接标准及服务层级

🔌

接口兼容性

RESTful API / WebSocket 流式
OpenAI API 兼容格式
支持gRPC协议(高吞吐场景)
多租户鉴权 (AK/SK + JWT)

📦

调用层级

普惠级:共享资源池,标准模型
企业级:独立算力队列 + 路由优选
机密级:TEE硬件隔离,私有化部署形态

🛡️

数据与隐私

日志脱敏与数据最小化原则
支持VPC私有网络对接
通过网络安全等级保护三级认证

技术文档与版本信息

平台完整 API 参考、模型列表及 SDK 信息可结合官方开发者文档进一步查阅。本文侧重于对平台能力、接入方式与架构分层做概览性介绍。

文档版本: v2.4.0 最后更新: 2026.04 协议: 支持 HTTP/2 及 gRPC