中国移动 MoMA
模型聚合与智能路由平台介绍
MoMA(Model Marketplace Aggregator)是中国移动推出的统一大模型接入平台。通过标准化 API 网关与智能路由层,向企业及开发者提供多模型调用、负载优化与安全隔离能力,构建面向 AI 应用的模型基础设施。
300+
可调用模型30%
推理成本优化区间5种
内置路由策略平台核心技术特性
MoMA 统一调度层能力说明
智能路由引擎
内置成本优先、效果优先、负载均衡等多种路由模式。根据请求特征动态选择最优模型,支持自定义策略扩展,实现精度与成本的动态平衡。
机密计算隔离
基于硬件级TEE技术(Intel TDX / AMD SEV),为敏感数据提供独立执行环境。推理过程不暴露原始输入,满足金融、政务等高合规场景。
统一网关与流式计费
单套API覆盖全部接入模型,统一鉴权与实时Token计量。端到端计费延迟≤1分钟,支持细粒度用量分析及预算控制。
模型适配层
标准化输入输出格式(与OpenAI API兼容),自动适配不同模型的prompt模板与参数差异,大幅降低模型迁移与切换成本。
全链路可观测性
提供Token消耗分解、模型响应延迟、成功率及成本分析等运维指标,原生支持Prometheus/Grafana集成,便于企业自建监控体系。
边缘云协同调度
结合中国移动算力网络,支持将推理任务分发至边缘节点,降低中心城市延迟,推理时延可降至15ms内,已覆盖全国300+边缘节点。
接入模型名录(部分)
以下展示 MoMA 平台的代表性模型类型与生态覆盖示例,便于快速理解其多模型聚合能力:
平台关键性能指标
页面中的性能数据与模型示例用于技术介绍展示,实际效果会因模型组合、部署环境、调用策略与业务场景而有所差异。
平台架构与对接规范
技术对接标准及服务层级
接口兼容性
RESTful API / WebSocket 流式
OpenAI API 兼容格式
支持gRPC协议(高吞吐场景)
多租户鉴权 (AK/SK + JWT)
调用层级
普惠级:共享资源池,标准模型
企业级:独立算力队列 + 路由优选
机密级:TEE硬件隔离,私有化部署形态
数据与隐私
日志脱敏与数据最小化原则
支持VPC私有网络对接
通过网络安全等级保护三级认证
技术文档与版本信息
平台完整 API 参考、模型列表及 SDK 信息可结合官方开发者文档进一步查阅。本文侧重于对平台能力、接入方式与架构分层做概览性介绍。