MIMO TTS Proxy

OpenAI 兼容 TTS 代理服务

系统概览

API 配置

检查中...

FFmpeg

检查中...

音频文件

-

存储占用

-

音色映射表

OpenAI 音色 MIMO 音色 说明

API 文档

基础信息

API 请求地址

支持的模型

tts-1 tts-1-hd

两个模型在本代理中效果一致,仅为兼容 OpenAI 格式

说明:本接口完全兼容 OpenAI TTS API 格式,第三方 OpenAI 客户端可直接调用,只需将 base_url 指向本服务地址即可。

认证方式:调用 API 时需要在请求头中携带 Authorization: Bearer YOUR_API_KEY。 API Key 可在「系统设置」页面查看和管理。

音色映射表

OpenAI 音色 MIMO 音色 特点说明
alloy mimo_default 中性通用音色
echo 苏打 年轻男声
fable 茉莉 温柔女声
onyx 白桦 低沉男声
nova Chloe 明亮女声
shimmer 冰糖 柔和女声

请求参数

参数名 类型 必填 默认值 说明
model string tts-1 模型名称,支持 tts-1 / tts-1-hd
input string - 要合成的文本内容
voice string alloy 音色名称,见音色映射表
response_format string mpga 输出格式:wav / mp3 / mpga
speed number 1.0 语速,范围 0.25 ~ 4.0
stream boolean true 是否流式返回
lifetime_hours number 72 扩展参数 文件生命周期(小时),1~87600,0 表示永久

请求示例

cURL
curl -X POST http://localhost:3000/v1/audio/speech \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer your-api-key" \
  -d '{
    "model": "tts-1",
    "input": "你好,欢迎使用 MIMO TTS Proxy 服务",
    "voice": "alloy",
    "response_format": "mpga",
    "stream": true,
    "speed": 1.0
  }' --output output.mp3
Python (openai 库)
from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",
    base_url="http://localhost:3000/v1"
)

# 流式输出
with client.audio.speech.with_streaming_response.create(
    model="tts-1",
    voice="alloy",
    input="你好,世界"
) as response:
    response.stream_to_file("output.mp3")

# 非流式输出
response = client.audio.speech.create(
    model="tts-1",
    voice="alloy",
    input="你好,世界",
    stream=False
)
print(response)
Node.js (openai 库)
import OpenAI from "openai";

const openai = new OpenAI({
  apiKey: "your-api-key",
  baseURL: "http://localhost:3000/v1",
});

// 流式输出
const response = await openai.audio.speech.create({
  model: "tts-1",
  voice: "alloy",
  input: "你好,世界",
  stream: true,
});

const buffer = Buffer.from(await response.arrayBuffer());
await fs.writeFile("output.mp3", buffer);
JSON 请求体
{
  "model": "tts-1",
  "input": "你好,欢迎使用 MIMO TTS Proxy 服务",
  "voice": "alloy",
  "response_format": "mpga",
  "speed": 1.0,
  "stream": false,
  "lifetime_hours": 72
}

响应说明

流式响应 (stream=true)

直接返回音频二进制流

  • • Content-Type: audio/mpeg (mp3/mpga)
  • • Content-Type: audio/wav (wav)
  • • Transfer-Encoding: chunked

非流式响应 (stream=false)

返回 JSON,包含 url 字段指向音频文件地址

{
  "url": "http://localhost:3000/audio/abc123def456.mpga",
  "id": "abc123def456",
  "format": "mpga",
  "size": 15360,
  "createdAt": 1719000000000,
  "expiresAt": 1719259200000
}

在线测试

兼容 OpenAI 格式,两者效果一致

mpga 为 OpenAI 客户端通用格式

快速示例:

配置参数后点击生成按钮开始合成

文件管理

文件名 格式 大小 创建时间 过期时间 操作
加载中...

请求日志

快捷选择:

总请求数

-

成功 / 失败

- / -

平均耗时

-

音频总大小

-

时间 IP 模型 音色 格式 状态 耗时 操作
加载中...

系统设置

从小米 MIMO 控制台获取的 API Key

0 表示永久保存

修改端口后需要重启服务生效

超过保留天数的日志将被自动清理

API Key(外部调用凭证)

外部 OpenAI 客户端调用本服务时需要使用此 API Key 进行认证。

刷新后旧 Key 将立即失效,所有使用旧 Key 的客户端都需要更新配置。

Base64 转 WAV 工具

账号管理

修改为新账号