音频转字幕/文字_srt字幕生成

1. 应用户倡议，开辟音频转录字幕功能，按音频时长（秒）计费，可通过点数兑换转录时长（1点=120秒）；

2. 由于视频文件过大，仅支持上传音频文件，主流格式都支持，推荐使用本站出品的批量视频转音频工具；

3. 本站接入多个转录模型，由于各模型擅长语种不同，故会根据源语言自动推荐最佳的模型；

4. 不同转录模型的价格、速度、特性各不同，具体请看页面下方的【转录模型比较】表格；

5. 为方便用户，每个转录订单会同时提供srt字幕文件、txt文本文件，并同时提供多个【标点符号】版本；

6. 目前所有模型处理日语、韩语识别质量可以，但断句处理不佳，容易出现某些行句子过长，请知悉；

7. 对于执行失败的订单，系统会自动退返『转录时长』；

8. 转录功能公测中，欢迎您反馈bug与建议，我们会酌情给予点数奖励。客服QQ：2801088826

【2025.3.5】修复nova2订单失败问题。

转录模型比较

模型	定价	速度	时长上限	支持语言	特点
Distil-Whisper-large-v3	基础时长*0.2（0.007-0.02元/分钟）	较快	5小时	英语	whisper改进版本，无幻觉，英语专用，智能断句，性价比高缺点：夜间容易超时
Whisper-large-v3	基础时长*0.4（0.014-0.04元/分钟）	一般	5小时	主流语言56种	whisper原版最强型号，各语种都比较擅长，字母语言智能断句缺点：存在轻微幻觉、速度一般、夜间容易超时
腾讯系列	基础时长*1（0.035-0.1元/分钟）	极快	5小时	普通话、方言等	中文识别首选，智能断句，速度快缺点：多语种识别结果语言不统一
[腾讯]普方英	基础时长*1.5（0.05-0.15元/分钟）	极快	5小时	普通话+方言+英语	普通话+方言+英语识别首选缺点：识别结果语言不统一
Nova-2	基础时长*1.5（0.05-0.15元/分钟）	极快	5小时	主流语言31种	擅长字母语言，字母语言智能断句，速度快缺点：非字母语言断句可能有瑕疵
Whisper-Zero	基础时长*3（0.105-0.3元/分钟）	较快	135分钟	主流语言56种	whisper改进版本，无幻觉；擅长字母语言（智能断句），支持多个源语言缺点：价格贵，多语种识别结果语言不统一

支持多个转录模型

本站经多轮测试、精挑细选的转录模型，具有高质量与高性价比
根据源语言推荐模型

系统根据源语言智能推荐最佳的转录模型，省时省力
提供多版本文件下载

每个订单提供srt、txt格式文件，srt文件提供2-3种标点符号版本
按时长计费全网最低价

市场普遍0.2-0.3元/分钟，本站低至0.007元/分钟；单次充值越多，优惠越大
支持56种主流语言

支持各种主流语言，汉语方言，支持多语种识别
后期智能断句处理

对部分质量高、但默认断句不佳的模型，后期进行智能断句处理，如Whisper、[腾讯]中文、Nova-2
异步处理快速出结果

后台异步处理，可以同时多开几个订单；腾讯最长3小时内出结果，Nova-2最长10分钟内出结果
音频预处理提高转录质量

采样率统一转为16khz，也可开启智能降噪（人声分离），提高转录质量

已加入后台任务，可关闭本页面，稍后到【转录订单】查看详情

说明：不同模型耗时不同，具体耗时可参考等待时间

转录功能仅对VIP会员开放

音频文件分析：

请先选择源语言：

推荐模型：

标点符号：

语气词过滤：

脏词过滤：

智能格式化：

说话人分类：

热词：

帮助说明

计费方式：

补充说明

转录模型比较

支持多个转录模型

根据源语言推荐模型

提供多版本文件下载

按时长计费全网最低价

支持56种主流语言

后期智能断句处理

异步处理快速出结果

音频预处理提高转录质量

转录功能仅对VIP会员开放

音频文件分析：

请先选择源语言：

推荐模型：

标点符号：

语气词过滤：

脏词过滤：

智能格式化：

说话人分类：

热词：

帮 助 说 明

计费方式：

补充说明

转录模型比较

支持多个转录模型

根据源语言推荐模型

提供多版本文件下载

按时长计费 全网最低价

支持56种主流语言

后期智能断句处理

异步处理 快速出结果

音频预处理 提高转录质量

帮助说明

按时长计费全网最低价

异步处理快速出结果

音频预处理提高转录质量