← 博客
指南

如何免费转录音频

把 MP3、M4A、WAV、WebM 和视频音轨转成可审阅 transcript 的实用指南。

5 分钟 · Orpheus team

音频转录真正有用的前提,不只是拿到一整段文字,而是能审阅、能导出、能回到原始音频核对。生产工作流里,你通常需要原始音频、带时间戳的 transcript,以及稳定的导出格式。

最快的使用方式

  1. 打开 Orpheus,上传音频或视频文件。
  2. 短文件可以先用免费工具测试;需要历史记录和导出时再登录。
  3. 等待转录任务完成。
  4. 审阅带时间戳的 segments。
  5. 按你的工作流导出为 text、JSON、VTT 或 SRT。

长录音应该走异步流程:上传文件、创建任务、通过轮询或 webhook 接收结果。这样不会被浏览器超时卡住,也更适合可恢复上传和批量处理。

哪些文件效果最好?

MP3、M4A、WAV、WebM、OGG 和 FLAC 都是安全格式。清晰的人声、合适的音量、较少背景噪音会显著提升准确率。如果录音里有长时间静音、音乐或多人同时说话,发布前一定要人工复核。

发布前要检查什么?

  • 人名、公司名和专业术语。
  • 准备公开引用的原话。
  • 法律、医疗、教育、无障碍用途的字幕。
  • 多人重叠说话或背景噪音明显的片段。

AI 转录能大幅提速,但重要内容仍然需要人工审阅。

什么时候用 API?

当转录是你产品或内部系统的一部分时,用公开 API。Orpheus 的公开 API 是 async-first:创建任务、可靠处理文件、通过 webhook 或轮询拿结果。这是生产集成里更稳定的合同。