语音合成、音乐生成

腾讯云语音识别

腾讯云语音识别

实时与录音文件 ASR、热词与行业定制。

声网智能对话

声网智能对话

实时音视频与对话式 AI、RTC 场景化方案(见官网智能体相关)。

海螺语音

海螺语音

MiniMax 海螺语音合成与音色能力(见官网语音产品)。

标贝科技

标贝科技

中文语音合成、音色定制与语音数据服务。

睿声 Reecho

睿声 Reecho

中文语音合成与角色音色定制。

通义听悟

通义听悟

通义听悟,AI会议转录工具,阿里云通义听悟是聚焦音视频内容的工作学习AI助手,依托大模型,帮助用户记录、整理和分析音视频内容,体验用大模型做音视频笔记、整理会议记录。通义听悟的定义与功能 通义听悟的定义 通义听悟是阿里云推出的一款基于大模型的工作学习AI助手,旨在为用户提供更加智能、高效的语音识别、语音合成、语义理解等服务。它

智影

智影

智影,智影是一个集素材搜集、视频剪辑、后期包装、渲染导出和发布于一体的免费在线剪辑平台,能够为用户提供从端到端的一站式视频剪辑及制作服务。丰富的内容资源和强大的智能工具,能够帮助用户高效完成视频剪辑、文章转视频、智能去水印、文本转语音等操作,通过智能工具提升在线视频制作效能,智影是一个集素材搜集、视频剪辑、后期包装、渲染导出和发布于一体的免费在线剪辑平台,能够为用户提供从端到端的一站式视频剪辑及制作服务。丰富的内容资源和强大的智能工具,能够帮助用户高效完成视频剪辑、文章转视频、智能去水印、文本转语音等操作,通过智能工具提升在线视频制作效能

ElevenLabs

ElevenLabs

ElevenLabs, AI音频平台,提供文本转语音、语音克隆和配音服务,AI audio platform offering text-to-speech, voice cloning, and dubbing services. 什么是ElevenLabs? ElevenLabs提供AI音频工具,包括文本转语音和AI语音生成,支持数千种声音和32种语言。它为企业需求提

鲲穹AI工具箱

鲲穹AI工具箱

「鲲穹AI工具箱」定位 文本与写作,侧重 视频与多媒体。建议结合官网能力说明与试用评估是否匹配你的流程。

VoxCeleb

VoxCeleb

「VoxCeleb」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

LibriSpeech

LibriSpeech

「LibriSpeech」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Common Voice

Common Voice

「Common Voice」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Acapela

Acapela

「Acapela」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Nuance

Nuance

「Nuance」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Mozilla Common Voice

Mozilla Common Voice

「Mozilla Common Voice」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Lyrebird AI

Lyrebird AI

「Lyrebird AI」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

iSpeech

iSpeech

「iSpeech」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Assembly AI

Assembly AI

「Assembly AI」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Rev AI

Rev AI

「Rev AI」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Speechmatics

Speechmatics

「Speechmatics」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Vocapia

Vocapia

「Vocapia」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Stable Audio

Stable Audio

「Stable Audio」定位 AI音频工具,侧重 效率与自动化。建议结合官网能力说明与试用评估是否匹配你的流程。

OpenAI Whisper

OpenAI Whisper

「OpenAI Whisper」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Mozilla TTS

Mozilla TTS

「Mozilla TTS」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

VITS

VITS

「VITS」定位 AI音频工具,侧重 效率与自动化。建议结合官网能力说明与试用评估是否匹配你的流程。

Glow-TTS

Glow-TTS

「Glow-TTS」定位 AI音频工具,侧重 效率与自动化。建议结合官网能力说明与试用评估是否匹配你的流程。

VALL-E

VALL-E

「VALL-E」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Bark

Bark

「Bark」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Tortoise TTS

Tortoise TTS

「Tortoise TTS」定位 AI音频工具,侧重 效率与自动化。建议结合官网能力说明与试用评估是否匹配你的流程。

Coqui TTS

Coqui TTS

「Coqui TTS」定位 AI音频工具,侧重 效率与自动化。建议结合官网能力说明与试用评估是否匹配你的流程。

Respeecher

Respeecher

「Respeecher」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Krisp

Krisp

Krisp, 由人工智能驱动的噪声消除、会议转录和口音转换,实现清晰沟通,AI-powered noise cancellation, meeting transcription, and accent conversion for clear communication. 什么是Krisp? Krisp是一款由人工智能驱动的解决方案,可以消除会议和通话中的背景噪声和回声

WellSaid Labs

WellSaid Labs

WellSaid Labs,可在几秒钟内将文本转换为画外音,提供 50 多种高质量合成语音,可在几秒钟内将文本转换为画外音,提供 50 多种高质量合成语音

Listnr

Listnr

「Listnr」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Amper Music

Amper Music

「Amper Music」定位 AI音频工具,侧重 效率与自动化。建议结合官网能力说明与试用评估是否匹配你的流程。

Boomy

Boomy

Boomy, Boomy:创建和分享 AI 生成的音乐,聆听后获得收入,Boomy: Create and share AI-generated music, get paid for listens. 什么是Boomy? Boomy 是一个平台,允许用户瞬间制作音乐并与全世界分享。它使得即使没有任何音乐经验的用户也能在几秒钟内创作原创歌曲。用户可以在 Spotify

Jukebox

Jukebox

「Jukebox」定位 AI音频工具,侧重 效率与自动化。建议结合官网能力说明与试用评估是否匹配你的流程。

Speechify

Speechify

「Speechify」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Lovo AI

Lovo AI

LOVO AI, AI语音生成器和文本转语音平台,提供逼真的声音和视频编辑功能,AI voice generator and text to speech platform with realistic voices and video editor. 什么是LOVO AI? LOVO是一个AI语音生成器和文本转语音平台,受到成千上万创作者的使用。它提供300多种声音和100种

Murf AI

Murf AI

Murf AI, 多功能的 AI 语音生成器,用于文本到语音、配音和翻译,Versatile AI voice generator for text to speech, voiceovers, and translations. 什么是Murf AI? Murf AI 是一款多功能的 AI 语音生成器,它使用户能够使用逼真的 AI 语音将文本转换为语音。它可以在几分钟内

Resemble AI

Resemble AI

「Resemble AI」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

AIVA

AIVA

「AIVA」定位 AI音频工具,侧重 效率与自动化。建议结合官网能力说明与试用评估是否匹配你的流程。

LALAL.AI

LALAL.AI

LALAL.AI, 基于AI的人声去除和音乐源分离服务,AI-powered vocal remover and music source separation service. 什么是LALAL.AI? LALAL.AI 是一款下一代人声去除和音乐源分离服务,用于快速、简单且精确的音轨提取。它允许用户在不损失质量的情况下去除人声、乐器、鼓声、低音、钢琴

Label Studio

Label Studio

Label Studio,开源的数据标注工具,A flexible data labeling tool for all data types. Prepare training data for computer vision, natural language processing, speech, voice, and video mod

麦耳会记

麦耳会记

「麦耳会记」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。

Voicemaker

Voicemaker

Voicemaker, AI 驱动的文字转语音转换器,具有人声旁白和高级自定义选项,AI-powered text-to-speech converter with human-like voiceovers and advanced customization options. 什么是Voicemaker? Voicemaker 是一个基于人工智能的在线文字转语音转换网站,帮助内

MetaVoice

MetaVoice

MetaVoice,用AI人工智能新型技术,实现超逼真声音呈现,用AI人工智能新型技术,实现超逼真声音呈现

Veed AI Voice Generator

Veed AI Voice Generator

「Veed AI Voice Generator」定位 AI音频工具,侧重 语音与音频。建议结合官网能力说明与试用评估是否匹配你的流程。