GPT-SoVITS是一款强大的AI音色克隆软件。通过输入一个5秒的人声样本,用户可以立即体验到文字转语音的功能。同时,只需1分钟的训练数据,就可以对模型进行微调,从而提高语音相似性和真实感。
项目地址:https://top.aibase.com/tool/gpt-sovits
此外,该产品还支持跨语言,目前已经支持英语、日语和中文等多种语言的推理。产品还集成了声音伴奏分离、自动训练集分割、中文ASR以及文本标注等工具,可以帮助初学者创建训练数据集和GPT/SoVITS模型。
同时,该产品支持在Windows环境下运行,并经过了Python3.9、PyTorch2.0.1以及CUDA11的测试,同时也提供了快速安装指南。
产品核心功能:
输入5秒的声音样本即可进行文字转语音转换;
仅需1分钟的训练数据即可实现模型微调;跨语言支持,包括英语、日语和中文;
集成声音伴奏分离、自动训练集分割、中文ASR和文本标注等辅助工具;
支持在Windows环境下运行,经过了Python3.9、PyTorch2.0.1和CUDA11的测试。