小智AI声音复刻(公测)控制台操作指引

小智AI声音复刻(公测)控制台操作指引
小智AI终于迎来了期盼已久的声音复刻功能正式公测,本篇为用户提供声音复刻PC版和手机版(待补充)浏览器版本的操作指引:

关于声音复刻

声音复刻是指通过技术手段复制特定人物的声音,使其听起来与原始声音高度相似。以下是其主要内容:

技术原理

  • 语音采集:录制目标人物的语音样本。
  • 特征提取:分析语音的频率、音调等特征。
  • 模型训练:使用AI机器学习或深度学习训练模型,学习目标声音的特征。
  • 生成语音:通过模型生成与目标声音相似的新语音。

应用场景

  • 娱乐:用于电影、游戏中的配音。
  • 辅助技术:帮助失声者恢复语音能力。
  • 虚拟助手:定制个性化的语音助手。(小智AI适用)
  • 教育:用于语言学习中的发音纠正。(小智AI适用)

技术及挑战

  • 数据需求:需要大量高质量的基础语音数据。
  • 计算资源:训练模型需要高性能计算设备和算力支持。
  • 伦理问题:可能被滥用于伪造语音,引发法律和道德问题。
重要提醒:
请购买声音复刻用户遵守国家相关法律,不得从事非法活动。

PC端浏览器操作指引

2.1 声音复刻入口

个人电脑用户浏览器访问 https://xiaozhi.me ,用户登录后,通过控制台按钮进入小智AI控制台主页面,请在导航栏点击“声音复刻”进入声音复刻页面,如下图示:

2.2 购买声音复刻操作

在控制台 / 声音复刻 页面,声音复刻列表 右侧点击“购买”按钮,进入购买声音复刻产品页面,如下图示。
当前公测复刻有优惠活动,原价150元/年,优惠51元,现价为 99元/年,可以复刻8次。
请用户使用微信扫一扫完成微信支付付款(支付过程在手机上完成,操作步骤从略),购买成功后,将出现一条新的声音复刻购买记录行,包括声音ID、声音名称(可自行修改)、复刻效果试听、可用复刻次数、到期时间,状态、支付状态、操作项等,具体如下图示:

2.3 声音复刻操作

请在上图声音复刻列表,在对应声音复刻记录行 点击 “复刻” 链接,进入声音复刻操作页面,如下图示。
注意事项:
音频时长8-30秒,单人的清晰发音,无明显噪音和回声。
首次复刻成功5分钟之后,才能配置AI:智能体 -> 配置角色 -> 角色音色 里选择使用。

方式1:麦克风录制音频

准备工作

如果你的电脑上安装了麦克风等录音设备,且麦克风设备正常工作,否则将提示 无法访问麦克风。
如果麦克风正常工作,并允许浏览器授权访问,才可以使用麦克风直接录制音频。

录音操作

1)请确认在 声音复刻 页面 选择 麦克风录制音频 选项(默认),在下方 点击 “开始录音” 按钮,开始录音操作。
2)开始录音后,操作按钮将变成 “停止录音” 红色按钮,并进行计时提示,请按照页面提示文字进行朗读,建议调整状态,确保周围环境较为安静,朗读时保持正常语速,发音清晰洪亮。
3)朗读完文本之后,点击“停止录音”按钮,结束录音操作,页面提示 录音已完成,将进入下一步。

方式2:本地音频文件上传

准备音频文件

请先准备好音频文件,可以通过自己手机录制或其他渠道获取的授权的声音文件,格式为 WAV、MP3格式,时长小于2分钟。
注意:如果是视频文件带有的声音,或者声音文件超长,可以使用剪辑软件进行分离,或裁剪处理。如常用 剪映 软件/App。

上传音频文件

1)请在声音复刻页面,选择 “本地音频文件” 选项,如下图示。
2)在上图页面点击“选择音频文件” 按钮,通过文件夹浏览操作,导入本地已经录制或处理好的音频文件。如下图示:
3)页面提示音频已上传。

2.4 确认音频

1)不论是通过麦克风录制音频,或是本地音频文件上传,都需要进行音频确认操作。
2)用户可以确认音频是否满意,并可以播放试听音频,支持剪辑音频(通过竖线选区),但需要确保选区时长在8秒-60秒中间,如下图示。
如果用户对当前准备复刻的音频完全不满意,可以点击“重置”按钮,返回重新开始录制音频或从本地上传音频文件。
注意:如果音频文件时长过短或过长,将不能“确认音频”进行复刻操作。
3)在上一步页面确认音频后,将提示音频准备就绪,用户确认进行复刻,复刻过程一般需要3-5分钟。
用户如果确认无误,请点击 “开始复刻” 按钮正式进行声音复刻,页面将关闭弹层,返回声音复刻列表,状态显示为“复刻中”。

2.5 声音复刻成功

声音复刻需要消耗服务器计算资源,一般需要等待5分钟左右,再次刷新声音复刻列表页面,对应的复刻记录行状态即可变为“复刻成功”,至此,声音复刻已经完成。
为方便后续在角色音色选择项中识别,建议修改声音名称,这里示例修改为“surfer本人”,仅供参考,如下图示。

2.6 使用复刻声音

声音复刻好了之后,需要在配置智能体页面选择已经复刻好的声音,才能正式启用。
1)选择复刻的声音:
在配置智能体角色音色下拉选项中,切换到选项最下方(具体以实际界面为准)选择自己已经复刻完成的声音。本示例这里选择了我在上一步修改的声音名称,具体请以自己修改的角色音色为准,如下图示。
2)保存配置智能体:
选择自己复刻声音之后,请点击 “保存” 按钮,确保配置已经保存,如下图示。
按提示保存配置成功,请重启设备,即可体验你自己定制的复刻声音进行对话了。快去复刻自己想要声音去体验吧!^_^
  1. 手机端浏览器复刻声音操作指引

基本操作与PC端浏览器操作相同,具体操作指引待补充