把现场语音变成 Agent 能处理的业务指令
理解 AI 语音识别如何把用户语音转成 Agent 可处理的文本,并判断哪些业务场景适合开启语音输入。
创建一个供 Agent 使用的语音识别服务
在 IDE 中创建语音识别服务,配置 API Key 和默认识别模型,为 Agent 的语音输入能力做准备。
为 Agent 开启语音输入能力
在 Agent 的输入输出配置中选择语音识别服务,让聊天入口支持录音、转写和语音输入。
设计真实业务场景中的语音输入体验
围绕移动端、现场作业、客服坐席和会议记录等场景,设计更稳定的语音输入体验。