最近,OpenAI 对其 ChatGPT 的语音功能进行了全面升级,特别是针对订阅用户,旨在提升 AI 的语音表达的自然性和情感丰富度。根据 OpenAI 的说法,更新后的 “高级语音模式” 现在可以实现更流畅、情感更细腻的语音输出,包括对语调、停顿以及表达同理心或讽刺等情感的改进。
值得注意的是,此次更新还新增了实时翻译功能。用户现在可以选择特定的语言对,要求 ChatGPT 进行翻译。AI 将会不断地对话双方的内容进行翻译,直到用户指示停止。这一功能非常适用于餐馆点餐或多语言的工作场景。
付费用户只需在聊天界面的语言图标上点击,即可在所有平台上体验这些语音改进。然而,OpenAI 也指出仍存在一些已知问题。用户可能会遇到偶尔的音频质量下降,比如音调或音量的突变,这在某些语音中可能更为明显。此外,所谓的 “幻觉” 现象仍然存在,ChatGPT 有时会无缘无故地产生奇怪的声音,例如广告片段、随机噪音,甚至是背景音乐。最近有用户反映,ChatGPT 在对话中突然播放了一段广告,尽管 OpenAI 并未投放广告。
OpenAI 在2024年5月首次推出了 “高级语音模式”,并于2024年10月扩大了在欧盟的可用性。该功能的目标是实现与 AI 的自然实时互动,包括在对话中打断和表达情感。如果用户打开摄像头,ChatGPT 还可以对周围的物体或环境进行实时评论。类似的功能也出现在谷歌的 Gemini 应用中。
[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑,如存在版权问题请发送邮件至398879136@qq.com,我们会在3个工作日内处理。非原创标注的文章,观点仅代表作者本人,不代表本站立场。