6月26日财联社讯(编辑 黄君芝)OpenAI宣布推迟备受期待的ChatGPT语音助手功能发布,以确保其安全有效地处理数百万用户的请求。
这家AI初创公司在5月的发布会上为GPT-4o推出了语音选项,这是GPT-4模型的升级版,在实时处理文本、音频和图像方面表现更出色。
OpenAI在一则声明中表示,公司原本计划在6月底向小部分付费ChatGPT Plus用户推出语音功能,但认为需要再花一个月时间来“达到我们的标准”。
“我们正在改进模型识别并拒绝某些内容的能力,”该公司周二表示,“我们还致力于改善用户体验,并为我们的基础设施做好准备,以便在保持实时响应的同时拓展至数百万用户。”
分析人士指出,这一推迟对OpenAI来说可能是个挫折,因为该公司一直在努力在激烈的AI领域保持领先地位。
周二,OpenAI还表示,公司计划在秋季向所有付费用户推出语音功能,同时也在努力发布视频和屏幕共享功能。
该公司曾在5月的活动中展示了这些功能。
OpenAI表示,未来会向用户透露更多这些功能的发布时间信息。
当部分付费用户在下个月能够使用语音功能时,其功能可能会比发布会上展示的更受限。
例如,聊天机器人无法使用计算机视觉功能,该功能允许它通过智能手机摄像头为用户的舞蹈动作提供语音反馈。
总体而言,新功能承诺提供更快的响应速度,并将与强大的图像识别功能相结合,使聊天机器人成为更有用、更具互动性的对话伙伴。
在发布会的舞台上,OpenAI的员工展示了ChatGPT能以近乎即时的方式响应请求,例如解决研究人员在手机摄像头前纸张上书写的数学问题。