更新时间:2024-11-07 18:06:55
OpenAI 正在对 ChatGPT 进行重大增强,将其功能扩展到基于文本的交互之外。用户现在可以通过语音命令甚至图像来提示人工智能模型,为人们与该人工智能机器人的互动方式提供了新的维度。这些功能将逐步推出,付费 ChatGPT 用户将在未来两周内获得访问权限,不久之后更广泛的用户群也会收到这些功能。
ChatGPT 上的语音交互
OpenAI 将语音功能集成到 ChatGPT 中,使交互感觉更具对话性。用户只需点击按钮即可大声说出他们的问题或提示。要启动语音交互,用户可以导航到移动应用程序中的“设置”,选择“新功能”,然后选择加入语音对话。启用后,他们可以点击主屏幕上的耳机图标,从五种不同的声音中选择人工智能的响应。这种语音功能有望增强 ChatGPT 对于各种应用程序的多功能性,从回答查询到参与动态对话。
ChatGPT 上基于图像的查询
ChatGPT 的图像功能允许用户通过拍照或从设备图库中选择图像来提示 AI。人工智能模型分析图像内容并根据视觉输入生成响应。此功能对于识别对象、提供有关地标的信息或解决视觉难题等任务特别有用。
用户有多种选择可以使图像查询更加精确。他们可以使用内置绘图工具向图像添加注释或上下文,在图像旁边键入问题或提示,甚至将图像查询与文本或语音输入结合起来。这种灵活性可以实现与 ChatGPT 更好的来回交互。
要利用基于图像的查询,用户可以点击照片按钮来捕获或选择平台上的图像选项。对于 iOS 和 Android 用户,点击加号按钮是第一步。此外,ChatGPT 允许涉及多个图像的讨论,从而增强了其在视觉任务中的实用性。
您什么时候可以使用新的 ChatGPT 功能?
这些增强标志着 ChatGPT 功能的重大演变,将其适用性扩展到更广泛的场景。OpenAI 正在逐步推出这些功能,从 Plus 和 Enterprise 用户开始,在不久的将来可在 iOS 和 Android 设备以及所有平台上使用。