2024-12-15 17:20:56 技术 80185阅读
经过漫长的等待,OpenAI 终于正式推出了 ChatGPT 的视频和屏幕共享功能,让这个聊天机器人可以通过摄像头和手机屏幕“看到”现实世界并与之互动。
上周在 OpenAI 的“Shipmas”活动期间宣布的新功能,标志着在增强 ChatGPT 互操作性方面向前迈出了重要一步。现在,用户可以通过语音与 ChatGPT 聊天,直接共享相机中的图像,甚至共享手机屏幕以获得实时支持。“我们很高兴今天开始在高级语音中推出视频和屏幕共享,”OpenAI 在直播中说道。 “我们知道这已经期待很久了”。
ChatGPT可以用摄像头“观察”周围的环境。
那么ChatGPT的新“眼睛”能做什么呢?
-视觉支持:ChatGPT可以通过摄像头观察周围环境,识别n 个对象,并给出有用的建议。例如,在演示过程中,ChatGPT 指导咖啡师、点评技术、提供冲泡技巧。
- 互动学习:ChatGPT可以观察用户在屏幕上的操作,从而支持更有效的学习。例如,聊天机器人可以在用户解决数学问题时提供建议。
- 尽管仍然存在一些限制,但ChatGPT的视频和屏幕共享功能有望为用户带来有趣且有用的体验。此功能目前正在 ChatGPT 移动应用程序上向 Team、Plus 和 Pro 用户推出,不包括欧盟、瑞士、冰岛、挪威和列支敦士登地区。
此外,OpenAI从5月份开始就引入了ChatGPT的“交叉推理”能力,但是直到9月才推出高级语音模式,12月才推出视频功能。 在“Shipmas”演示中,ChatGPT 准确识别了芦荟植物,并给出了如何护理它的建议。
OpenAI 致力于尽快将此功能带给不支持地区的用户。