OpenAI发布会第6天:正式推出AI实时视频对话功能

OpenAI发布会第6天:正式推出AI实时视频对话功能

【OpenAI发布会第6天:正式推出AI实时视频对话功能】北京时间12月13日 , OpenAI进入“连续12天直播发布”的第6天 。在13日的发布会上 , OpenAI“起大早赶晚集” , 终于官宣将要推出7个月前已经离职的原首席技术官米拉(Mira Murati)曾发布的实时通话、理解屏幕功能 。
实时视频通话理解屏幕内容 拥有记忆和理解能力
在本次发布会中 , ChatGPT通过摄像头同4名直播人员进行了互动 , 它首先“记住”了每个直播人员的名字 , 随后正确回答了主持人的随机提问 , 包括“谁戴着鹿角配饰”、“谁戴了圣诞帽”等 , 值得注意的是 , 它的回答可以随时被主持人打断 , 并再熟练地“接话” , 表现同人类别无二致 。
直播人员还展示了ChatGPT的“辅助”能力 , 如通过摄像头的观察 , 语音指导直播人员冲咖啡 , 实时讲解每一个步骤所起到的效果 , 并对直播人员的动作进行评价 。以及给ChatGPT转发短信内容及图片 , 让大模型建议如何回复对方的短信 。
值得注意的是 , 7个月前 , ChatGPT最先进的大模型还是GPT-4o , 而目前模型已经进化到了o1 。此外 , 时隔半年 , 国内大模型如讯飞星火、智谱等都已经推出了类似功能 , 同再次发布Sora一样 , OpenAI此次发布的功能依然属于“起大早赶晚集” , 已经不再像首次发布一样令人惊艳 , 且要面对国内同类产品的竞争 。
OpenAI直播 官网截图
新功能曾被推迟数次 Plus和Pro套餐用户可“在几天内使用”
根据直播展示的内容 , 要启动视频对话 , ChatGPT用户需要点击聊天栏旁边的语音图标 , 然后点击左下角的视频图标 。如果想共享屏幕 , 手机用户要点击打开菜单 , 选择其中的“共享屏幕” 。
事实上 , 该功能自今年5月第一次发布以来 , 已经被推迟了几次 。今年4月 , OpenAI承诺该功能将在几周内向用户推出 。几个月后 , 该公司表示需要更多时间 。6月末 , OpenAI计划向一小批Plus用户推出该语音模式 , 但之后又宣布再次推迟 , “以便确保该功能安全有效地处理来自数百万用户的请求 。”
而本次直播发布 , OpenAI终于宣布“大多数ChatGPT Plus和Pro套餐的订阅用户以及所有团队用户都将可以在今后几天内通过ChatGPT访问该新功能 。”
贝壳财经记者注意到 , OpenAI在这次发布中还把“圣诞老人模式”作为亮点放进了发布会的标题中 , 但实际上其就是一款可以限时访问的圣诞老人语音 , “即使用户的高级语音额度已用完 , 首次与圣诞老人对话时 , 系统也会重置额度 , 确保人人都能体验 。”
新京报贝壳财经记者 罗亦丹
编辑 岳彩周
校对 付春愔

    推荐阅读