5月14日,OpenAI举办线上“春季更新”活动,发布新旗舰生成式AI模型GPT-4o。据悉,GPT-4o的“o”代表“omni”,意为全能,是迈向更自然的人机交互的关键一步。
在音频处理领域,过往独立模型之间的相互转化带来的延迟感,算得上是人工智能助手变科幻为现实的最大障碍之一。为应对这一情况,GPT-4o跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一个神经网络处理,成为其突破深度学习界限的最新举措,也完成了人工智能对话的“丝滑”实现。
在表现上,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出。据悉,新模型使ChatGPT能够处理50种不同的语言,同时提高了速度和质量。
在反应速度上,GPT-4o可以在短短232毫秒内响应音频输入,平均响应时长也仅有320毫秒,与对话中的人类响应时间相似。相比起来,GPT-3.5语音对话的平均延迟为2.8秒、GPT-4为5.4秒。
GPT-4o更大的惊喜则在于对“情绪价值”的提供。比如机器人能够从急促的喘气声中理解“紧张”的含义,并且指导他进行深呼吸,还可以根据用户要求变换语调。所有用户均可免费使用该模型,而付费用户的容量限制是免费用户的5倍。
河马云手机平台功能强大配套服务功能齐全,可以配合各种游戏操作,感兴趣的小伙伴可以登录体验,新注册用户将自动分配2台云手机,可以免费进行试用哦~
海外市场潜力巨大,需求多样,希望开拓海外市场的企业可选择云手机服务商Hippo Cloud实现海外推广营销。
Hippo Cloud现已正式开放使用,新注册用户可自动分配到2台云手机,试用时长3小时,更有K11跨境电商专属云机,大家多多关注海外板块内容~
可点击链接直接进入:https://www.hippocloudphone.com/
部分图文来源于网络
如有侵权请联系作者删除