百度发布首个端到端语音语言大模型

2025-04-01 11:16:42 IP,RPA,云手机功能,合作代理,常见问题,引流,手机端,群控

3月31日,百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,在电话语音频道的语音问答场景中,调用成本较行业均值下降约50%-90%。

1743477378899055334.png 

当日,文小言宣布品牌焕新,率先接入该模型,还带来多模型融合调度、图片问答等功能升级。接入该模型后,文小言不仅能支持更拟真的语聊效果,而且支持重庆、广西、河南、广东、山东等特色方言。据介绍,语音大模型具备极低的训练和使用成本,极快的推理响应速度,语音交互时,可将用户等待时长从行业常见的 3-5 秒降低至 1 秒左右。

更新后的文小言还支持“多模型融合调度”,整合了百度自研的文心 X1、文心 4.5 等模型,并接入 DeepSeek-R1 等第三方优质模型,实现了多模型间的智能协同。用户可以选择“自动模式”,一键调用最优模型组合,也可根据需求选择单一模型完成特定任务,提升响应速度与任务处理能力。

文小言还加强了图片问答功能,用户拍摄或上传图片,以文字或语音提问即可直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策。

此外,文小言新增“图个冷知识”功能,用户可预设“历史学者”“科技达人”等人设视角,为同一图片赋予多维解读。

该模型是百度在业界首个推出、基于全新互相关注意力 (Cross-Attention) 的端到端语音语言大模型。在大模型加持下,实现了流式逐字的 LLM 驱动的多情感语音合成,情感饱满、逼真、拟人,交互听感也得到极大提升。

河马云手机平台功能强大配套服务功能齐全,可以配合各种游戏操作,感兴趣的小伙伴可以登录体验,新注册用户将自动分配2台云手机,可以免费进行试用哦~

海外市场潜力巨大,需求多样,希望开拓海外市场的企业可选择云手机服务商Hippo Cloud实现海外推广营销。

Hippo Cloud现已正式开放使用,新注册用户可自动分配到2台云手机,试用时长3小时,更有K11跨境电商专属云机,大家多多关注海外板块内容~

可点击链接直接进入:https://www.hippocloudphone.com/

部分图文来源于网络

如有侵权请联系作者删除