智通财经APP得悉,广发证券发布研报称,豆包实时语音大模型的发布,进一步丰厚了字节AI生态,看好字节AI在国内的领头羊,未来开展的潜在才能可期。一起,情感陪同和AI玩具产品有望随同语音类模型才能的强化,提高用户交互体会。
事情:1月20日,豆包实时语音大模型正式推出,并在豆包APP全量敞开。模型完成了语音了解和生成一体化、端到端语音对话,首要面向中文语境和场景。依托于语音和语义联合建模。依据豆包大模型团队大众号,经外部众测,模型全体满意度较GPT-4o有显着优势,语音口气天然度和心情丰满度高于GPT-4o。
预练习Scaling+后练习高质量数据和算法,带来语音模型拟人化、智商与表现力、低推迟方面的打破
传统语音对话使命体系具有对话天然度、有用性及安全性的限制。依据豆包大模型团队大众号,豆包团队在预练习阶段对各模态交错数据来进行深化练习,精准捕捉并高效紧缩海量语音信息,经过Scaling,最大极限完成语音与文本才能深层次地交融和才能出现,后练习阶段使用了高质量数据与RL算法,供给模型高情商对话才能与安全性。豆包实时语音大模型完成了拟人化的情感接受、强壮的声响操控和丰厚的情感演绎才能、智商与表现力的平衡以及丝滑的交互体会和超低推迟。
现在字节旗下通用大模型及多模态才能在国内大厂中完成抢先;依据AI产品榜,2024年12月,字节旗下App豆包、猫箱MAU别离达7116/688万人,成为国内AI对话、AI陪同赛道月活Top1。字节正继续加大AI投入,未来估计将有更多技能及使用发展,字节AI产业链相关标的有望获益。
估计情感陪同类产品有望随同模型才能的强化,在体会上有所提高,具有详细使用场景的渠道有望获益。其间,豆包本身的对话类陪同产品猫箱具有体会晋级的可能性;外部渠道而言,以音频和对话为主的渠道有望经过接入豆包情感模型提高渠道服务才能;此外,AI玩具作为兼具教育与陪同特点的AI硬件,有望明显获益于语音模型才能赋能。
(3) 职业层面来看,AI大模型才能提高、本钱边沿下降,继续完善的AI基础设施有望更好地赋能 AI 游戏、AI 影视、AI 营销、AI 情感陪同、AI 教育、AI agent 等场景。
危险提示:模型迭代作用没有抵达预期,商业化使用落地没有抵达预期,版权、道德、内容质量的危险等。