- OpenAI推出的音频模型gpt-4o-mini-tts实现了语音情绪和语调的自定义,适用于电商客服、广告、教育等多个场景,利好相关公司。
- 腾讯发布的混元T1模型在超长文本推理和解码速度上表现优秀,降低了模型的计算成本,推动国内推理模型的持续迭代。
- 投资者需关注AI技术发展、政策监管及行业竞争等风险。
核心要点2
本周传媒互联网行业报告主要涉及OpenAI和腾讯的最新动态。
OpenAI推出了三款音频模型:gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts。
其中,gpt-4o-transcribe在语音转文本方面表现优异,尤其在复杂场景中识别准确率高;gpt-4o-mini-tts则支持语音情绪、自定义语调等功能,适用于电商客服、广告、教育、情感陪伴及影视配音等领域。
相关公司如焦点科技、因赛集团、佳发教育等值得关注。
腾讯发布的混元T1模型在超长文本推理和解码速度上有显著提升,采用Hybrid-Mamba-Transformer架构有效降低计算复杂度,成本也有所下降。
该模型在数学和逻辑推理测试中表现出色。
核心观点认为,OpenAI的音频模型提升了语音生成的灵活性和效率,利好相关应用场景的公司;腾讯的混元T1则推动国内推理模型的进步。
风险提示包括AI技术发展不及预期、政策监管和行业竞争加剧等。
投资标的及推荐理由投资标的及推荐理由如下: 1. **智能客服或助手**:焦点科技 推荐理由:音频模型gpt-4o-mini-tts可用于电商智能客服,提供灵活的语音生成,满足不同场景的应用需求。
2. **广告营销**:因赛集团、引力传媒、蓝色光标、天娱数科 推荐理由:音频模型能够生成多样化的广告音频内容,提升广告营销效果。
3. **教育**:佳发教育、科大讯飞 推荐理由:音频模型在教育语言学习中的应用,可以实现个性化的学习体验。
4. **情感陪伴应用/玩具**:恺英网络、奥飞娱乐 推荐理由:音频模型的情绪自定义功能适用于情感陪伴类应用,增强用户体验。
5. **影视**:华策影视、博纳影业 推荐理由:音频模型可以用于影视内容的配音,提升制作效率和质量。
6. **游戏**:巨人网络、掌趣科技 推荐理由:音频模型可为游戏内容提供配音,增强游戏的沉浸感和互动性。
此外,腾讯自研的混元T1模型在推理、超长文本处理和生成速度等方面的提升,降低了模型成本,适合关注相关技术的公司。