OpenAI发布语音模型GPT

新闻探索 2025-09-15 01:50:22 72125

科技日报讯 (记者张佳欣)8月28日,发布美国人工智能公司OpenAI发布了其所谓“最先进的语音语音到语音模型”GPT-realtime,以及配套的模型珠箔银屏网Realtime API(实时应用程序接口)。

据OpenAI公司介绍,发布该模型在理解复杂指令、语音精准调用工具以及生成自然、模型富有表现力的发布语音方面表现突出,并在客户服务、语音教育、模型珠箔银屏网个人助理等多种场景中具备广泛应用潜力。发布

与传统语音模型不同,语音GPT-realtime新增了Marin与Cedar两种极具特色的模型语音,同时对原有8种语音进行了全面升级。发布模型不仅能生成自然流畅的语音语音,还能够敏锐捕捉笑声等非语言信号,模型在句子中间自如切换语言,并可根据场景需求灵活调整语气,使语音交互更贴近真实人类沟通。

通过Realtime API,开发者可实现实时语音输入输出,不必再经过繁琐的多模型转换流程。在实际应用中,这套技术可用于客户服务系统,让虚拟助手即时解答问题,提高效率和体验。它还可应用于教育领域,实现语音对话和口语练习。而在个人助理、办公或智能家居场景中,用户能通过语音快速完成安排或查询信息。结合图像或文本输入,开发者还能打造更智能的虚拟助手或机器人系统。

OpenAI表示,GPT-realtime和Realtime API已于8月28日起面向所有付费开发者开放。

(责任编辑:王婉莹)

本文地址:http://liaocheng.hackpro.cn/html/512e86298625.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

启幕在即,2025阿尼玛卿极限挑战赛召开新闻发布会

透视“小体量”的大能量(评论员观察)

“串串房”为何频频出现?

好评中国丨花样新“夜”态 点燃经济高质量发展新引擎

【光明论坛】守护集体记忆 传承抗战精神

友情链接