OpenAI深夜放毒,正式发布了专为语音AI Agent设计的全新多模态模型GPT-Realtime,让你的AI助手听起来更像”人”了 (o´ω’o)ノ。这个模型不仅能模仿人类丰富的语调和情感,还能理解笑声等非语言信号,甚至支持图像输入,查看官方发布详情,实现了”眼见为实”的对话体验。伴随API的发布,音频输入token价格还降低了20%,OpenAI正在加速推动智能语音交互进入一个更自然、更智能的新纪元 🚀。

OpenAI深夜放毒,正式发布了专为语音AI Agent设计的全新多模态模型GPT-Realtime,让你的AI助手听起来更像”人”了 (o´ω’o)ノ。这个模型不仅能模仿人类丰富的语调和情感,还能理解笑声等非语言信号,甚至支持图像输入,查看官方发布详情,实现了”眼见为实”的对话体验。伴随API的发布,音频输入token价格还降低了20%,OpenAI正在加速推动智能语音交互进入一个更自然、更智能的新纪元 🚀。

代码之子,广告之舵; 市场之巅,历尽阡陌。 昔日的代码园丁,今朝的 AI 智能匠, 愿与你,共创辉煌,书写未来新篇章。 欢迎+V:86458694; 个人微网:https://www.npie.net/
注:以上资讯综合自 36Kr、机器之心、TechCrunch 及全球各大主流科技媒体。
注:以上资讯综合自 36Kr、机器之心、TechCrunch 及全球各大主流科技媒体。
深度总结:2026 年 4 月 30 日标志着 AI 智能体(Agents)从实验室全面走向生产力环境,我们正在见证“数字员工”时代的到来。
注:资讯综合自 36Kr、机器之心、TechCrunch、Axios 及全球主流科技媒体。
注:以上资讯综合自 36Kr、机器之心、TechCrunch 及全球各大主流科技媒体。
注:以上资讯综合自 36Kr、机器之心、TechCrunch 及全球各大主流科技媒体。
注:以上资讯综合自 36Kr、机器之心、TechCrunch 及全球各大主流科技媒体。




艾智迹 AGIDT
最新评论
This is a topic which is near to my heart... Take care! Where are your contact details though?
Very energetic article, I loved that bit. Will there be a part 2?
口型同步这个方向确实很有潜力,特别是驱动静态照片这个功能,让内容创作门槛大幅降低。现在各家AI视频工具都在这块发力,竞争越来越激烈。