Sora 推出角色客串功能并将上线 Android 版
OpenAI 的 AI 视频工具 Sora 发布最新路线图,推出“角色客串”功能,用户可让宠物或玩具出演视频角色,并从已有视频中提取角色。应用更新界面展示热门客串角色,并加入基础视频编辑工具,支持拼接片段。平台将开放私人与社区频道,增强社群互动。团队优化内容审核与性能,并确认 Android 版即将上线,拓展更多创作者使用场景。
OpenAI 的 AI 视频工具 Sora 发布最新路线图,推出“角色客串”功能,用户可让宠物或玩具出演视频角色,并从已有视频中提取角色。应用更新界面展示热门客串角色,并加入基础视频编辑工具,支持拼接片段。平台将开放私人与社区频道,增强社群互动。团队优化内容审核与性能,并确认 Android 版即将上线,拓展更多创作者使用场景。
B站备受期待的文本转语音模型 IndexTTS2 刚刚开源,立刻在开发者社区中掀起了一阵波澜 🔊。现在大家最关心的问题是:它的实际效果是否能媲美官方演示那般惊艳?幸运的是,你现在就可以 前往GitHub查看源码并在Hugging Face上找到模型亲自测试一番 🔥。这一发布再次证明了大型科技公司正积极为开源世界贡献力量。🤔
谷歌的 NotebookLM 刚刚获得史诗级增强,摇身一变成了你的私人报告撰写助理 🔥。它现在能以超过 80种语言 生成结构化报告,并智能推荐格式,你甚至可以用详细提示词来微调语气和风格 (✧∀✧)。这意味着你可以告别繁琐的格式调整,专注于闪光的创意,快去 最新版NotebookLM了解详情吧!
OpenAI 再次向所有用户敞开怀抱,宣布 ChatGPT 的"项目”功能现已对免费用户全面开放,让每个人都能体验到更强大的工作流管理 🚀。此次更新还大幅提升了文件上传限额,并增加了颜色和图标等个性化选项,让你的工作空间更有条理。这波操作无疑是 AI 工具平民化的又一里程碑,快去官方公告 看看你的 ChatGPT 升级了没!
OpenAI 发布 GPT-realtime 语音模型,其自然流畅度和情感表达力达到新高度,能够精准模拟人类语音细节,包括语调、情感和语速。该模型具备语音对话和图像理解能力,能够处理复杂指令,并根据上下文实时调整语音风格。OpenAI 还新增了语音风格并优化了原有的语音效果。GPT-realtime 将颠覆客服、教育、金融和医疗等领域,推动语音助手向全功能智能伙伴转变,并为开发者开启语音 AI 应用开发的新纪元,标志着人机语音交互的重大变革。
谷歌Gemini放出大招,功能更新直指ChatGPT的王座!Google DeepMind掌门人Demis Hassabis转发了一则重磅消息,称Gemini迎来史诗级更新,不仅免费提供Pro计划,还上线了名为"Deep Think”的超强推理功能 🔥。这场AI巨头之间的"神仙打架”愈演愈烈,用户成了最大赢家 (✧∀✧)。快来看看Gemini的最新动态,体验这些ChatGPT都还没跟上的新特性吧!🚀
谷歌DeepMind团队秀出了他们的P图神器Gemini 2.5 Flash Image,外号"Nano Banana”,能把香蕉P成晚礼服,创意突破天际 🍌。这款模型具备原生的图像生成与编辑能力,支持多轮对话式修改,甚至能通过交错生成机制实现像素级P图,了解更多幕后团队,让P图体验像聊天一样流畅。其核心魅力在于将图像理解与生成紧密结合,正做到了"看懂再画”,为创意工作流带来了革命性的变化 💡。
OpenAI深夜放毒,正式发布了专为语音AI Agent设计的全新多模态模型GPT-Realtime,让你的AI助手听起来更像"人”了 (o´ω'o)ノ。这个模型不仅能模仿人类丰富的语调和情感,还能理解笑声等非语言信号,甚至支持图像输入,查看官方发布详情,实现了"眼见为实”的对话体验。伴随API的发布,音频输入token价格还降低了20%,OpenAI正在加速推动智能语音交互进入一个更自然、更智能的新纪元 🚀。

Nous Research 是一家低调的人工智能初创公司,近日推出了 Hermes4系列大型语言模型。该模型在数学基准测试中表现优异,引入“混合推理”模式,提供快速响应和深入思考选项。采用 DataForge 和 Atropos 进行训练,提升推理能力和数据生成效率。 Hermes 4 的发布代表了开放源代码 AI 的崛起,挑战大型科技公司,倡导用户透明和控制。
