Claude 移动应用即将推出语音模式,支持多种声音选项
Claude 移动应用即将进行重要升级,推出备受期待的语音模式功能。该模式采用推按式对话,支持多种声音选项,并具备网页搜索能力,搜索结果以要点形式呈现,便于用户理解和跟进。此外,用户可以上传文件作为上下文参考,提升了交互体验。

Claude 移动应用即将进行重要升级,推出备受期待的语音模式功能。该模式采用推按式对话,支持多种声音选项,并具备网页搜索能力,搜索结果以要点形式呈现,便于用户理解和跟进。此外,用户可以上传文件作为上下文参考,提升了交互体验。
Runway 最近推出的 Gen-4References 功能为其 AI 视频生成模型增添了图像一致性参考能力,使创作者能够通过上传参考图像来提取人物、场景或风格特征,从而在生成内容中保持高度一致性。这一功能支持多张图像的混合生成,为视频创作提供了更大的控制力与创意自由,极大地简化了设计流程,推动了 AI 在影视制作领域的应用。
Midjourney 最近推出的 Omni-Reference 功能为图像生成带来了革命性的变化。它允许用户对图像元素进行精确控制,支持多种对象生成和灵活的权重调整,从而提升创作的自由度和一致性。此功能不仅适用于艺术创作,还能在游戏开发、广告设计等多个领域发挥重要作用,展示出广泛的应用潜力。
谷歌的 Gemini 聊天机器人进行重要的更新,新增多图上传和 AI 图像编辑功能。该更新目前已向部分用户开放,允许在网页端同时上传多张图片,并对 AI 生成的图像进行编辑。尽管这些功能尚未在所有账户中完全开放,但它们为用户提供了更大的创作灵活性,提升整体用户体验。
日前,DeepSeek 在全球最大 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。延续一贯的开源节奏,DeepSeek 在 Hugging Face 正式发布 DeepSeek-Prover-V2,并同步上线模型卡及示例代码。此次共推出两个版本:DeepSeek-Prover-V2-7B:基于上一代 V1.5 模型,支持最长 32K 上下文输入;DeepSeek-Prover-V2-671B:在 DeepSeek-V3-Base 基础上训练,推理性能最强。地址
Luma AI 宣布其旗舰视频生成模型 Ray2的 Camera Concepts API 正式上线,为开发者提供了前所未有的电影级镜头控制能力。结合此前推出的 Camera Motion Concepts 和 Camera Angle Concepts,这一 API 的发布标志着 AI 视频生成技术在创意控制和生产效率上的重大突破。