ChatGPT 安卓版语音字幕上线,让交互更智能更贴心
ChatGPT 的 Android 应用程序近日迎来一次重大更新,新增了一项备受瞩目的功能——语音模式下的实时字幕显示。用户只需轻触界面上的「更多」按钮,并选择「开启字幕」选项,即可在语音对话过程中同步查看对话内容的文字转录。这一创新不仅显...
ChatGPT 的 Android 应用程序近日迎来一次重大更新,新增了一项备受瞩目的功能——语音模式下的实时字幕显示。用户只需轻触界面上的「更多」按钮,并选择「开启字幕」选项,即可在语音对话过程中同步查看对话内容的文字转录。这一创新不仅显...
Figma 在 Config2025 年度盛会上发布了一系列新功能,旨在提升设计师的创作效率。新推出的 Figma Draw 允许用户在平台内自由绘图,极大简化了设计流程。Figma Sites 功能则支持一键生成可访问的网站,增强了 Fi...
谷歌的 Gemini 聊天机器人进行重要的更新,新增多图上传和 AI 图像编辑功能。该更新目前已向部分用户开放,允许在网页端同时上传多张图片,并对 AI 生成的图像进行编辑。尽管这些功能尚未在所有账户中完全开放,但它们为用户提供了更大的创作...
Claude 移动应用即将进行重要升级,推出备受期待的语音模式功能。该模式采用推按式对话,支持多种声音选项,并具备网页搜索能力,搜索结果以要点形式呈现,便于用户理解和跟进。此外,用户可以上传文件作为上下文参考,提升了交互体验。
Runway 最近推出的 Gen-4References 功能为其 AI 视频生成模型增添了图像一致性参考能力,使创作者能够通过上传参考图像来提取人物、场景或风格特征,从而在生成内容中保持高度一致性。这一功能支持多张图像的混合生成,为视频创...
Midjourney 最近推出的 Omni-Reference 功能为图像生成带来了革命性的变化。它允许用户对图像元素进行精确控制,支持多种对象生成和灵活的权重调整,从而提升创作的自由度和一致性。此功能不仅适用于艺术创作,还能在游戏开发、广...
谷歌的 Gemini 聊天机器人进行重要的更新,新增多图上传和 AI 图像编辑功能。该更新目前已向部分用户开放,允许在网页端同时上传多张图片,并对 AI 生成的图像进行编辑。尽管这些功能尚未在所有账户中完全开放,但它们为用户提供了更大的创作...

在设计领域,效率与创意是永恒的追求。随着 AI 技术的迅猛发展,Deepseek 等 AI 工具为设计师带来了前所未有的创作体验。今天,就来看看 Deepseek 与其他 AI 产品强强联合,如何打破传统设计的边界,解锁无限可能。 一、3分...
日前,DeepSeek 在全球最大 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。延续一贯的开源节奏,DeepSeek 在 Hugging Face 正式发布 DeepS...

tldr: We’re at AI’s halftime. For decades, AI has largely been about developing new training methods and models. And it ...
最新评论
This is a topic which is near to my heart... Take care! Where are your contact details though?
Very energetic article, I loved that bit. Will there be a part 2?
口型同步这个方向确实很有潜力,特别是驱动静态照片这个功能,让内容创作门槛大幅降低。现在各家AI视频工具都在这块发力,竞争越来越激烈。