
腾讯混元正式推出并开源多模态定制化视频生成工具
腾讯混元宣布正式推出并开源全新的多模态定制化视频生成工具 HunyuanCustom。据悉,该模型基于混元视频生成大模型(HunyuanVideo)打造,主体一致性效果超过现有的开源方案。据介绍,HunyuanCustom 融合文本、图像、...
腾讯混元宣布正式推出并开源全新的多模态定制化视频生成工具 HunyuanCustom。据悉,该模型基于混元视频生成大模型(HunyuanVideo)打造,主体一致性效果超过现有的开源方案。据介绍,HunyuanCustom 融合文本、图像、...
OpenAI 近期宣布了一项重大技术革新,将 o4-mini 模型与强化微调技术(RFT)相结合,这一组合为企业级 AI 定制化带来了革命性的变化。通过少量训练数据,企业可以轻松将通用 AI 模型转变为特定领域的专家系统,极大地降低了 AI...
OpenAI 最近宣布对其 AI 驱动的深度研究工具进行升级,新增 GitHub 连接器,旨在帮助开发者更有效地分析代码库和工程文档。该功能允许用户直接询问代码相关问题,极大地方便了编程工作。与此同时,OpenAI 也在加强其辅助编码工具,...
美图公司旗下 AI 视觉创作工具 WHEE 与视觉创意平台站酷联合推出一项设计师专属 AI 工具「小素材生成器」。据介绍,「小素材生成器」支持一键生成免抠、同款素材,以 AI 创作为小素材设计效率赋能。同时,首发上线了 3D 树脂、3D 潮...
Google 最近对其 Gemini 2.0 Flash 图像生成功能进行了显著升级,推出了全新的模型 gemini-2.0-flash-preview-image-generation。此次更新不仅提升了图像的视觉质量,使得生成的图像更加...
ChatGPT 的 Android 应用程序近日迎来一次重大更新,新增了一项备受瞩目的功能——语音模式下的实时字幕显示。用户只需轻触界面上的「更多」按钮,并选择「开启字幕」选项,即可在语音对话过程中同步查看对话内容的文字转录。这一创新不仅显...
Figma 在 Config2025 年度盛会上发布了一系列新功能,旨在提升设计师的创作效率。新推出的 Figma Draw 允许用户在平台内自由绘图,极大简化了设计流程。Figma Sites 功能则支持一键生成可访问的网站,增强了 Fi...
谷歌的 Gemini 聊天机器人进行重要的更新,新增多图上传和 AI 图像编辑功能。该更新目前已向部分用户开放,允许在网页端同时上传多张图片,并对 AI 生成的图像进行编辑。尽管这些功能尚未在所有账户中完全开放,但它们为用户提供了更大的创作...
Claude 移动应用即将进行重要升级,推出备受期待的语音模式功能。该模式采用推按式对话,支持多种声音选项,并具备网页搜索能力,搜索结果以要点形式呈现,便于用户理解和跟进。此外,用户可以上传文件作为上下文参考,提升了交互体验。
Runway 最近推出的 Gen-4References 功能为其 AI 视频生成模型增添了图像一致性参考能力,使创作者能够通过上传参考图像来提取人物、场景或风格特征,从而在生成内容中保持高度一致性。这一功能支持多张图像的混合生成,为视频创...
最新评论
您好,这是一条评论。若需要审核、编辑或删除评论,请访问仪表盘的评论界面。评论者头像来自 Gravatar。