艾智迹 AGIDT
AGI时代的记录者、连接者与推动者
092025-05

WHEE 联合站酷发布专属 AI 工具「小素材生成器」

美图公司旗下 AI 视觉创作工具 WHEE 与视觉创意平台站酷联合推出一项设计师专属 AI 工具「小素材生成器」。据介绍,「小素材生成器」支持一键生成免抠、同款素材,以 AI 创作为小素材设计效率赋能。同时,首发上线了 3D 树脂、3D 潮酷、扁平渐变、卡通扁平、扁平插画、现代水彩 6 大专业风格模板。该生成器自研针对设计师专业水准 LoRA 模型,适配电商、UI、平面等多场景,支持 AI 生成素材的智能延展与风格迁移,实现「生成-套用-迭代」的全链路效率提升。

Gemini 2.0 Flash 图像生成升级:视觉质量大幅提升,文字更清晰

Google 最近对其 Gemini 2.0 Flash 图像生成功能进行了显著升级,推出了全新的模型 gemini-2.0-flash-preview-image-generation。此次更新不仅提升了图像的视觉质量,使得生成的图像更加自然且细节丰富,还改善了文字渲染的准确性,解决了以往文字扭曲和不清晰的问题。此外,内容安全机制的优化也使得生成效率和可用性得到了提升。

ChatGPT 安卓版语音字幕上线,让交互更智能更贴心

ChatGPT 的 Android 应用程序近日迎来一次重大更新,新增了一项备受瞩目的功能——语音模式下的实时字幕显示。用户只需轻触界面上的「更多」按钮,并选择「开启字幕」选项,即可在语音对话过程中同步查看对话内容的文字转录。这一创新不仅显著增强了应用的易用性,还为听力受限或在嘈杂环境中使用应用的用户带来了极大的便利。

Figma 发布一系列新功能:Figma Sites 支持一键生成网站

Figma 在 Config2025 年度盛会上发布了一系列新功能,旨在提升设计师的创作效率。新推出的 Figma Draw 允许用户在平台内自由绘图,极大简化了设计流程。Figma Sites 功能则支持一键生成可访问的网站,增强了 Figma 的竞争力。此外,AI 智能增强功能提供智能布局建议,开发交接的优化减少了设计与开发之间的沟通成本。查看详情

082025-05

谷歌 Gemini 聊天机器人全新升级:支持多图上传和图像编辑功能

谷歌的 Gemini 聊天机器人进行重要的更新,新增多图上传和 AI 图像编辑功能。该更新目前已向部分用户开放,允许在网页端同时上传多张图片,并对 AI 生成的图像进行编辑。尽管这些功能尚未在所有账户中完全开放,但它们为用户提供了更大的创作灵活性,提升整体用户体验。

072025-05

Claude 移动应用即将推出语音模式,支持多种声音选项

Claude 移动应用即将进行重要升级,推出备受期待的语音模式功能。该模式采用推按式对话,支持多种声音选项,并具备网页搜索能力,搜索结果以要点形式呈现,便于用户理解和跟进。此外,用户可以上传文件作为上下文参考,提升了交互体验。

Runway发布图像一致性参考功能:支持提取人物、场景或风格特征及多图混合

Runway 最近推出的 Gen-4References 功能为其 AI 视频生成模型增添了图像一致性参考能力,使创作者能够通过上传参考图像来提取人物、场景或风格特征,从而在生成内容中保持高度一致性。这一功能支持多张图像的混合生成,为视频创作提供了更大的控制力与创意自由,极大地简化了设计流程,推动了 AI 在影视制作领域的应用。

Midjourney V7 推出全新功能 Omni-Reference,让图像生成更灵活

Midjourney 最近推出的 Omni-Reference 功能为图像生成带来了革命性的变化。它允许用户对图像元素进行精确控制,支持多种对象生成和灵活的权重调整,从而提升创作的自由度和一致性。此功能不仅适用于艺术创作,还能在游戏开发、广告设计等多个领域发挥重要作用,展示出广泛的应用潜力。

谷歌 Gemini 聊天机器人全新升级:支持多图上传和图像编辑功能

谷歌的 Gemini 聊天机器人进行重要的更新,新增多图上传和 AI 图像编辑功能。该更新目前已向部分用户开放,允许在网页端同时上传多张图片,并对 AI 生成的图像进行编辑。尽管这些功能尚未在所有账户中完全开放,但它们为用户提供了更大的创作灵活性,提升整体用户体验。

062025-05

DeepSeek 发布 DeepSeek-Prover-V2 新模型

日前,DeepSeek 在全球最大 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。延续一贯的开源节奏,DeepSeek 在 Hugging Face 正式发布 DeepSeek-Prover-V2,并同步上线模型卡及示例代码。此次共推出两个版本:DeepSeek-Prover-V2-7B:基于上一代 V1.5 模型,支持最长 32K 上下文输入;DeepSeek-Prover-V2-671B:在 DeepSeek-V3-Base 基础上训练,推理性能最强。地址

AGIDT.COM | 追踪AGI进展 见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AGI脉动AGI会客厅

登录

找回密码

注册