艾智迹 AGIDT
AGI时代的记录者、连接者与推动者
092025-06

智源研究院推出 Emu3 等「悟界」系列大模型

在第七届「北京智源大会」上,智源研究院重磅推出了一系列名为「悟界」的大模型。这些模型的发布标志着人工智能领域又一次技术的飞跃,吸引了众多科技爱好者的目光。此次发布的模型包括原生多模态世界模型 Emu3、脑科学多模态通用基础模型见微 Brainμ、以及跨本体的具身大小脑协作框架 RoboOS2.0 和具身大脑 RoboBrain2.0。此外,还有全原子微观生命模型 OpenComplex2。这些模型涵盖了从基础科学到复杂智能系统的广泛应用,展现了智源研究院在多模态智能技术方面的雄心和实力。

谷歌上线 Portraits AI 实验项目,专家在线解决职场困惑

Google Labs 宣布推出实验项目 Portraits,旨在通过 AI 技术让用户与值得信赖的专家进行对话式互动。Portraits 的独特魅力在于,它直接链接到现实中的专家,确保对话内容始终围绕其专业领域展开。

Eleven v3Alpha 版震撼发布,会说话还能「演戏」

随着人工智能技术的飞速发展,文本转语音(TTS)领域迎来了新的里程碑。ElevenLabs 正式推出其最新文本转语音模型 Eleven v3(Alpha版),被誉为「地表最强」的 TTS 模型。这款模型不仅能将文本转化为自然流畅的语音,还能通过精准的情感控制和多语言支持,模拟真实对话中的语气变化与非语言表达,为创作者和开发者提供了前所未有的语音生成体验。

全球爆火 AI 视频神器 PixVerse 发布国内版「拍我 AI」

全球用户量最大的 AI 视频生成平台 PixVerse 正式推出国内版产品「拍我 AI」,同步上线网页端及移动端应用,并开放最新 V4.5 模型供用户使用。PixVerse 自海外上线以来,已累计吸引全球超 6000 万用户,月活跃用户(MAU)突破 1600 万,稳居 AI 视频生成领域第一梯队。此次国内版的推出,标志着国内用户将能更直接地体验 AI 视频创作的强大能力,让更多用户轻松表达创意,也为专业创作者提供更强大、更智能的创作支持。官网

072025-06

Figma 推出新工具助力 AI 设计转代码,开发更高效

近日,设计协作平台 Figma 迈出创新的一步,正式揭晓一款面向开发者的全新工具——开发模式模型上下文协议(MCP)服务器。这款工具正处于 beta 测试阶段,目前仅向拥有开发者权限或完整席位权限的用户开放。MCP 服务器的核心优势在于,它能够赋予人工智能(AI)模型直接访问 Figma 设计数据的权限。这意味着,AI 不再仅仅依赖于图像文件进行视觉解析,而是可以直接获取到图表中的精确数据、设计中的具体颜色等详细信息。Figma 将这一能力比喻为「透视画作」,强调只有理解了创作过程的人,才能精准地再现设计。

字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效

字节跳动 Seed 团队发布图像编辑模型 SeedEdit 3.0,目前已经在即梦网页端开启测试,豆包 App 也即将上线。据字节跳动官方介绍,SeedEdit 3.0 基于文生图模型 Seedream 3.0,叠加多样化的数据融合方法与特定奖励模型,较好地解决了上述难题。其图像主体、背景和细节保持能力进一步提升,尤其在人像编辑、背景更改、视角与光线转换等场景表现较为突出。同时,SeedEdit 3.0 支持 4K 图像生成,能精准识别编辑区域并高保真保留未修改内容。官网

通义千问 Qwen3 大模型新成员:Embedding 系列模型登场

通义实验室正式发布 Qwen3-Embedding 系列模型,专为文本表征、检索与排序任务设计。该系列基于 Qwen3 基础模型训练,支持多语言和代码检索,具备卓越的泛化性、灵活的架构以及全面的语言支持。模型提供 0.6B 到 8B 参数规模选择,支持表征维度自定义和指令适配优化。训练采用三阶段架构,结合对比学习与监督训练,提升性能与效率。目前,Qwen3-Embedding 已在 Hugging Face、ModelScope 和 GitHub 开源,并可通过阿里云百炼平台使用相关服务。未来将持续优化并拓展多模态语义理解能力。

Luma AI 发布 AI 视频转换功能

日前,Luma AI 推出了一项 AI 视频画面转换功能——Modify Video,用户只需拍摄一次,即可将视频风格、元素、对象甚至是背景进行更换。官方介绍,Modify Video 支持任何视频内进行人物全身、面部或口型提取,并能完美与新生成的角色进行匹配。同时,Modify Video 还能保证场景和构图完整的情况下,改变场景的外观、风格,并且支持局部元素内容更换。官网

 AI 驱动视频编辑工具 Diffusion Studio Pro 亮相

AI 驱动的视频编辑工具 Diffusion Studio Pro 正式亮相,以其强大的 AI 功能和本地化设计受到广泛关注。结合 CapCut 和 Cursor 的优势,提供多模态 AI 赋能的非线性编辑体验,同时支持免费使用,极大降低了创作门槛。它还内置了智能代理侧边栏,能自动读取和处理视频、图像及音频素材,实现从素材整理到粗剪的自动化工作流。

062025-06

 Adobe 宣布推出 Photoshop 安卓版,测试期间可免费使用

Adobe 宣布推出 Photoshop 安卓应用。该应用此前于 2 月份首次登陆 iPhone,而 Android 用户则被告知要等到 2025 年底。目前,Photoshop 测试版已于 Google Play 商店上线,测试期间所有用户均可免费使用。查看详情

AGIDT.COM | 追踪AGI进展 见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AGI脉动AGI会客厅

登录

找回密码

注册