艾智迹 AGIDT
AGI时代的记录者、连接者与推动者
192025-05

Manus 图像生成功能上线,AI 助力用户创意实现

近期,Manus 发布其全新的图像生成功能,这一创新不仅提升了用户的创意表达能力,还为用户提供了更加智能化的服务体验。据悉,Manus 主打的是「理解意图 + 制定方案 + 多工具协同」的执行能力,生图只是其中一个环节。与传统的图像生成工具不同,Manus 的这一功能更具人性化,它能够理解用户的意图,智能规划解决方案,并有效利用图像生成和其他工具,帮助用户完成各种任务。

OpenAI 发布 Codex 智能体,专注自动化软件开发

OpenAI 宣布推出基于云端的 AI 智能体 Codex,专注于自动化软件开发,涵盖修复错误和实现功能等任务,官方希望该智能体可以开创代码编写的新范式。据悉,Codex 基于 codex-1 模型驱动,OpenAI 方面表示这一模型由 o3 模型针对编程进行优化而得来。codex-1 通过强化学习在各种环境中,对现实世界的编码任务进行训练,从而能够生成接近人类风格和 PR 偏好的代码。官网

182025-05

苹果正式公布车载系统 CarPlay 最新版本 CarPlay Ultra

苹果正式公布了车载系统 CarPlay 的最新版本——CarPlay Ultra。CarPlay Ultra 最大的进步就是实现了多屏协同,不再局限于中控屏幕区域,以及车辆核心硬件的各种操控。现在,CarPlay Ultra 能够联动车辆仪表盘的屏幕,不仅能够显示常规的车速、油量/电量等内容,导航信息、媒体播放状态、车辆本身的智能辅助驾驶系统等信息也能进行融合显示。另外,CarPlay Ultra 下的仪表盘支持主题更换,界面布局更加个性化。目前,CarPlay Ultra 将在美国和加拿大上线,首批适配阿斯顿·马丁的核心车型系列,并在未来 12 个月内扩展到全球品牌。

Windsurf 重磅发布 SWE-1 系列,首款全流程软件工程 AI 模型

Windsurf 推出自主研发的 SWE-1 系列 AI 模型,涵盖从编码到终端操作的全流程,大幅提高开发效率。此系列包括 SWE-1、SWE-1-lite 和 SWE-1-mini,分别面向不同用户需求,展现其在软件工程领域的雄心。

Perplexity 推出 Comet 浏览器 beta 版,重新定义网络浏览体验

近期,Perplexity 宣布推出其代理智能浏览器 Comet 的 beta 版,目前仅限于部分 Apple Silicon Mac 用户进行测试。Comet 浏览器旨在通过上下文感知智能来重新构想网络浏览体验。它会根据用户的浏览历史和当前打开的标签页个性化响应。此外,Comet 在每个网页上都集成了 Perplexity 的核心搜索功能,用户可以通过侧边栏进行查询、总结或探索内容,而无需切换标签页。

复旦携手腾讯推出说话人视频生成工具 DICE-Talk

由复旦大学与腾讯联合研发的 DICE-Talk 说话人视频生成工具于近日正式发布,以其卓越的情感表达能力和逼真的人物表现引发行业热议。DICE-Talk 的核心创新在于其身份-情感分离处理机制。通过将说话人的身份特征(如面部细节、肤色)与情感表达(表情、语气)解耦,DICE-Talk 确保在情感变化时人物外观保持高度一致,避免了传统生成工具中常见的「表情跳变」问题。

腾讯混元图像 2.0 模型来了,AI 生图毫秒级响应

腾讯发布最新混元图像 2.0 模型,基于模型架构创新,在行业内率先实现实时生图,并具有画面质感超写实的特点。该模型于即日起在腾讯混元官方网站上线,并对外开放注册体验。相比前代模型,腾讯混元图像 2.0 模型参数量提升一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型。在同类商业产品每张图推理速度需要 5 到 10 秒的情况下,腾讯混元可实现毫秒级响应,同时其图像生成质量也提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免「AI 味」。 官网

162025-05

腾讯元宝浏览器插件尝鲜版上线 Chrome

腾讯元宝浏览器插件尝鲜版上线 Chrome 平台,提供悬浮球、常驻侧边栏和划词工具栏等功能,提升网页浏览与信息处理效率。后续还会支持更多主流浏览器。插件功能丰富又实用,让网页浏览和信息处理变得便捷高效。官网

腾讯宣布混元图像 2.0 将于今日全新发布

腾讯混元大模型团队宣布,将通过全球直播正式发布全新升级的多模态图像生成工具——混元图像 2.0,这是腾讯在 AI 视觉领域的重要突破,以「更智能、更开放、更中国」为核心理念。此次腾讯推出的混元图像 2.0,基于深度学习和神经网络的最新研究成果,结合多模态融合技术,实现了在图像生成效率和质量方面的多项突破。核心技术包括优化的生成对抗网络(GAN)架构、结合自然语言处理(NLP)的多模态理解模型,以及高效的算法优化策略。这些创新使得混元图像 2.0 能够在保持高细节还原的同时,大幅提升生成速度。

 Stability AI 发布 341M 超轻量级文本转语音模型,可在移动设备本地运行

近日,Stability AI 与芯片巨头 Arm 合作,正式发布了一款轻量级文本转音频模型——Stable Audio Open Small。该模型仅有 341M 参数,针对 Arm CPU 进行了优化,能够在智能手机等移动设备上本地运行,生成高质量音频样本的时间少于 8 秒。来源

AGIDT.COM | 追踪AGI进展 见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AGI脉动AGI会客厅

登录

找回密码

注册