AI快讯-艾智迹 AGIDT-第3页

 

182025-05

Windsurf 重磅发布 SWE-1 系列，首款全流程软件工程 AI 模型

Windsurf 推出自主研发的 SWE-1 系列 AI 模型，涵盖从编码到终端操作的全流程，大幅提高开发效率。此系列包括 SWE-1、SWE-1-lite 和 SWE-1-mini，分别面向不同用户需求，展现其在软件工程领域的雄心。

14:43

Perplexity 推出 Comet 浏览器 beta 版，重新定义网络浏览体验

近期，Perplexity 宣布推出其代理智能浏览器 Comet 的 beta 版，目前仅限于部分 Apple Silicon Mac 用户进行测试。Comet 浏览器旨在通过上下文感知智能来重新构想网络浏览体验。它会根据用户的浏览历史和当前打开的标签页个性化响应。此外，Comet 在每个网页上都集成了 Perplexity 的核心搜索功能，用户可以通过侧边栏进行查询、总结或探索内容，而无需切换标签页。

14:42

复旦携手腾讯推出说话人视频生成工具 DICE-Talk

由复旦大学与腾讯联合研发的 DICE-Talk 说话人视频生成工具于近日正式发布，以其卓越的情感表达能力和逼真的人物表现引发行业热议。DICE-Talk 的核心创新在于其身份-情感分离处理机制。通过将说话人的身份特征（如面部细节、肤色）与情感表达(表情、语气)解耦，DICE-Talk 确保在情感变化时人物外观保持高度一致，避免了传统生成工具中常见的「表情跳变」问题。

14:42

腾讯混元图像 2.0 模型来了，AI 生图毫秒级响应

腾讯发布最新混元图像 2.0 模型，基于模型架构创新，在行业内率先实现实时生图，并具有画面质感超写实的特点。该模型于即日起在腾讯混元官方网站上线，并对外开放注册体验。相比前代模型，腾讯混元图像 2.0 模型参数量提升一个数量级，得益于超高压缩倍率的图像编解码器以及全新扩散架构，其生图速度显著快于行业领先模型。在同类商业产品每张图推理速度需要 5 到 10 秒的情况下，腾讯混元可实现毫秒级响应，同时其图像生成质量也提升明显，通过强化学习等算法以及引入大量人类美学知识对齐，生成的图像可有效避免「AI 味」。官网

14:41

162025-05

腾讯元宝浏览器插件尝鲜版上线 Chrome

腾讯元宝浏览器插件尝鲜版上线 Chrome 平台，提供悬浮球、常驻侧边栏和划词工具栏等功能，提升网页浏览与信息处理效率。后续还会支持更多主流浏览器。插件功能丰富又实用，让网页浏览和信息处理变得便捷高效。官网

21:16

腾讯宣布混元图像 2.0 将于今日全新发布

腾讯混元大模型团队宣布，将通过全球直播正式发布全新升级的多模态图像生成工具——混元图像 2.0，这是腾讯在 AI 视觉领域的重要突破，以「更智能、更开放、更中国」为核心理念。此次腾讯推出的混元图像 2.0，基于深度学习和神经网络的最新研究成果，结合多模态融合技术，实现了在图像生成效率和质量方面的多项突破。核心技术包括优化的生成对抗网络（GAN）架构、结合自然语言处理（NLP）的多模态理解模型，以及高效的算法优化策略。这些创新使得混元图像 2.0 能够在保持高细节还原的同时，大幅提升生成速度。

21:15

Stability AI 发布 341M 超轻量级文本转语音模型，可在移动设备本地运行

近日，Stability AI 与芯片巨头 Arm 合作，正式发布了一款轻量级文本转音频模型——Stable Audio Open Small。该模型仅有 341M 参数，针对 Arm CPU 进行了优化，能够在智能手机等移动设备上本地运行，生成高质量音频样本的时间少于 8 秒。来源

21:14

OpenAI 升级 ChatGPT：正式引入 GPT-4.1 代码能力超强

OpenAI 日前发布 GPT-4.1 及其轻量级版本 GPT-4.1mini， GPT-4.1 具备强大的编码能力，处理复杂编程需求更高效，运行速度更快，是开发者和指令处理场景的理想选择。在显著增强编码能力和指令执行体验的同时，还优化了用户体验和多模态支持，巩固了其在 AI 领域的领先地位。

21:14

152025-05

阶跃星辰 Step1X-3D 大模型开源，赋能 3D 内容创作新高度

近日，阶跃星辰公司发布最新 3D 大模型 Step1X-3D，并宣布将此模型开源。这款模型拥有 4.8B 总参数量，其中，1.3B 专注于几何模块的精细构建，而 3.5B 则致力于纹理模块的生动呈现。Step1X-3D 通过创新的 3D 原生两阶段架构设计，实现了几何与纹理表征的巧妙解耦，从而确保了生成内容的结构稳固性和视觉逼真度。

11:57

字节跳动发布 Seed1.5-VL：引领视觉与语言多模态大模型的新时代

在上海举办的火山引擎 FORCE LINK AI 创新巡展上，字节跳动正式发布最新的视觉语言多模态模型 Seed1.5-VL。Seed1.5-VL 的显著特点是其增强的多模态理解与推理能力。与之前的版本相比，Seed1.5-VL 在视觉定位和推理的速度与准确性上有了显著提升。此外，新增的视频理解和多模态智能体功能，使其在处理复杂任务时表现更加出色。

11:57

上一页
1
2
3
4
5
6
下一页
共 7 页

AGIDT.COM | 追踪AGI进展见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AGI脉动AGI会客厅

QQ咨询86458694
关注微信banny-pan
复制微信号
电话咨询18916369709
回顶部