Windsurf 重磅发布 SWE-1 系列,首款全流程软件工程 AI 模型
Windsurf 推出自主研发的 SWE-1 系列 AI 模型,涵盖从编码到终端操作的全流程,大幅提高开发效率。此系列包括 SWE-1、SWE-1-lite 和 SWE-1-mini,分别面向不同用户需求,展现其在软件工程领域的雄心。

Windsurf 推出自主研发的 SWE-1 系列 AI 模型,涵盖从编码到终端操作的全流程,大幅提高开发效率。此系列包括 SWE-1、SWE-1-lite 和 SWE-1-mini,分别面向不同用户需求,展现其在软件工程领域的雄心。
近期,Perplexity 宣布推出其代理智能浏览器 Comet 的 beta 版,目前仅限于部分 Apple Silicon Mac 用户进行测试。Comet 浏览器旨在通过上下文感知智能来重新构想网络浏览体验。它会根据用户的浏览历史和当前打开的标签页个性化响应。此外,Comet 在每个网页上都集成了 Perplexity 的核心搜索功能,用户可以通过侧边栏进行查询、总结或探索内容,而无需切换标签页。
由复旦大学与腾讯联合研发的 DICE-Talk 说话人视频生成工具于近日正式发布,以其卓越的情感表达能力和逼真的人物表现引发行业热议。DICE-Talk 的核心创新在于其身份-情感分离处理机制。通过将说话人的身份特征(如面部细节、肤色)与情感表达(表情、语气)解耦,DICE-Talk 确保在情感变化时人物外观保持高度一致,避免了传统生成工具中常见的「表情跳变」问题。
腾讯发布最新混元图像 2.0 模型,基于模型架构创新,在行业内率先实现实时生图,并具有画面质感超写实的特点。该模型于即日起在腾讯混元官方网站上线,并对外开放注册体验。相比前代模型,腾讯混元图像 2.0 模型参数量提升一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型。在同类商业产品每张图推理速度需要 5 到 10 秒的情况下,腾讯混元可实现毫秒级响应,同时其图像生成质量也提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免「AI 味」。 官网
腾讯元宝浏览器插件尝鲜版上线 Chrome 平台,提供悬浮球、常驻侧边栏和划词工具栏等功能,提升网页浏览与信息处理效率。后续还会支持更多主流浏览器。插件功能丰富又实用,让网页浏览和信息处理变得便捷高效。官网
腾讯混元大模型团队宣布,将通过全球直播正式发布全新升级的多模态图像生成工具——混元图像 2.0,这是腾讯在 AI 视觉领域的重要突破,以「更智能、更开放、更中国」为核心理念。此次腾讯推出的混元图像 2.0,基于深度学习和神经网络的最新研究成果,结合多模态融合技术,实现了在图像生成效率和质量方面的多项突破。核心技术包括优化的生成对抗网络(GAN)架构、结合自然语言处理(NLP)的多模态理解模型,以及高效的算法优化策略。这些创新使得混元图像 2.0 能够在保持高细节还原的同时,大幅提升生成速度。
近日,Stability AI 与芯片巨头 Arm 合作,正式发布了一款轻量级文本转音频模型——Stable Audio Open Small。该模型仅有 341M 参数,针对 Arm CPU 进行了优化,能够在智能手机等移动设备上本地运行,生成高质量音频样本的时间少于 8 秒。来源
OpenAI 日前发布 GPT-4.1 及其轻量级版本 GPT-4.1mini, GPT-4.1 具备强大的编码能力,处理复杂编程需求更高效,运行速度更快,是开发者和指令处理场景的理想选择。在显著增强编码能力和指令执行体验的同时,还优化了用户体验和多模态支持,巩固了其在 AI 领域的领先地位。
近日,阶跃星辰公司发布最新 3D 大模型 Step1X-3D,并宣布将此模型开源。这款模型拥有 4.8B 总参数量,其中,1.3B 专注于几何模块的精细构建,而 3.5B 则致力于纹理模块的生动呈现。Step1X-3D 通过创新的 3D 原生两阶段架构设计,实现了几何与纹理表征的巧妙解耦,从而确保了生成内容的结构稳固性和视觉逼真度。
在上海举办的火山引擎 FORCE LINK AI 创新巡展上,字节跳动正式发布最新的视觉语言多模态模型 Seed1.5-VL。Seed1.5-VL 的显著特点是其增强的多模态理解与推理能力。与之前的版本相比,Seed1.5-VL 在视觉定位和推理的速度与准确性上有了显著提升。此外,新增的视频理解和多模态智能体功能,使其在处理复杂任务时表现更加出色。