艾智迹 AGIDT
AGI时代的记录者、连接者与推动者
192025-06

谷歌发布超强 AI 模型 Gemini 2.5 Flash-Lite:推理速度更快

谷歌公司正式推出 Gemini 2.5 Flash-Lite,这是其系列中最轻量化、最具成本效益的 AI 模型。随着科技的快速发展,AI 的应用已经深入到编码、翻译和推理等多个领域。2.5 Flash-Lite 不仅保留了 Gemini 2.5 系列的核心能力,如灵活控制推理预算、连接外部工具(如谷歌搜索、代码执行),还支持处理超长上下文,达到 100 万 token 的处理能力,这一特性让开发者在构建复杂系统时能够更游刃有余。Spline、Rooms 等公司,以及 Snap、SmartBear 等企业,已在过去数周内使用最新版本开发实际应用。

百度首推双数字人互动直播间,文心大模型 4.5T 驱动多模态技术新突破

近日,百度推出全球首个双数字人互动直播间。这一创新应用基于百度文心大模型 4.5 Turbo,通过语言、声音和形象的多模态高度融合,实现了数字人与用户之间的自然、流畅互动,为直播行业带来了全新可能。据悉,这一技术依托文心 4.5T 的多模态联合建模能力,能够同时处理文本、图像和音频输入输出,确保声音与口型、表情与语义的高度一致。

MiniMax 开源全球首个「大规模混合架构」推理模型

MiniMax(稀宇科技)开源旗下大规模混合架构推理模型「MiniMax-M1」,号称「世界上第一个开源的大规模混合架构的推理模型」。模型信息方面,MiniMax-M1 参数大小为 456B,单 token 激活参数为 45.9B。其中最亮眼的是,M1 原生支持 100 万上下文的输入,跟闭源模型里面的 Google Gemini 2.5 Pro 一致,是 DeepSeek R1 的 8 倍。M1 采用 MoE 与「闪电注意力机制」双结合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。测试结果上,M1 在软件工程、长上下文与工具使用等面向生产力的复杂场景中具备显著优势。地址

162025-06

ASML 与梵高博物馆合作开发 3D 扫描技术还原画作笔触

荷兰光刻设备制造商 ASML 与梵高博物馆联合开发了一项名为「厚涂项目」(Impasto Project)的创新计划,运用先进的芯片测量技术研制出一台专用的 3D 扫描设备。该设备能够精准捕捉梵高作品中标志性的厚重笔触技法(Impasto),将画作表面的立体纹理转化为数字信息。单幅画扫描后可产生约 100GB 的数据量,从而构建出高度精确的数字副本。

苹果 WWDC25 全球巡回活动启动

苹果近期在全球范围内开展了一系列与 WWDC25 相关的主题活动,旨在为开发者、设计师和产品经理提供深入了解最新技术的平台。此次活动结合线下互动与线上预约的方式,拉近了参与者与前沿技术之间的距离。在全球开发者大会 WWDC25 结束后,苹果随即启动了全球巡回交流计划,以进一步推广大会期间发布的技术成果。本次活动聚焦于 Apple Intelligence、visionOS、开发工具以及跨平台应用设计等关键内容,通过多样化的形式帮助不同地区的专业人士更好地掌握最新动向。

Adobe 发布 Premiere Pro 25.3:支持 Blackwell GPU 硬件加速编码

Adobe 宣布,最新版本 Premiere Pro 25.3 现已推出,其关键升级在于支持英伟达全新 Blackwell 架构 GPU 的硬件加速功能,可对 4:2:2 色度采样的视频进行编码和解码,更好地满足专业创作者的需求。相比此前 Ada Lovelace 及更早架构 GPU 仅支持 H.264/H.265 的 4:2:0 色度采样硬件编解码,Blackwell 架构新增了 4:2:2 的支持。此举能显著减轻 CPU 负担,从而加速创作流程。

微软在 Win 版 OneNote 为企业用户上线 Copilot 笔记本功能

微软公司宣布,拥有 Microsoft 365 Copilot、SharePoint 或 OneDrive 许可证的企业用户,现在可以在 Windows 版 OneNote 中直接使用 Microsoft 365 Copilot 笔记本功能。Copilot 笔记本由人工智能驱动,将 Copilot 聊天、文件、笔记和链接等不同资源整合到一个空间中,以提高工作效率。

腾讯混元上线工业级 3D 生成大模型,达到行业领先水平

腾讯在 CVPR2025(计算机视觉领域顶会之一)上,宣布混元 3D 2.1 大模型对外开源。据介绍,这是首个全链路开源的工业级 3D 生成大模型,达到了行业领先水平。相较于混元 3D 2.0 模型,新模型既优化了几何生成的质量,也开放了 PBR(基于物理的渲染)材质生成大模型。新模型可生成基础颜色、金属度、法线、粗糙度等贴图,支持皮革、木质、金属、陶瓷等多种复杂材质的高质量渲染。

152025-06

阿里开源在手机上运行的 3D 数字人应用 MNN TaoAvatar

阿里巴巴开源 MNN TaoAvatar,这款基于 MNN 框架的 3D 数字人技术能在手机上以 90FPS 流畅运行,结合 3D 高斯溅射实现照片级逼真效果,支持面部表情、手势和身体姿态的毫米级控制,为直播、虚拟社交和 AR 应用带来全新可能。MNN TaoAvatar 的开源标志着阿里巴巴在数字人技术领域的又一重要突破。

MiniMax Agent 上线:长任务处理更智能

MiniMax 官方宣布其 AI 生产力工具 MiniMax Agent 迎来重大升级,新增智能图像搜索、稳定的图像生成、多语言支持及多样化文档导出功能,全面提升用户体验。

AGIDT.COM | 追踪AGI进展 见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AGI脉动AGI会客厅

登录

找回密码

注册