艾智迹 AGIDT
AGI时代的记录者、连接者与推动者
042025-06

黑森林实验室推出 FLUX.1Kontext:可通过文本和参考图像对图像进行多次修改

黑森林实验室(Black Forest Labs,简称 BFL),由著名的 Stable Diffusion 模型创作者成立,近日推出了新一代图像生成模型 FLUX.1Kontext。该模型不仅可以生成和编辑照片,还支持用户通过文本和参考图像对图像进行多次修改,为企业的 AI 应用带来了全新可能。地址

小米多模态大模型 Xiaomi MiMo-VL 开源

近日,小米公司研发的 MiMo-VL 多模态模型接过 MiMo-7B 的接力棒,在多个领域展现出了强大的实力。该模型在图片、视频、语言的通用问答和理解推理等多个任务上大幅领先同尺寸标杆多模态模型 Qwen2.5-VL-7B,在 GUI Grounding 任务上的表现更是可与专用模型相媲美,为 Agent 时代的到来做好了准备。地址

阿里云通义灵码 AI IDE 正式上线,带来编程新体验

阿里云推出了通义灵码 AI IDE,这款深度适配千问3的人工智能开发环境具备强大的编程智能体模式、长期记忆和行间建议预测功能,同时提供行间对话功能,显著提升开发效率,已成为国内最受欢迎的编程辅助工具之一。

Manus Slides 正式发布:一键生成专业演示文稿

AI 初创公司 Manus 宣布推出其新功能 Manus Slides,旨在通过单个提示快速生成结构化的演示文稿。该功能利用了 Manus 强大的 AI 代理能力;用户只需输入主题和目标,系统即可自动生成完整的幻灯片内容,涵盖各种场景,如商务会议、教育课程或网络研讨会,从而显著提高创建演示材料的效率。

302025-05

字节跳动推出 AI 剪辑软件「剪小映」

字节跳动近日上线一款名为「剪小映」的 APP,Slogan 为「记录美好 智能成片」,这是继「即梦AI」APP 后,剪映推出的第二款 AI 产品,使用的是火山引擎的豆包大模型。这款产品的使用非常简单,用户手机的本地相册内只需有拍好的照片和视频,剪小映就能根据这些素材智能成片。生成的视频可直接导出高清文件保存在 APP 以及手机相册中,或一键分享至抖音、小红书、微信朋友圈。

蚂蚁百灵发布新款多模态大模型

蚂蚁百灵大模型(Ling)团队日前正式开源统一多模态大模型 Ming-lite-omni。据介绍,Ming-lite-omni 是一款基于 Ling-lite 构建的 MoE 架构的全模态模型,其总参数 22B,激活参数 3B。其支持「跨模态融合与统一」「理解与生成统一」。在多项理解和生成能力评测中,Ming-lite-omni 以仅 3B 的参数激活量, 性能与 10B 量级领先的多模态大模型相当或更优。官方表示,这也是目前已知首个在模态支持方面能够与 GPT-4o 相媲美的开源模型。

快手可灵 AI 上线 2.1 系列模型:生成 5 秒视频不到 1 分钟

快手旗下可灵 AI 正式发布全新可灵 2.1 系列模型,包含标准版(720p)和高品质版(1080p)两种模式,在性价比、生成速度和质量表现三大维度实现全面突破。同时,定位高端的可灵 2.1 大师版进一步优化了运动表现和语义响应能力,为 AI 视频创作带来更专业的解决方案。在生成速度上,可灵 2.1 表现同样亮眼。实测数据显示,其 1080p 高品质模式生成 5 秒视频仅需不到 1 分钟,远快于行业同级别模型的 2-3 分钟,大幅提升用户创作效率。

字节发布图像 Agent「小云雀 AI」 打造一键爆款创作神器

字节跳动推出了全新的图像 Agent 小云雀 AI,这款智能创作工具能够通过简单的指令快速生成高质量的视频和图片,降低了内容创作的技术门槛。用户只需一句指令,「小云雀 AI」就能主动思考并生成爆款视频与图片,实现「灵感即所得」。基于字节自研「云雀」大模型,融合深度学习与多模态技术,提供强大的图像生成与视频编辑能力。当前已上线安卓客户端,iOS 版本预计 6 月发布,有望推动 AI 创作向更广泛应用场景发展。

Opera 发布 AI 浏览器 Opera Neon:可写代码,创建网站

浏览器开发商 Opera 近日推出革命性产品 Opera Neon,这款被定义为「代理浏览器」的创新产品将人工智能深度整合到浏览体验中。不同于传统浏览器,Neon 可以代用户进行研究、内容创作甚至网站开发,包括生成游戏、报告和代码片段等。特别值得注意的是,其 AI 代理即使在离线状态下也能处理多项任务,该浏览器整合了多项 AI 创新功能,类似微软 Copilot 的智能助手,通过自然语言交互完成网络搜索和信息查询。

292025-05

理想汽车 OTA7.4 正式推送!自研 MindGPT-4o-preview 模型首次上车

理想汽车宣布 OTA7.4 已正式推送,在本次升级当中,理想汽车自研的 MindGPT-4o-preview 模型首次上车。详细来看,智能座舱方面,理想同学全面焕新,形象升级为 3D 毛绒形象,还增加了双手,执行任务时会模拟点击,动作灵动,形象温暖。基于 MindGPT-4o-preview 模型,理想同学音色更丰富,情绪表达更类人,聊天风格更有趣,新增的小同桌功能,响应速度快,能扮演多种角色与用户持续聊天,还能高情商引导对话,提供陪伴感。

AGIDT.COM | 追踪AGI进展 见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AI开源TOP项目AI资源地图

登录

找回密码

注册