艾智迹 AGIDT
AGI时代的记录者、连接者与推动者
042025-06

谷歌推出新 App:没网也能玩 AI,还能画图、写代码

谷歌上周悄然发布一款应用,允许用户在手机上运行来自AI开发平台 Hugging Face 的多种开源 AI 模型。这款应用名为 Google AI Edge Gallery,现已上线安卓平台,iOS 版即将推出。用户可以通过该应用查找、下载并运行兼容模型,实现图像生成、问答、代码编写与编辑等多种功能。所有模型均可在本地离线运行,无需连接互联网,直接利用支持机型的处理器完成任务。

手机照片一键变艺术!Runway Gen-4 References 解锁相机胶卷新玩法

近日,Runway 公司宣布其最新功能 Gen-4References 已支持移动设备,用户可通过手机相机胶卷中的照片,快速将其转化为风格一致的艺术作品。这一功能将 AI 生成技术与移动端便捷性完美结合,为内容创作者和普通用户打开了全新的创作可能性。据官方介绍,Gen-4References 不仅支持人物和场景的风格一致性,还能通过参考图像保留光线、色彩、构图等细节,为用户提供高度可控的创作体验。

Midjourney V7 重磅更新:渲染速度飙升 40%

Midjourney 官方通过社交媒体发布三项重要更新,展示了其持续优化用户体验和社区参与的努力。首先,Midjourney V7 版本的渲染速度提升了约 40%。这一显著改进意味着用户能够更快地生成高质量图像,大幅提升创作效率。其次,Midjourney 的图像编辑器迎来了 AI 版主功能的升级。新版 AI 版主更加智能,能够更精准地理解用户需求并提供优化建议。最后,Midjourney 启动了第二轮社区路线图投票活动,邀请用户参与决定平台未来的发展方向。投票地址

黑森林实验室推出 FLUX.1Kontext:可通过文本和参考图像对图像进行多次修改

黑森林实验室(Black Forest Labs,简称 BFL),由著名的 Stable Diffusion 模型创作者成立,近日推出了新一代图像生成模型 FLUX.1Kontext。该模型不仅可以生成和编辑照片,还支持用户通过文本和参考图像对图像进行多次修改,为企业的 AI 应用带来了全新可能。地址

小米多模态大模型 Xiaomi MiMo-VL 开源

近日,小米公司研发的 MiMo-VL 多模态模型接过 MiMo-7B 的接力棒,在多个领域展现出了强大的实力。该模型在图片、视频、语言的通用问答和理解推理等多个任务上大幅领先同尺寸标杆多模态模型 Qwen2.5-VL-7B,在 GUI Grounding 任务上的表现更是可与专用模型相媲美,为 Agent 时代的到来做好了准备。地址

阿里云通义灵码 AI IDE 正式上线,带来编程新体验

阿里云推出了通义灵码 AI IDE,这款深度适配千问3的人工智能开发环境具备强大的编程智能体模式、长期记忆和行间建议预测功能,同时提供行间对话功能,显著提升开发效率,已成为国内最受欢迎的编程辅助工具之一。

Manus Slides 正式发布:一键生成专业演示文稿

AI 初创公司 Manus 宣布推出其新功能 Manus Slides,旨在通过单个提示快速生成结构化的演示文稿。该功能利用了 Manus 强大的 AI 代理能力;用户只需输入主题和目标,系统即可自动生成完整的幻灯片内容,涵盖各种场景,如商务会议、教育课程或网络研讨会,从而显著提高创建演示材料的效率。

302025-05

字节跳动推出 AI 剪辑软件「剪小映」

字节跳动近日上线一款名为「剪小映」的 APP,Slogan 为「记录美好 智能成片」,这是继「即梦AI」APP 后,剪映推出的第二款 AI 产品,使用的是火山引擎的豆包大模型。这款产品的使用非常简单,用户手机的本地相册内只需有拍好的照片和视频,剪小映就能根据这些素材智能成片。生成的视频可直接导出高清文件保存在 APP 以及手机相册中,或一键分享至抖音、小红书、微信朋友圈。

蚂蚁百灵发布新款多模态大模型

蚂蚁百灵大模型(Ling)团队日前正式开源统一多模态大模型 Ming-lite-omni。据介绍,Ming-lite-omni 是一款基于 Ling-lite 构建的 MoE 架构的全模态模型,其总参数 22B,激活参数 3B。其支持「跨模态融合与统一」「理解与生成统一」。在多项理解和生成能力评测中,Ming-lite-omni 以仅 3B 的参数激活量, 性能与 10B 量级领先的多模态大模型相当或更优。官方表示,这也是目前已知首个在模态支持方面能够与 GPT-4o 相媲美的开源模型。

快手可灵 AI 上线 2.1 系列模型:生成 5 秒视频不到 1 分钟

快手旗下可灵 AI 正式发布全新可灵 2.1 系列模型,包含标准版(720p)和高品质版(1080p)两种模式,在性价比、生成速度和质量表现三大维度实现全面突破。同时,定位高端的可灵 2.1 大师版进一步优化了运动表现和语义响应能力,为 AI 视频创作带来更专业的解决方案。在生成速度上,可灵 2.1 表现同样亮眼。实测数据显示,其 1080p 高品质模式生成 5 秒视频仅需不到 1 分钟,远快于行业同级别模型的 2-3 分钟,大幅提升用户创作效率。

AGIDT.COM | 追踪AGI进展 见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AGI脉动AGI会客厅

登录

找回密码

注册