谷歌发布并开源端侧多模态大模型 Gemma3n,为手机、平板、笔记本等端侧设备带来强大多模态功能。提供 E2B 和 E4B 两个版本,原始参数量分别为 5B 和 8B,但内存占用仅相当于传统 2B 和 4B 模型,分别只需 2GB 和 3GB 内存即可运行。原生支持图像、音频、视频和文本的多模态输入处理,支持 140 种文本语言和 35 种语言的多模态理解。地址
谷歌开源 Gemma3n 多模态模型,手机也能跑出云端 AI 性能
文章名称:《谷歌开源 Gemma3n 多模态模型,手机也能跑出云端 AI 性能》
文章链接:https://www.agidt.com/?p=501
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

艾智迹 AGIDT



AIGC 大厂实战设计案例 《用AI提高10倍效率的方法》
AIGC自学指南
AI视频
DeepSeek高效使用指南
最新评论
Very energetic article, I loved that bit. Will there be a part 2?
口型同步这个方向确实很有潜力,特别是驱动静态照片这个功能,让内容创作门槛大幅降低。现在各家AI视频工具都在这块发力,竞争越来越激烈。
FLUX.1 Krea [dev] 听起来像是给AI图像生成带来了一股清流,尤其是它强调的‘有主见’和避免过度饱和的问题,这确实抓住了当前AI生成内容的一个痛点。对于像我这样的创作者来说,能有一个自带审美、细节丰富的模型,无疑会大大提升创作效率和作品质量。期待看到更多基于这个模型的创意应用。