艾智迹 AGIDT
AGI时代的记录者、连接者与推动者

Gemini 2.5 Pro 实现 6 小时视频理解,AI 视觉能力迈入新纪元

谷歌的 Gemini 2.5 Pro 模型近日在视频理解领域取得重大突破,支持长达 6 小时的视频分析和高达 200 万 Token 的上下文窗口。通过 API 解析 YouTube 链接,模型在 VideoMME 基准测试中表现出色,准确率接近行业顶尖水平。其技术应用于教育、创意产业和商业分析等多个领域,展现了 AI 视觉能力的新纪元。

赞(0) 打赏
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《Gemini 2.5 Pro 实现 6 小时视频理解,AI 视觉能力迈入新纪元》
文章链接:https://www.agidt.com/index.php/2025/05/13/gemini-2-5-pro-%e5%ae%9e%e7%8e%b0-6-%e5%b0%8f%e6%97%b6%e8%a7%86%e9%a2%91%e7%90%86%e8%a7%a3%ef%bc%8cai-%e8%a7%86%e8%a7%89%e8%83%bd%e5%8a%9b%e8%bf%88%e5%85%a5%e6%96%b0%e7%ba%aa%e5%85%83/
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

AGIDT.COM | 追踪AGI进展 见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AGI脉动AGI会客厅

登录

找回密码

注册