谷歌的 Gemini 2.5 Pro 模型近日在视频理解领域取得重大突破,支持长达 6 小时的视频分析和高达 200 万 Token 的上下文窗口。通过 API 解析 YouTube 链接,模型在 VideoMME 基准测试中表现出色,准确率接近行业顶尖水平。其技术应用于教育、创意产业和商业分析等多个领域,展现了 AI 视觉能力的新纪元。

谷歌的 Gemini 2.5 Pro 模型近日在视频理解领域取得重大突破,支持长达 6 小时的视频分析和高达 200 万 Token 的上下文窗口。通过 API 解析 YouTube 链接,模型在 VideoMME 基准测试中表现出色,准确率接近行业顶尖水平。其技术应用于教育、创意产业和商业分析等多个领域,展现了 AI 视觉能力的新纪元。
最新评论
您好,这是一条评论。若需要审核、编辑或删除评论,请访问仪表盘的评论界面。评论者头像来自 Gravatar。