谷歌的 Gemini 2.5 Pro 模型近日在视频理解领域取得重大突破,支持长达 6 小时的视频分析和高达 200 万 Token 的上下文窗口。通过 API 解析 YouTube 链接,模型在 VideoMME 基准测试中表现出色,准确率接近行业顶尖水平。其技术应用于教育、创意产业和商业分析等多个领域,展现了 AI 视觉能力的新纪元。

谷歌的 Gemini 2.5 Pro 模型近日在视频理解领域取得重大突破,支持长达 6 小时的视频分析和高达 200 万 Token 的上下文窗口。通过 API 解析 YouTube 链接,模型在 VideoMME 基准测试中表现出色,准确率接近行业顶尖水平。其技术应用于教育、创意产业和商业分析等多个领域,展现了 AI 视觉能力的新纪元。

最新评论