Runway AI 电影节纽约开幕,6000 部参赛作品决出十强
全球知名的 AI 视频技术公司 Runway 在纽约举行了其年度 AI 电影节。此次电影节吸引了全球的目光,来自各地的创作者们纷纷提交了约6000部短片,最终评选出十部优秀作品进行展映。Runway 的首席执行官克里斯托瓦尔・巴伦苏埃拉在活动中表示,三年前的愿景如今已成为现实,全球已有数百万人使用他们的工具创作出数十亿条视频。
全球知名的 AI 视频技术公司 Runway 在纽约举行了其年度 AI 电影节。此次电影节吸引了全球的目光,来自各地的创作者们纷纷提交了约6000部短片,最终评选出十部优秀作品进行展映。Runway 的首席执行官克里斯托瓦尔・巴伦苏埃拉在活动中表示,三年前的愿景如今已成为现实,全球已有数百万人使用他们的工具创作出数十亿条视频。
Google 近日为其旗舰 AI 视频生成工具 Veo3 推出全新 FAST/TURBO 模式,以更低的成本、更快的生成速度和带声音的视频输出,掀起了业界热议。这一更新不仅大幅提升了生成效率,还让高质量 AI 视频创作变得更加普惠。相比标准模式,FAST 模式每段视频的成本降低了 80%,性价比提升了五倍。
OpenAI 在去年推出的 GPT-4o 基础上,再次对其高级语音模式进行了重大的更新,使得语音交流变得更加自然和贴近人类的对话方式。这一先进的功能依托于原生的多模态模型,能够快速响应音频输入,最快在232毫秒内作出反应,平均响应时间为320毫秒,几乎与人类的对话速度不相上下。
智谱 AI 宣布,全新企业级超级助手 Agent CoCo 正式上线。CoCo 具备三大显著的企业级特性。首先,它以交付为导向,全流程辅助工作,确保每一项任务都能以最终成果为衡量标准,真正做到用结果说话。其次,CoCo 引入了独特的记忆机制,能够根据每位员工的职能和需求,主动提供个性化的服务,成为每位员工的专属秘书。这一机制还能根据用户的工作重点,主动跟踪行业动态,确保信息的及时性和准确性。最后,CoCo 具备无缝嵌入企业现有系统的能力,它能够融合企业已有的数据资源和系统工具,打造出一个真正懂企业的智能助手。地址
字节跳动旗下 AI 创作平台即梦 AI 迎来重大更新,其核心产品即梦图片 3.0 的智能参考功能已于近日全量上线。新功能以其强大的中文生成能力、头发丝级别的细节保留和超低的使用成本,为 AI 设计领域注入了新的活力。该功能以强大的中文理解能力和影视级生成效果,彻底颠覆了传统设计流程,让普通用户也能轻松创作专业级海报、电商封面和短视频配图。
内测上线了即梦图片 3.0 的,智能参考,现在,可以垫图了。
日前,Cursor 发布了 1.0 版本的重大更新,标志着这款 AI 编程工具正式进入成熟阶段。本次更新包含多项重要功能:智能代码审查助手 Bugbot、Background Agent 后台编程助理全量开放、Jupyter 集成、Memories 记忆功能、MCP Server 配置简化、可视化对话界面增强、数据分析功能优化等。这些功能让 Cursor 变得更加专业化,特别适合开发团队使用,但同时也增加了普通用户的使用复杂度。官网
在第七届「北京智源大会」上,智源研究院重磅推出了一系列名为「悟界」的大模型。这些模型的发布标志着人工智能领域又一次技术的飞跃,吸引了众多科技爱好者的目光。此次发布的模型包括原生多模态世界模型 Emu3、脑科学多模态通用基础模型见微 Brainμ、以及跨本体的具身大小脑协作框架 RoboOS2.0 和具身大脑 RoboBrain2.0。此外,还有全原子微观生命模型 OpenComplex2。这些模型涵盖了从基础科学到复杂智能系统的广泛应用,展现了智源研究院在多模态智能技术方面的雄心和实力。
Google Labs 宣布推出实验项目 Portraits,旨在通过 AI 技术让用户与值得信赖的专家进行对话式互动。Portraits 的独特魅力在于,它直接链接到现实中的专家,确保对话内容始终围绕其专业领域展开。
随着人工智能技术的飞速发展,文本转语音(TTS)领域迎来了新的里程碑。ElevenLabs 正式推出其最新文本转语音模型 Eleven v3(Alpha版),被誉为「地表最强」的 TTS 模型。这款模型不仅能将文本转化为自然流畅的语音,还能通过精准的情感控制和多语言支持,模拟真实对话中的语气变化与非语言表达,为创作者和开发者提供了前所未有的语音生成体验。