艾智迹 AGIDT
AGI时代的记录者、连接者与推动者
132025-07

智谱 AI 推出 Slides 工具,5 分钟生成专业 PPT

智谱 AI 上线 AI Slides 工具,用户输入主题或上传文档,5 分钟生成专业 PPT。工具免费,支持职场汇报、学术研究等场景。基于 GLM 模型分析信息生成结构清晰内容。用户登录智谱清言平台切换模型即可使用。来源

DeepMind 开源 GenAI 库,AI 工作流构建更轻松

谷歌 DeepMind 开源 Python 库 GenAI Processors,助力开发者轻松构建生成式 AI 工作流。提供统一 Processor 接口,分割任务处理音频、文本、图像等多模态数据。优化异步并发执行,利用 asyncio 降低延迟加速实时应用。集成 Gemini API,内置处理器快速开发翻译助手等代理。支持 Python,开放社区贡献功能。未来协作扩展覆盖更多场景语言,降低开发复杂性推动生态开放。来源

谷歌 Veo3 新增图像转视频功能,七周超 4000 万视频诞生

Google 宣布为 Gemini 应用新增图像转视频功能,支持 Veo 3。用户上传照片生成视频短片,添加声音描述。视频可下载分享。目前仅限 AI Ultra 和 Pro 用户使用,每天最多创建 3 个。上线七周用户已生成超 4000 万视频。所有视频带 Veo 水印和 SythID 数字水印。Google 提供检测 synthID 工具。

可灵 AI 发布可图 2.1 模型,支持 180 种风格

可灵 AI 发布了新一代图像生成模型 可图 2.1,在指令遵循、人像美感和电影质感等方面有显著提升,并且具备强大的文字生成能力。新模型支持超过 180 种风格响应,为用户提供更丰富的创作选择。

墨刀 AI 推出 30 秒原型生成功能,设计师福音

墨刀 AI 上线全新原型生成能力,用户输入想法,AI 仅需 30 秒生成高保真可编辑原型。支持局部修改,轻松上手。生成手机、网页、平板等设备尺寸原型。上传草图,AI 识别布局快速创建页面。提供双模式编辑,二次调整布局,一键分享演示。自动生成文档,梳理逻辑。原型与代码联动,集成 UI 组件,适配多端,覆盖电商、社交、官网等场景,大幅提升设计效率。官网

苹果公布穿戴设备 AI 模型,怀孕检测准确率 92%

苹果联合哈佛医学院等机构开发可穿戴行为模型 WBM,利用超 25 亿小时行为数据训练。新模型分析步数、活动能力等高阶指标,突破传统生理监测局限。WBM 在 18 项健康预测任务超越传统方法,结合生理数据时怀孕检测准确率高达 92%。模型捕捉长期行为变化,与短期生理监测互补,提升健康预警能力。来源

上传 10 张照片,AI 秒变时尚大片!Higgsfield Soul ID 火爆全球

Soul ID 是 Higgsfield AI 推出的一款革命性 AI 工具,能够通过上传 10 张以上个人照片生成高度个性化的虚拟形象。其核心功能包括真实感与多样性的完美融合、多样化风格预设以及自动提示词优化,为内容创作者和时尚博主提供了强大的创作工具。来源

082025-07

 AI 神器 Shortcut 颠覆 Excel 操作,说话生成报表提速 10 倍

AI 助手 Shortcut 引爆办公场景,用户直接说话即可操控 Excel 生成报表、透视表及趋势图,彻底摆脱公式与 VBA 编码。实测显示:该工具处理锦标赛案例仅需 10 分钟,效率超人类冠军 10 倍,评分达 80%。财务、分析师群体可借自然语言指令快速完成数据分析,新手友好。当前开放邀请制测试,常规数据处理流畅,超大数据集待优化。来源

Gemini CLI 升级支持音视频处理与隐私

谷歌开源命令行工具 Gemini CLI 发布新版本。更新合并 85 个 PR,51 位社区贡献者参与。新增音视频处理功能,支持终端处理音频视频文件。增强 Markdown 文件处理,实现嵌套导入和表格渲染。添加 /privacy 命令强化隐私控制。升级 Ink6 和 React19 框架,兼容 VSCodium 与 Neovim 编辑器。优化历史压缩机制,防止无限循环提升稳定性。免费提供百万 token 上下文窗口和高请求配额。来源

Claude 即将发布 Claude Neptune v3 模型,数学能力超强

Anthropic 正在测试代号为‘Claude Neptune v3’的新 AI 模型,该模型可能成为 Claude4.5 的前身或全新突破。目前处于内部红队测试阶段,重点测试其宪法 AI 系统的稳健性,并在数学推理能力上表现出色。

AGIDT.COM | 追踪AGI进展 见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AI开源TOP项目AI资源地图

登录

找回密码

注册