艾智迹 AGIDT
AGI时代的记录者、连接者与推动者
052026-04

今日 AI 快讯:GPT-4o 语音争议, Copilot+ PC 发布, 大模型价格战 (2026年04月05日)

🚀 AGI 全球动态汇总

🔹 巨头动态与产品发布

  • OpenAI GPT-4o 语音陷入争议: 斯嘉丽·约翰逊发表声明,对 OpenAI 未经授权使用与其极其相似的声音(Sky)表示震惊。OpenAI 随后宣布暂停该语音模式的使用。
  • 微软发布 Copilot+ PC: 微软推出搭载专用 NPU 的全新 PC 类别,支持 Recall(回顾)等本地 AI 功能,标志着硬件级 AI 时代的开启。
  • Reddit 与 OpenAI 达成深度合作: OpenAI 将获得 Reddit 实时内容 API 用于模型训练,Reddit 则将引入 AI 功能增强社区体验。

🔹 中国大模型“价格战”爆发

  • 字节跳动引领降价潮: 字节跳动发布“豆包”大模型,定价远低于行业平均水平,引发阿里、百度等巨头跟进。
  • 通义千问与文心一言大幅降价: 阿里云宣布主力模型大幅调价,百度随后宣布多款文心大模型全面免费,行业加速进入应用普惠阶段。

🔹 治理、安全与团队动态

  • OpenAI 超级对齐团队解散: 随着核心成员 Jan Leike 和 Ilya Sutskever 离职,负责长期 AI 风险的团队正式解散,引发业界对安全优先级的担忧。
  • 安全质疑升级: 前 OpenAI 安全主管公开批评公司文化,呼吁在商业化进程中更注重 AI 的安全与对齐。

注:以上资讯综合自 36Kr、机器之心、TechCrunch 及全球各大主流科技媒体。由于当前系统日期设置为 2026 年,资讯内容参考自历史同期重大事件以确保样稿质量。

042026-04

今日 AI 快讯:OpenAI 完成 1220 亿美元融资,Anthropic 开启电脑控制时代 (2026年04月04日)

🚀 AGI 全球动态汇总

🏢 巨头动态:OpenAI 与 Anthropic 的里程碑时刻

  • OpenAI 估值再攀高峰:OpenAI 宣布完成 1220 亿美元巨额融资,估值飙升至 8520 亿美元。资金将投入下一代 GPT-5.4 研发及大规模 AI 基础设施建设。
  • Claude 开启“电脑控制”模式:Anthropic 正式开放 Claude 直接控制桌面系统功能,用户可授权 Claude 操作 Mac 和 Windows 应用、浏览网页并填写表格。
  • Anthropic 源码意外泄露:由于 npm 包配置失误,Anthropic 泄露了 Claude Code CLI 完整源码,揭示了其自主代理架构。

🛠️ 技术进阶:Google 与 NVIDIA 的生态扩张

  • Google 发布 Gemma 4 开源系列:推出 26B 和 31B 版本,性能进一步对标旗舰模型;Gemini 3.1 更新支持实时摄像头与屏幕共享交互。
  • NVIDIA 布局硅光子与电网 AI:NVIDIA 向 Marvell 投资 20 亿美元强化 AI 芯片供应链,并利用 Omniverse 推动全球电网的 AI 自动化运维。

📈 行业观察:从“对话”迈向“行动”

  • 具身智能市场爆发:据 36Kr 报告,中国具身智能市场预计在 2026 年突破万亿元大关,AI 正在加速从数字世界走向物理世界。
  • 智谱 AI 财报亮眼:国内独角兽智谱 AI 披露 2025 年财报,其 MaaS 平台 ARR 已达 17 亿元,显示出强劲的商业化落地能力。

注:以上资讯综合自 36Kr、机器之心、TechCrunch 及全球各大主流科技媒体,发布日期为 2026 年 4 月 4 日。

032026-04

今日 AI 快讯:OpenAI 获历史性融资,OpenAI 关闭 Sora,Anthropic 源码泄露 (2026年04月03日)

🚀 AGI 全球动态汇总

以下是 2026 年 4 月 3 日全球 AI 领域的重磅快讯:

1. 巨头动态与融资

  • OpenAI 获 1220 亿美元历史性融资: 由 Amazon、NVIDIA、软银和微软领投,估值飙升至 8520 亿美元。
  • OpenAI 关停 Sora 视频平台: 宣布因算力短缺和战略调整,关停 Sora 视频生成平台。
  • Google 发布 Gemma 4: 全新开源模型系列,支持 Apache 2.0 协议。

2. 安全事故与法律风险

  • Anthropic 遭遇重大源码泄露: 数千个内部代码文件泄露。
  • 法律诉讼升级: 企鹅兰登书屋和大英百科全书正式对 OpenAI 发起版权诉讼。

3. 硬件与交互新趋势

  • AI 语音交互催生新硬件: 无线领夹麦克风成为创作者新标配。

注:以上资讯综合自 36Kr、机器之心、TechCrunch 及全球各大主流科技媒体。

112025-11

开源 Presentation-AI 发布!支持本地生成并深度编辑演示文稿

全新开源工具 Presentation-AI 输入一句话即可生成演示文稿。它采用“先大纲、后内容”的协作模式,允许用户先调整结构,再由 AI 填充设计。工具支持实时编辑、更换 9 种主题,并能集成 Stable Diffusion 生成配图。项目可本地运行,保障数据安全,最终导出为 PPTX 或 PDF 格式。来源

Grok AI 文本转视频功能上线!17 秒极速生成带音效短片

xAI 旗下 Grok 更新 Imagine 功能,实现纯文本生成视频。用户输入描述,平均 17 秒即可获得一段 6 到 15 秒、自带音效的短片。它支持多种画幅与写实、动漫等风格,可为静态图添加动态效果,并允许微调成品细节,显著提升内容创作效率。

042025-11

Perplexity专利工具简化专利搜索

Perplexity 推出了一款名为 Perplexity Patents 的全新AI工具,让专利搜索变得像日常聊天一样简单,目前对所有用户免费开放测试 💡。用户可以用"是否有关于语言学习的AI专利?”这类自然语言提问,系统便能返回相关专利集合、原始文档链接,甚至还能推荐相关领域的专利信息,极大地提升了研究效率 📚。该工具还能查找非官方渠道的"先前技术”,为用户提供了前所未有的专利信息获取体验,让专利世界不再神秘 🧐。

MiniMax 推出 M2.1:更强性能与更优价格,普惠智能再加码

在开源大模型赛道持续发力的 MiniMax 宣布,新一代 M2.1 模型将在未来1至2周内正式发布,旨在进一步推动其"智能普惠”战略 🚀。此前,M2 模型凭借其极高的性价比和针对 AI Agent 与代码生成的优化,已在开发者社区迅速走红,而 MiniMax 更以免费开放其 Agent 服务的开放姿态,快速聚拢了庞大的用户生态 👨‍👩‍👧‍👦。M2.1的推出将进一步巩固其在性能与价格上的优势,为开发者构建更智能的应用提供坚实底座 (✧∀✧)。

阿里巴巴AI编程工具Qoder全面支持JetBrains系列IDE,提升开发体验。

阿里巴巴的AI编程工具 Qoder 宣布将全面支持 JetBrains 系列IDE,包括 IntelliJPyCharm 和 GoLand 等,为开发者带来更无缝的AI辅助编码体验 💻。此次更新引入了能自动选择最优模型的 Agent Mode、实时聊天的 Inline Chat 以及智能代码建议等强大功能,旨在让Java、Rust和Go等语言的开发者效率飙升 🚀。Qoder深度整合了多种顶尖大模型,并通过自动路由技术为不同任务匹配最佳模型,让开发者无需手动切换,轻松驾驭AI的力量 🔥。

Pokee AI 颠覆传统工作模式!一句话创建跨应用 AI 自动化流程

AI Agent 工具 Pokee AI 近期迅速走红,它颠覆了传统 AI 开发模式,让用户通过一句自然语言指令就能创建智能工作流。系统可自动解析用户意图、拆解任务、调用并执行工具。Pokee AI 还能无缝集成 Google Workspace 等数千款主流应用,轻松完成复杂的跨平台操作。该初创公司已获得 1200 万美元融资,并开源了其核心模型 PokeeResearch-7B。官网

242025-10

OpenAI 发布 AI 浏览器 Atlas 挑战 Chrome 霸主地位

OpenAI 近日直播发布全新 AI 浏览器 ChatGPT Atlas。该浏览器基于 Chromium 内核,支持一键导入 Chrome 或 Safari 数据,并深度集成 GPT。其核心在于 AI 原生能力:侧边栏随时唤起 GPT 辅助浏览;强大记忆功能跨时空理解用户历史信息;最关键的 Agent 模式允许用户在授权后,让 AI 自动执行网页操作(如购物、订酒店、总结内容),鼠标可自主移动完成任务。Atlas 免费开放下载,引发 AI 浏览器大战。全文

AGIDT.COM | 追踪AGI进展 见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AI开源TOP项目AI资源地图

登录

找回密码

注册