AI快讯-艾智迹 AGIDT-第7页

 

062025-08

腾讯混元上线AI播客，一键把长文变对话音频

腾讯混元正式发布AI播客功能，可将文本、网页、文档在约90秒内生成自然流畅的双人对谈式音频。

支持三种输入：主题描述、网页URL、文档上传（含PDF、Word、Markdown等）。
采用一男一女双角色对话，语音自然生动，可补充外部信息并解析原文。
已应用于ima知识库，腾讯新闻版AI播客预计8月底上线。

新闻、论文、行业报告等复杂内容可随时“听懂”，提升碎片时间信息获取效率。

官网：https://hunyuan.tencent.com

10:07

OpenAI开源GPT-oss：200万小时训练的AI Agent专用模型

OpenAI凌晨开源GPT-oss模型，含120B与20B两个版本，支持Apache 2.0商用。

模型为AI Agent优化，支持函数调用、网络搜索、Python执行，性能可媲美o4-mini。
120B需80GB显存，20B仅需16GB，号称可在个人设备甚至手机运行。
训练耗时超200万小时，是目前最重投入的开源模型之一。

OpenAI称此举将加速AI创新，赋能个人控制和本地部署，但网友质疑20B版本在手机上运行的可行性。

GitHub：GitHub - openai/gpt-oss: gpt-oss-120b and gpt-oss-20b are two open-weight language models by OpenAI

HuggingFace：https://huggingface.co/openai/GPT-oss-120b

10:05

052025-08

ChatGPT 可以“更好地检测”精神困扰

概要：在 GPT-5 预计发布之前，OpenAI 已经实施了一系列变化促进 ChatGPT 的“健康使用”，包括旨在检测用户何时经历精神困扰的增强工具。

详细信息：

OpenAI 表示，虽然这种情况很少见，但也存在 GPT-4o 无法识别“妄想或情感依赖”迹象的情况。该公司现在已经在 ChatGPT 中建立了自定义规则，用于评估聊天、标记困扰并使用基于证据的资源进行适当回复。OpenAI 正在与医生、人机交互专家和顾问小组合作，以获得反馈并改进其在这种情况下的方法。它还增加了提示，以防止用户进行长时间的聊天，并改变其不那么果断的方式，帮助用户思考高风险的情况。

为什么重要：在 GPT-5 发布之前，OpenAI 始终将用户安全放在首位，并重申其致力于关注用户福祉。随着人类与高级人工智能的互动日益频繁，需要开展更多研究，但这正朝着负责任的使用迈出了一步，OpenAI 在发布其下一个模型之前就明确了这一点。

18:10

GitHub Models服务开放主流大模型免费推理接口，极大地降低AI开发门槛

GitHub官方亲自下场，推出了足以改变开源AI生态的GitHub Models服务，旨在彻底解决开源项目"推理难”的痛点 🤔。这项服务提供了一个免费的AI模型推理接口，让开发者无需自备昂贵的API Key或配置复杂的环境，仅凭GitHub账户就能直接调用GPT-4o、Llama 3等主流大模型。这无疑极大地降低了AI应用的试用和贡献门槛，让"人人可用AI”的梦想又近了一大步，更多详情请看官方介绍 🔥。

11:49

042025-08

马斯克推出Grok Imagine功能，可一键生成图片视频，在社交媒体掀起病毒式传播热潮

钢铁侠再出王炸，马斯克的 Grok Imagine 功能震撼登场，一键生成图片和短视频的功能在社交媒体上掀起了病毒式传播热潮 (o´ω'o)ﾉ。这项直接对标谷歌 Veo 3 的新工具，不仅能将用户的奇思妙想迅速变为现实，还因其极快的生成速度和搞怪的创作风格，让整个网络都沉浸在创作的狂欢之中 🔥。马斯克更暗示这可能是AI版 Vine 的前奏，预示着一个全民AI视频创作时代的到来🚀。

10:03

032025-08

视频工具Runway推出Aleph模型，用户能通过自然语言指令编辑视频，极大地降低了后期制作门槛。

视频创作工具Runway刚刚投下重磅炸弹，推出了名为Aleph的全新视频编辑模型，让视频编辑从此像聊天一样简单 (✧∀✧)。用户只需通过自然语言指令，就能轻松实现添加或移除物体、改变场景光照、甚至生成全新的拍摄视角。这个强大的新功能 - 标志着视频内容创作和操作方式的又一次巨大飞跃，将复杂后期制作的门槛夷为平地。🔥

10:20

022025-08

Augment 推出全新 CLI 工具 Auggie，革新开发者工作流

Augment 发布了名为 Auggie 的全新 CLI 工具，旨在通过增强的上下文理解，简化开发者工作流程。Auggie 支持命令行操作，并与 Visual Studio Code 和 JetBrains IDE 深度集成，方便开发者快速登录使用。该工具采用 Unix 风格设计，易于集成到现有脚本和自动化流程中，支持 CI 管道、代码审查等任务。其核心是强大的上下文引擎，能够理解整个代码库，提供代码生成、调试和优化功能。Auggie 还支持一键式集成，连接 CircleCI、MongoDB 等工具，并原生集成 GitHub、Jira 等平台，提供企业级 AI 编码解决方案，可处理高达 10,000 次提交历史。

10:17

Claude神器升级：PDF、图像、代码文件都能上传，AI应用与数据无缝协作

Claude神器近期更新，支持上传PDF、图像、代码等多种格式文件，实现AI应用与数据无缝集成。新功能增强了数据处理能力，用户可将数据导入AI应用进行智能分析和处理。升级包括更高效的数据导入流程和更直观的交互界面。这项更新得益于Claude4模型、Claude3.7Sonnet及Claude3.5Sonnet等先进AI技术的支持，使用户能更便捷地利用AI解决问题。

10:16

Poe震撼升级：API开放，订阅即用，图像视频AI模型全覆盖，兼容OpenAI接口！

AI 总结

Poe 推出 API，提供订阅即用服务，覆盖所有 AI 模型和机器人，包括图像和视频模型。用户无需额外付费即可调用，降低了使用门槛。API 兼容 OpenAI chat completions 接口，方便开发者集成。Poe API 的发布是其向开发者工具转型的重要一步，旨在探索 AI 技术的无限潜力。

10:15

Trae强势升级！支持OpenAI o3，解锁AI代码编辑新境界

Trae，字节跳动推出的 AI 代码编辑器，现已支持 OpenAI 最新 o3 模型。此次升级增强了代码生成、错误检测和复杂逻辑推理能力。开发者可以使用 Trae 实现智能代码补全，上下文感知调试和多工具协同，提高编程效率。 o3 模型在代码生成质量和多样性上表现出色。开发者社区对此次升级反应积极，尤其认可其在 Python 和 JavaScript 编程中的应用。 Trae 承诺保护用户隐私，并采用安全措施。随着 AI 技术发展，Trae 在 AI 辅助编程领域具有巨大潜力。

10:14

上一页
1
···
4
5
6
7
8
9
10
...
下一页
共 32 页

AGIDT.COM | 追踪AGI进展见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AI开源TOP项目AI资源地图

QQ咨询86458694
关注微信banny-pan
复制微信号
电话咨询18916369709
回顶部