开源 AI 桌面助手 Glass 一夜爆火,会议记录灵感捕捉不在话下
Pickle 团队推出开源 AI 桌面助手 Glass,火爆开发者和职场圈。助手隐形运行后台,实时处理屏幕音频,主动分析任务提供建议。会议中自动监听音频,生成记录摘要,整理结构化笔记。支持学习编程,分析文档网页优化代码。开源 GitHub ...
Pickle 团队推出开源 AI 桌面助手 Glass,火爆开发者和职场圈。助手隐形运行后台,实时处理屏幕音频,主动分析任务提供建议。会议中自动监听音频,生成记录摘要,整理结构化笔记。支持学习编程,分析文档网页优化代码。开源 GitHub ...
中国科学院计算技术研究所推出Stream-Omni多模态大模型,同步处理文本、视觉和语音。语音交互实时显示中间文本结果,提升效率。模型优化模态关系,减少数据依赖,实现高效对齐。支持多模态组合输入,实验显示语音能力领先,视觉媲美同行,奠定智能...
OpenAI CEO 奥尔特曼播客确认 GPT-5 今夏推出。模型整合文本、图像、语音和视频处理能力,提供统一界面。用户无需切换工具,简化体验。支持更大上下文窗口,处理复杂任务。自主调整响应,适应用户行为个性化输出。OpenAI 提升性能易...
谷歌宣布推出 Veo 3 视频生成模型,全球 159 国以上 Gemini 用户现已可用。用户输入文本提示,轻松生成最长八秒视频,简化短视频创作过程。该工具面向创意用户,助力社交媒体内容生产。目前仅限 AI Pro 计划付费用户使用,每日最...
腾讯元器平台推出微信支付 MCP,解决智能体支付需求。开发者快速接入支付功能,支持生成二维码链接和微信端拉起支付。提供体验版免费测试及正式版申请,无需商户认证,腾讯协助注册收款账号。简化订单查询流程,推动智能体创作者实现服务变现,打通 AI...
字节跳动宣布开源 Trae-Agent 核心组件。开发者运行 git clone 和 cd 命令即可获取该工具。Trae-Agent 利用自然语言自动化编程任务,大幅提升效率。兼容 OpenAI、Anthropic 等模型,集成文件编辑、脚...
德国 TNG 公司推出「DeepSeek R1T2」模型,速度超越原版 R1(0528)两倍。构建 685B 尺寸 MoE 架构,整合多版本模型。测试显示性能在 GPQA Diamond 和 AIME 24 基准优于 R1,但落后 R1(0...

随着AI的普及和快速发展,越来越多的人开始关注AI,但是深奥晦涩的专业术语,让很多人望而却步,甚至对于人们应用AI产生了一定困难。因此,社区决定对AI领域的热点概念和专业术语进行解读,并配备相应图表以便于大家更形象的理解。我们将从七大方面进...

在构建 AI 应用时,一条生产级工作流往往是一条复杂的逻辑链:它可能始于 RAG 的知识检索,继而调用工具获取实时数据,再通过一或多个 LLM 节点进行推理,最终由代码节点整合输出。 这个过程很强大,但也让调试变得极具挑战。当最终结果未达预...

昨天 dify 正式发布了 1.5.0 版本,带来了一个非常贴心的更新:流程调试增强。对于日常用工作流做应用开发的人来说,这是一次真正的效率升级。 🧪 全新的调试能力:三大核心功能 Dify 1.5.0 的调试体验,主要体现在以下三点改进:...
最新评论