Ollama 为个人用户提供免费的网络搜索服务
- Ollama 推出了一款新的网络搜索 API,可用于构建搜索代理或与现有工具集成。
- 该API提供免费套餐,更高速率限制可通过Ollama云服务获得。
- Web搜索功能可增强模型,提供最新信息,减少幻觉并提高准确性。
- 提供了多种集成方式,包括Python和JavaScript库、MCP服务器以及CLI。
B站备受期待的文本转语音模型 IndexTTS2 刚刚开源,立刻在开发者社区中掀起了一阵波澜 🔊。现在大家最关心的问题是:它的实际效果是否能媲美官方演示那般惊艳?幸运的是,你现在就可以 前往GitHub查看源码并在Hugging Face上找到模型亲自测试一番 🔥。这一发布再次证明了大型科技公司正积极为开源世界贡献力量。🤔
谷歌的 NotebookLM 刚刚获得史诗级增强,摇身一变成了你的私人报告撰写助理 🔥。它现在能以超过 80种语言 生成结构化报告,并智能推荐格式,你甚至可以用详细提示词来微调语气和风格 (✧∀✧)。这意味着你可以告别繁琐的格式调整,专注于闪光的创意,快去 最新版NotebookLM了解详情吧!
OpenAI 再次向所有用户敞开怀抱,宣布 ChatGPT 的"项目”功能现已对免费用户全面开放,让每个人都能体验到更强大的工作流管理 🚀。此次更新还大幅提升了文件上传限额,并增加了颜色和图标等个性化选项,让你的工作空间更有条理。这波操作无疑是 AI 工具平民化的又一里程碑,快去官方公告 看看你的 ChatGPT 升级了没!
OpenAI 发布 GPT-realtime 语音模型,其自然流畅度和情感表达力达到新高度,能够精准模拟人类语音细节,包括语调、情感和语速。该模型具备语音对话和图像理解能力,能够处理复杂指令,并根据上下文实时调整语音风格。OpenAI 还新增了语音风格并优化了原有的语音效果。GPT-realtime 将颠覆客服、教育、金融和医疗等领域,推动语音助手向全功能智能伙伴转变,并为开发者开启语音 AI 应用开发的新纪元,标志着人机语音交互的重大变革。
谷歌Gemini放出大招,功能更新直指ChatGPT的王座!Google DeepMind掌门人Demis Hassabis转发了一则重磅消息,称Gemini迎来史诗级更新,不仅免费提供Pro计划,还上线了名为"Deep Think”的超强推理功能 🔥。这场AI巨头之间的"神仙打架”愈演愈烈,用户成了最大赢家 (✧∀✧)。快来看看Gemini的最新动态,体验这些ChatGPT都还没跟上的新特性吧!🚀
谷歌DeepMind团队秀出了他们的P图神器Gemini 2.5 Flash Image,外号"Nano Banana”,能把香蕉P成晚礼服,创意突破天际 🍌。这款模型具备原生的图像生成与编辑能力,支持多轮对话式修改,甚至能通过交错生成机制实现像素级P图,了解更多幕后团队,让P图体验像聊天一样流畅。其核心魅力在于将图像理解与生成紧密结合,正做到了"看懂再画”,为创意工作流带来了革命性的变化 💡。
OpenAI深夜放毒,正式发布了专为语音AI Agent设计的全新多模态模型GPT-Realtime,让你的AI助手听起来更像"人”了 (o´ω'o)ノ。这个模型不仅能模仿人类丰富的语调和情感,还能理解笑声等非语言信号,甚至支持图像输入,查看官方发布详情,实现了"眼见为实”的对话体验。伴随API的发布,音频输入token价格还降低了20%,OpenAI正在加速推动智能语音交互进入一个更自然、更智能的新纪元 🚀。
Nous Research 是一家低调的人工智能初创公司,近日推出了 Hermes4系列大型语言模型。该模型在数学基准测试中表现优异,引入“混合推理”模式,提供快速响应和深入思考选项。采用 DataForge 和 Atropos 进行训练,提升推理能力和数据生成效率。 Hermes 4 的发布代表了开放源代码 AI 的崛起,挑战大型科技公司,倡导用户透明和控制。
9月1日即将实施的《人工智能生成合成内容标识方法》国家标准GB45438-2025,强制要求所有AI生成内容必须进行明确标识。该标准涵盖显式和隐式两种标识方式。显式标识要求文本、图片、视频和音频内容分别在显著位置进行标注,确保用户可感知。隐式标识则要求在文件内部嵌入JSON格式的元数据,包含AI生成相关信息。责任主体不仅包括生成服务提供者,还包括内容传播平台。违规将面临限流、下架、法律风险等处罚。AI从业者需抓紧合规准备,建立完善标识体系,以应对此次行业变革。