艾智迹 AGIDT
AGI时代的记录者、连接者与推动者
192025-07

12306MCP Server 开源上线,革新火车票实时查询

开发者 drfccv 推出 12306MCP Server,基于 Model Context Protocol 标准构建,支持实时查询余票、列车时刻、车站信息和中转方案。系统采用 FastAPI 架构,实现秒级响应,借助 Streamable HTTP 协议高效传输数据。提供智能时间工具,兼容 MCP2025-03-26 标准。来源

istral AI 推出新功能 Le Chat,全面追赶 ChatGPT

Mistral AI 的 Le Chat 新功能包括深度研究模式、语音交互和高级图像编辑,旨在提升用户体验并挑战 OpenAI 的 ChatGPT。其语音识别基于 Voxtral 模型,具备自然、低延迟的特性,而图像编辑功能在实际使用中表现出色。

月之暗面 Kimi 开放平台上线 Kimi Playground

Kimi Playground 的发布标志着 AI 技术从对话助手向智能助理的转变,其工具调用功能使 AI 能够主动解决问题。平台为开发者提供了一站式工具调用体验,支持多种工具接入和调试,提升了开发效率。来源

Suno v4.5+ 上线:人声替换与伴奏生成功能升级

Suno 推出 AI 音乐生成模型 v4.5+ 版本。新增 Add Vocals 功能,用户上传伴奏输入歌词替换原唱音轨;Add Instrumentals 功能上传人声生成伴奏;Inspire 功能分析播放列表创作新歌。简化音乐创作流程,快速产出高品质 demo。仅限 Pro 和 Premier 付费用户使用,免费用户保留 v4.0 或 v3.5 模型访问。

LTX-Video 13B 开源发布,30 倍速高清视频轻松生成

Lightricks 推出开源视频生成模型 LTX-Video 13B。该模型应用多尺度渲染技术,快速构建低分辨率框架再细化细节,生成速度提升 30 倍,支持 RTX 4090 消费级 GPU 运行。开发者输入文本提示控制动作和场景,实现视频延展至60秒及一键风格替换。模型开源免费,提供 GitHub 和 Hugging Face 获取渠道,附带 LTX-Video Trainer 工具微调定制。来源

Mac 版 ChatGPT 上线录音功能,提升会议效率

OpenAI 为 ChatGPT Plus 用户推出 Mac 版录音功能。用户点击应用聊天窗口的录音按钮,可录制麦克风和系统音频长达 120 分钟。音频自动上传至服务器,生成详细转录文本,包括完整对话、关键点总结和行动项清单。原始音频转录后立即删除,确保隐私安全;目前仅 Mac 用户可用,Windows 等其他平台用户需等待。

152025-07

PixVerse 上线多关键帧生成功能,7 图生成连贯视频

PixVerse(拍我 AI)在首尾帧模块中新增「多关键帧生成」功能,标志着 AI 视频创作迈入故事性表达的新阶段。用户可通过上传最多 7 张图片作为关键帧,AI 自动解析帧间语义关系,构建流畅的动作与场景转换路径,适用于短剧分镜、产品演示等场景。

影视级 TTS 神器来了!开源 IndexTTS 实现零样本语音合成

IndexTTS 推出轻量实时文本转语音模型。支持英语和中文,它用了先进的自回归架构,结合了文本到语义、语义到梅尔频谱、声码器这些核心模块,还跟大语言模型深度融合,生成的语音自然又稳定。开源代码登陆 GitHub。运行快速推理,提升生成效率。来源

重磅发布!月之暗面推出万亿参数开源大模型 Kimi K2

月之暗面推出的 Kimi K2 大语言模型在参数规模和智能体能力上表现出色,采用混合专家架构并拥有强大的自主调用工具和执行代码能力,同时通过开源策略推动了多场景应用的发展,显示出其在通用智能领域的竞争力。

通义千问 Qwen Chat 桌面版上线,一键 MCP 助力高效创作

通义千问 Qwen Chat 推出桌面客户端,用户一键唤起 MCP 功能。支持写文案、生成图像、开发网页等任务。界面升级简化操作,无缝衔接办公流程。访问官网还能轻松查看相关的论文、技术博客和模型 API,想深入研究 AI 的朋友,这下资料不用愁了。

AGIDT.COM | 追踪AGI进展 见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AI开源TOP项目AI资源地图

登录

找回密码

注册