艾智迹 AGIDT
AGI时代的记录者、连接者与推动者
302025-06

Black Forest 震撼开源 FLUX.1Kontext [dev]:媲美 GPT-4o 的图像编辑

Black Forest Labs 正式宣布,其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源,这一模型作为 FLUX.1 系列的最新成员,以其强大的图像编辑能力和高效性能被誉为可媲美 GPT-4o 的开源替代方案。FLUX.1Kontext [dev] 基于 12 亿参数的流匹配变换器架构,专为图像编辑任务设计,支持消费级硬件运行,为创作者、开发者和研究人员提供了前所未有的灵活性。地址

OpenAI 发布 Deep Research API 新模型:o3/o4-mini-deep research

OpenAI 推出两款 Deep Research API 新模型 o3-deep-research 和 o4-mini-deep-research,专为高阶分析和深度信息合成设计,支持自动化网页搜索、数据分析、代码执行等功能。定价方面,o3 模型每 1000 次调用价格为 10 至 40 美元,o4-mini 价格更低,为 2 至 8 美元。

谷歌开源 Gemma3n 多模态模型,手机也能跑出云端 AI 性能

谷歌发布并开源端侧多模态大模型 Gemma3n,为手机、平板、笔记本等端侧设备带来强大多模态功能。提供 E2B 和 E4B 两个版本,原始参数量分别为 5B 和 8B,但内存占用仅相当于传统 2B 和 4B 模型,分别只需 2GB 和 3GB 内存即可运行。原生支持图像、音频、视频和文本的多模态输入处理,支持 140 种文本语言和 35 种语言的多模态理解。地址

Anthropic 推出新功能,用户可直接在 Claude 中构建 AI 应用

Anthropic 近日宣布推出名为「Artifacts」的新功能,允许用户创建个性化的应用程序。用户可以通过简单的对话进行创作,而无需任何编程知识。这一功能的推出标志着 Anthropic 在人工智能应用开发领域迈出了重要一步。

242025-06

MiniMax 发布视频 Agent 工具,一句话生成高清视频

MiniMax 最近推出的视频 Agent 工具为用户提供了一种新的方式来生成高质量的视频内容,特别适用于广告、教育、社交媒体等领域的创作需求。通过文本到视频生成和人脸图片驱动等技术,MiniMax 不仅大大降低了视频创作的门槛,还使得视频内容的个性化和精准度得到了显著提升。地址

腾讯 AI Lab 开源音乐生成大模型 SongGeneration

腾讯 AI Lab 推出并开源 SongGeneration 音乐生成大模型,专注解决音乐 AIGC 中音质、音乐性与生成速度这三大共性难题,基于 LLM-DiT 的融合架构,模型在保持生成速度的同时,显著提升了音质表现,生成歌曲的准确度相较部分商业闭源模型表现出相当甚至更优的质量,同时在整体表现、旋律、伴奏、音质与结构等维度也优于现有多数开源模型。此外,SongGeneration 模型还支持文本控制、多轨合成与风格跟随等功能,既满足面向 C 端创作者的可玩性,又兼具 B 端的稳定性与拓展性,构建出面向未来的音乐 AI 生产力工具。地址

 ChatGPT 新笔记工具发布:隐形记录,智能整理会议精华

ChatGPT 近日公布了一项备受期待的新功能「笔记工具」,专为会议记录、头脑风暴和个人笔记管理设计。这一功能目前仅在 ChatGPT 的 macOS 桌面应用程序中可用,为用户提供了一种高效、无缝的信息整理方式。ChatGPT 的新笔记工具主打「隐形」记录体验,用户只需在 macOS 桌面应用中点击聊天窗口右侧的圆形图标,即可启动录音模式。工具会在后台自动转录会议或讲座的音频内容,并实时分析提取关键信息,生成结构化的笔记。

MiniMax Voice Design 上线,语音合成迎来个性化定制新时代

稀宇科技(MiniMax)近期在语音合成技术领域取得了显著成就,其 Speech-02 模型在 Artificial Analysis 排行榜上稳居榜首,彰显了公司的全球领先地位。更令人兴奋的是,该公司正式推出了 Voice Design 音色设计功能,这一创新技术允许用户通过自然语言描述来定制个性化音色,实现了语言、口音与音色的全方位自定义。地址

火山引擎推出基于方舟大模型「AI 智能推荐域名」功能

火山引擎推出基于方舟大模型的 AI 智能域名推荐服务,通过自然语言处理和语义解析技术帮助企业生成高关联性域名组合,并优化注册流程。同时,联动豆包 AI 助手提供关键词推荐,简化操作。此外,还推出 1 元域名注册 / 转入特惠活动,降低企业成本。地址

Firecrawl 即将推出 Fireplexity,打造开源 Perplexity 克隆版

在 AI 搜索引擎领域,Firecrawl 正以迅猛之势掀起新波澜。根据最新社交媒体动态,Firecrawl 宣布将于下周正式推出 Fireplexity,一款定位为开源的 Perplexity 克隆版,旨在为开发者提供强大的 AI 驱动问答引擎,挑战现有 AI 搜索工具的格局。Fireplexity 被描述为一个完全开源的 AI 问答引擎,核心功能与 Perplexity 类似,能够通过 AI 技术为用户提供精准、带来源引用的答案。

AGIDT.COM | 追踪AGI进展 见证智能飞跃

一个AGI观察者、传播者、连接者和推动者的复合体

AI开源TOP项目AI资源地图

登录

找回密码

注册