8mo ago telegram
OpenAI 正在测试 ChatGPT 原生的用户间通讯功能,将对话 AI 变为多人协作平台 1️⃣ 功能概览:Android 最新测试版 (v1.2025.273) 中出现代号为 Calpico 的新功能,支持用户间直接消息 (DM) 与群聊,并可邀请 AI 共同参与讨论。 …
8mo ago telegram
微软发布首款自研文生图模型 MAI-Image-1,目标是为创作者提供快速、逼真的视觉生成 1️⃣ 性能不俗:首次亮相 LMArena 文生图排行榜即进入前十,在光影效果与自然景观渲染方面表现突出。 2️⃣ 低延迟交互:优化了生成流程,响应速度快,支持实时交互与快速修改。 …
8mo ago telegram
Gemini AI 正在逐步取代 Google Maps 助手,为地图带来更自然的语音交互体验 1️⃣ 导航进化:驾驶时能用更自然的口语指令,如“帮我避开收费站”,或询问“沿途有什么值得看的历史景点”,AI 能在不干扰驾驶的情况下理解情境并回应。 2️⃣ 复杂场景搜索:主页将 …
8mo ago telegram
Google Gemini 3.0 Pro 即将发布,采用 MoE 架构 MoE 架构与动态专家路由:如同一个智能团队,针对不同任务实时组合最合适的专家,总参数达数万亿,但单次查询只激活约 150-200 亿,兼顾效率与成本。 上下文窗口大幅扩展:从 2.5 的 100 …
8mo ago telegram
免费创建音画同步的“数字演员” GAGA-1 是首款将声音、嘴型与表情一次性生成的 AI 视频模型,解决了传统 AI 视频口型与情绪脱节的问题。 1️⃣ 音画同步生成 模型采用 co-generation 架构,类似人类一次性完成说话与表情,声音波形与面部动作同步输出,无需后 …
8mo ago telegram
如何低成本搭建自己的多模态数字人 OpenAvatarChat 是一个模块化的开源对话系统,提供了一套灵活高效的解决方案。 它的核心设计就像搭积木,用户可以按需组合语音识别 (ASR)、大语言模型 (LLM)、语音合成 (TTS) 和数字人渲染 (Avatar) 等模块。 …
8mo ago telegram
Affinity Photo 新增机器学习功能,永久免费使用AI。该功能支持本地化处理,无需联网,确保数据隐私,用于提升图像主体与对象的选择精度和速度。 对象选择工具 (Object Selection Tool): 基于分割模型,自动识别并选择图像中的人物、动物、建筑等对象。 …
8mo ago telegram
用自然语言构建 AI 小程序,Google 的 Opal 把你的想法直接变成 Web 应用。 Opal 是 Google Labs 的 “vibe-coding” 实验项目,通过对话描述功能,即可生成可视化工作流,降低了 AI 应用开发门槛。 最近刚完成一轮重要更新: 1️⃣ …
8mo ago telegram
用 AI 自动操作浏览器:Gemini 2.5 Computer Use Google 发布了 Gemini 2.5 Computer Use 模型,能像人一样“看”并操作浏览器界面,通过点击、输入、滚动等实现复杂自动化任务。它不再依赖传统 API,直接从屏幕截图理解并执行操 …
8mo ago telegram
OpenAI AgentKit:拖拽或代码轻松搭建AI Agent OpenAI 发布 AgentKit,一套端到端工具,简化了AI Agent的开发。无论新手或开发者,都能用低成本方式快速创建自动化AI工作流。 🔹 Agent Builder 可视化拖拽,快速设计多步代理流 …