动态 | Yi

8mo ago telegram

OpenAI 正在测试 ChatGPT 原生的用户间通讯功能，将对话 AI 变为多人协作平台 1️⃣ 功能概览：Android 最新测试版 (v1.2025.273) 中出现代号为 Calpico 的新功能，支持用户间直接消息 (DM) 与群聊，并可邀请 AI 共同参与讨论。 …

8mo ago telegram

微软发布首款自研文生图模型 MAI-Image-1，目标是为创作者提供快速、逼真的视觉生成 1️⃣ 性能不俗：首次亮相 LMArena 文生图排行榜即进入前十，在光影效果与自然景观渲染方面表现突出。 2️⃣ 低延迟交互：优化了生成流程，响应速度快，支持实时交互与快速修改。 …

8mo ago telegram

Gemini AI 正在逐步取代 Google Maps 助手，为地图带来更自然的语音交互体验 1️⃣ 导航进化：驾驶时能用更自然的口语指令，如“帮我避开收费站”，或询问“沿途有什么值得看的历史景点”，AI 能在不干扰驾驶的情况下理解情境并回应。 2️⃣ 复杂场景搜索：主页将 …

8mo ago telegram

Google Gemini 3.0 Pro 即将发布，采用 MoE 架构 MoE 架构与动态专家路由：如同一个智能团队，针对不同任务实时组合最合适的专家，总参数达数万亿，但单次查询只激活约 150-200 亿，兼顾效率与成本。上下文窗口大幅扩展：从 2.5 的 100 …

8mo ago telegram

免费创建音画同步的“数字演员” GAGA-1 是首款将声音、嘴型与表情一次性生成的 AI 视频模型，解决了传统 AI 视频口型与情绪脱节的问题。 1️⃣ 音画同步生成模型采用 co-generation 架构，类似人类一次性完成说话与表情，声音波形与面部动作同步输出，无需后 …

8mo ago telegram

如何低成本搭建自己的多模态数字人 OpenAvatarChat 是一个模块化的开源对话系统，提供了一套灵活高效的解决方案。它的核心设计就像搭积木，用户可以按需组合语音识别 (ASR)、大语言模型 (LLM)、语音合成 (TTS) 和数字人渲染 (Avatar) 等模块。 …

8mo ago telegram

Affinity Photo 新增机器学习功能，永久免费使用AI。该功能支持本地化处理，无需联网，确保数据隐私，用于提升图像主体与对象的选择精度和速度。对象选择工具 (Object Selection Tool): 基于分割模型，自动识别并选择图像中的人物、动物、建筑等对象。 …

8mo ago telegram

用自然语言构建 AI 小程序，Google 的 Opal 把你的想法直接变成 Web 应用。 Opal 是 Google Labs 的 “vibe-coding” 实验项目，通过对话描述功能，即可生成可视化工作流，降低了 AI 应用开发门槛。最近刚完成一轮重要更新： 1️⃣ …

8mo ago telegram

用 AI 自动操作浏览器：Gemini 2.5 Computer Use Google 发布了 Gemini 2.5 Computer Use 模型，能像人一样“看”并操作浏览器界面，通过点击、输入、滚动等实现复杂自动化任务。它不再依赖传统 API，直接从屏幕截图理解并执行操 …

8mo ago telegram

OpenAI AgentKit：拖拽或代码轻松搭建AI Agent OpenAI 发布 AgentKit，一套端到端工具，简化了AI Agent的开发。无论新手或开发者，都能用低成本方式快速创建自动化AI工作流。 🔹 Agent Builder 可视化拖拽，快速设计多步代理流 …