动态 | Yi

7mo ago telegram

让静态图片“演”起来字节的即梦数字人工具更新了 OmniHuman 1.5 模型，只需一张图+一段音频，就能生成带表演情绪的动态视频。它不再是简单的对口型： 1️⃣ 理解语义：根据音频情绪自动调整表情和演技。 2️⃣ 多人群戏：自动识别多人，安排互动表演。 3️⃣ …

8mo ago telegram

在消费级 GPU 上跑 4K AI 视频 Lightricks 新发布的 LTX-2 是首个完整的开源 AI 视频基础模型，实现了音视频同步生成。 1️⃣ 音视频原生同步：模型一次性处理画面、对话和音效，无需后期手动对齐，解决一大痛点。 2️⃣ 性能与速度：支持原生 4K / …

8mo ago telegram

让 AI 智能体为你自动处理链上支付 Coinbase 新推出的 Payments MCP，让 AI 能像人一样管理和使用加密货币，开启“智能体商务”。它基于 x402 开放协议，激活了沉睡的 HTTP 402 (Payment Required) 状态码。 …

8mo ago telegram

免费生成精准口型同步的数字人视频商汤 Sekotalk 只需音频即可驱动，降低了视频制作门槛。 🔹 精准口型：支持从正常语速到说唱、京剧等风格。 🔹 多人互动：支持多人在同一画面中对话，适合播客或短剧场景。 🔹 风格泛化：可用于真实照片、动画、素描等不同视觉风格。 🔹 长视 …

8mo ago telegram

AI 视频进入 5 分钟时代清华系 Vidu Q2 版已全球上线，重点解决一致性与时长问题，成本也维持在低位。 1️⃣ 多主体一致性：核心的“参考生视频”功能支持最多 7 个主体，实测中角色与场景一致性优于 Sora 2。 2️⃣ 视频延长：免费版可达 30 秒， …

8mo ago telegram

OpenAI 发布 Atlas，Perplexity Comet 转向免费，加上 Google Chrome 已集成的 Gemini，AI 浏览器竞争进入白热化。 🔹 OpenAI Atlas 深度整合 ChatGPT，侧边栏可直接对话。核心是 "Agent Mode" (代理 …

8mo ago telegram

Claude 桌面版正式上线：让 AI 成为系统级助手它将 Claude 从浏览器标签页解放出来，通过系统级快捷键、截图与语音随时调用，支持 Mac 与 Windows。 1️⃣ 全局唤醒: Mac 上双击 Option 即可从任何 App 调出输入框，无需切换上下文。 …

8mo ago telegram

Windows 11 Copilot 即将获得“Copilot Actions”更新，从聊天助手进化为能实际操作你 PC 的 AI 代理。它不再只是聊天，更像一个能帮你“点击、打字、滚动”的数字协作者。 1️⃣ 本地任务：可批量修图、删除重复文件、从 PDF 提取信息，或 …

8mo ago telegram

Anthropic 的 Claude Code 已扩展至 Web 和 iOS 平台，打通了从终端到移动端的工作流。 1️⃣ Web 端：支持并行执行多个编码会话（如 Bug 修复、常规更新），并可在执行中途调整指令，无需重启。深度集成 GitHub，能自动生成分支和 Pull …

8mo ago telegram

NoF1 举办的 Alpha Arena 真实资金大赛中，开源模型 DeepSeek V3.1 目前以 37% 收益领跑，显著超越 GPT-5 与 Gemini。 1️⃣ 赛况：6 个主流 AI (包括 Grok 4, Claude 4.5 等) 各获 1 万美元真实资金， …