7mo ago telegram
让静态图片“演”起来 字节的 即梦数字人 工具更新了 OmniHuman 1.5 模型,只需一张图+一段音频,就能生成带表演情绪的动态视频。 它不再是简单的对口型: 1️⃣ 理解语义:根据音频情绪自动调整表情和演技。 2️⃣ 多人群戏:自动识别多人,安排互动表演。 3️⃣ …
8mo ago telegram
在消费级 GPU 上跑 4K AI 视频 Lightricks 新发布的 LTX-2 是首个完整的开源 AI 视频基础模型,实现了音视频同步生成。 1️⃣ 音视频原生同步:模型一次性处理画面、对话和音效,无需后期手动对齐,解决一大痛点。 2️⃣ 性能与速度:支持原生 4K / …
8mo ago telegram
让 AI 智能体为你自动处理链上支付 Coinbase 新推出的 Payments MCP,让 AI 能像人一样管理和使用加密货币,开启“智能体商务”。 它基于 x402 开放协议,激活了沉睡的 HTTP 402 (Payment Required) 状态码。 …
8mo ago telegram
免费生成精准口型同步的数字人视频 商汤 Sekotalk 只需音频即可驱动,降低了视频制作门槛。 🔹 精准口型:支持从正常语速到说唱、京剧等风格。 🔹 多人互动:支持多人在同一画面中对话,适合播客或短剧场景。 🔹 风格泛化:可用于真实照片、动画、素描等不同视觉风格。 🔹 长视 …
8mo ago telegram
AI 视频进入 5 分钟时代 清华系 Vidu Q2 版已全球上线,重点解决一致性与时长问题,成本也维持在低位。 1️⃣ 多主体一致性:核心的“参考生视频”功能支持最多 7 个主体,实测中角色与场景一致性优于 Sora 2。 2️⃣ 视频延长:免费版可达 30 秒, …
8mo ago telegram
OpenAI 发布 Atlas,Perplexity Comet 转向免费,加上 Google Chrome 已集成的 Gemini,AI 浏览器竞争进入白热化。 🔹 OpenAI Atlas 深度整合 ChatGPT,侧边栏可直接对话。核心是 "Agent Mode" (代理 …
8mo ago telegram
Claude 桌面版正式上线:让 AI 成为系统级助手 它将 Claude 从浏览器标签页解放出来,通过系统级快捷键、截图与语音随时调用,支持 Mac 与 Windows。 1️⃣ 全局唤醒: Mac 上双击 Option 即可从任何 App 调出输入框,无需切换上下文。 …
8mo ago telegram
Windows 11 Copilot 即将获得“Copilot Actions”更新,从聊天助手进化为能实际操作你 PC 的 AI 代理。 它不再只是聊天,更像一个能帮你“点击、打字、滚动”的数字协作者。 1️⃣ 本地任务: 可批量修图、删除重复文件、从 PDF 提取信息,或 …
8mo ago telegram
Anthropic 的 Claude Code 已扩展至 Web 和 iOS 平台,打通了从终端到移动端的工作流。 1️⃣ Web 端:支持并行执行多个编码会话(如 Bug 修复、常规更新),并可在执行中途调整指令,无需重启。深度集成 GitHub,能自动生成分支和 Pull …
8mo ago telegram
NoF1 举办的 Alpha Arena 真实资金大赛中,开源模型 DeepSeek V3.1 目前以 37% 收益领跑,显著超越 GPT-5 与 Gemini。 1️⃣ 赛况:6 个主流 AI (包括 Grok 4, Claude 4.5 等) 各获 1 万美元真实资金, …