6mo ago telegram
Apple Music 现在可以用 ChatGPT 创建自定义播放列表和查找歌曲。 Apple Music 的推荐算法一直是槽点,或许这次能靠 AI 翻身。
6mo ago telegram
刷到小米把 MiMo-V2-Flash 给开源了。 代码能力直接硬刚 Claude Sonnet 4.5,但推理成本只有人家的 2.5%。最离谱的是它的生成速度,每秒 150 个 token,我跑了一下确实快得像开了挂。 技术上: • MoE 架构:309B 的大块头,干活时 …
6mo ago telegram
看了下美团新开源的 LongCat,LongCat 这次用“跨块拼接”把 虚拟数字人 稳定性做到了 EvalTalker 榜一。 实测下来口型和表情确实没崩,多个人同框也不打架。底层是 13.6B 的 DiT,MIT 协议直接给商用,这点必须给大哥点赞。👍 #AI工作流 #独 …
6mo ago telegram
现在网页版 Gemini 可以直接创建 Opal ( 一句话构建 AI 工作流),可以理解成 Gem(智能体) 的加强版。 顺便提一句,我个人理解工作流和智能体的区别是,一个工作流可能是由多个智能体组合。
6mo ago telegram
Google 推出了一款叫做 CC 的助手。 它会在清晨自动整理你的邮件、日历与文档内容,并日程预览简报形式发到你的邮箱
6mo ago telegram
OpenAI 推出了 GPT Image 1.5 !!! 用了下,最让我“卧槽”的是它的文字渲染能力。以前生成的 Logo 全是火星文,现在让它写个 文字海报,连衬线体细节都给你对齐。所谓的“手术式编辑”也不赖,指哪改哪,光影居然没崩。而且 API 价格降了 20%。 虽然号 …
6mo ago telegram
被 Kling 2.6 的 Voice Control 惊艳到了。 Kling 这次直接把桌子掀了:原生音视频同步。 实测下来,直接输入 Prompt,视频生成的瞬间,声音、口型、甚至背景里的车流声(环境音)全都有了。这就好比给 AI 装了个外挂大脑,它终于知道“说话”不仅仅是 …
6mo ago telegram
阿里这个 Wan 2.6 有点东西 实测 Wan 2.6 文字生成一段袋鼠和熊猫拳击比赛的视频,音画完全同步,根本不需要后期再修,这点对我们这种“能不动手就不动手”的懒人太友好了。 而且它那个 1.3B 的轻量版,居然只要 8.19GB 显存就能跑。 不过也别高兴太早,目前 …
6mo ago telegram
在 即梦 上测了下字节刚发的 Seedance 1.5 Pro。 它最变态的地方不是画质,而是原生音画同步。不是那种生成的“哑巴视频”再后期贴个 BGM,而是视频里的角色张嘴说话时,口型、表情和声音是完全咬合的,连环境音都有空间感。 实测下来,比我现在工作流里“Runway …
6mo ago telegram
ChatGPT App也支持“分支对话”功能了