Yi

6mo ago telegram

韩国这波 AI 反击有点意思，519B 参数却只用 33B 的算力？刚发布的 SKT A.X K1，主打一个“大脑子小身板”。技术很“鸡贼”：用了 MoE（混合专家）架构。这好比公司有 500 个顾问，但每次开会只拉最懂行的 30 个人进场。韩语语境确实强：用它润色出 …

6mo ago telegram

如果你跟我一样受够了本地生图的高「废片率」，阶跃星辰刚发的 NextStep-1.1 值得你今晚花点时间研究。 15B 参数的纯自回归模型，不仅开源，还把上一代的稳定性大坑填上了。实测感受： 1️⃣ 填坑很及时：8 月份试 NextStep-1 时，虽然架构新，但偶尔会崩 …

6mo ago telegram

实测快手的 CyberCut，它把“手搓剪辑”变成了“流水线生产”，帮我解决了长视频变现的痛点。 1️⃣ 智能切片：以前我剪播客切片要搞一天，现在扔进直播回放，AI 自动抓取高光时刻。最惊喜的是 Auto-Reframing，横屏转 9:16 时人物自动居中，不用我一帧帧调位 …

6mo ago telegram

再也不用对着黑底白字的命令行猜 Agent 在干嘛了。智谱刚发的 Z Code，把“盲盒式”开发变成了可视化桌面，这周帮我抢回了不少改 Bug 的时间。 1️⃣ 所见即所得的操作流：以前用 Agent 工具总得在终端里敲半天，Z Code 直接把浏览器、文件和对话整合了。昨 …

6mo ago telegram

本地跑小模型终于不再是“人工智障”了。 Liquid AI 刚出的 LFM2-2.6B-Exp，是我这周在旧款 Mac 上跑得最顺的“口袋大脑”，断网也能飞起。 1️⃣ 路子很野的“纯强化学习” 这模型完全跳过了 SFT（监督微调），直接用 Pure RL 训练。我实测下来， …

6mo ago telegram

BrowserUse 刚出的 BU-30B-A3B-Preview，专门解决我们做网页自动化「既要聪明又要快」的痛点。它就像个懂浏览器的特种兵： 1️⃣ 大模型智商，小模型身板它是 MoE 架构，虽然总参数 30B，但推理时只激活 3B。这意味着你在单张消费级 GPU 上 …

6mo ago telegram

离谱了，1min.AI 推出了终身订阅， 99 美元买断就能集齐 GPT-5、Claude、Midjourney 这些顶流模型。但它本质上就是个 API 聚合商（Wrapper），最大的风险就是不仅要看上游脸色（API 涨价/政策变动），还得赌这公司能活多久， …

6mo ago telegram

一张图+一段音频搞定全套数字人。快手可灵 KlingAvatar 2.0 更新了，不仅是“对口型”，现在连肢体动作和微表情都能根据语气自动演，解决了只动嘴不走心的痛点。这两天就在用它跑几个 Demo，这几点感知很明显： 1️⃣ 懂戏的“AI 导演”：以前的数字人像木头， …

6mo ago telegram

Suno 推出了新版 Persona ，虚拟偶像 IP 终于能落地了。这次更新把「人声」变成了独立资产，不用再担心换个曲风歌手就直接“变声”。 1️⃣ 人声彻底解耦：简单说就是把嗓音指纹单独提取出来。比如想把爵士女声转去做摇滚，声音总会变味，更新后把 R&B 男声扔进重金属 …

6mo ago telegram

Google 新发了 MedASR 模型，手里的医疗听写项目终于不用硬磕 Whisper 了。专门死磕医疗术语的 105M 小模型，本地跑得飞快。 1️⃣ 实测对比：以前用 Whisper v3 转录英文问诊，遇到“Hydrochlorothiazide”这种生僻药名经常乱 …