6mo ago
telegram
韩国这波 AI 反击有点意思,519B 参数却只用 33B 的算力?
刚发布的 SKT A.X K1,主打一个“大脑子小身板”。
技术很“鸡贼”:用了 MoE(混合专家)架构。这好比公司有 500 个顾问,但每次开会只拉最懂行的 30 个人进场。
韩语语境确实强:用它润色出 …
6mo ago
telegram
如果你跟我一样受够了本地生图的高「废片率」,阶跃星辰刚发的 NextStep-1.1 值得你今晚花点时间研究。
15B 参数的纯自回归模型,不仅开源,还把上一代的稳定性大坑填上了。
实测感受:
1️⃣ 填坑很及时:8 月份试 NextStep-1 时,虽然架构新,但偶尔会崩 …
6mo ago
telegram
实测快手的 CyberCut,它把“手搓剪辑”变成了“流水线生产”,帮我解决了长视频变现的痛点。
1️⃣ 智能切片:以前我剪播客切片要搞一天,现在扔进直播回放,AI 自动抓取高光时刻。最惊喜的是 Auto-Reframing,横屏转 9:16 时人物自动居中,不用我一帧帧调位 …
6mo ago
telegram
再也不用对着黑底白字的命令行猜 Agent 在干嘛了。
智谱刚发的 Z Code,把“盲盒式”开发变成了可视化桌面,这周帮我抢回了不少改 Bug 的时间。
1️⃣ 所见即所得的操作流:以前用 Agent 工具总得在终端里敲半天,Z Code 直接把浏览器、文件和对话整合了。昨 …
6mo ago
telegram
本地跑小模型终于不再是“人工智障”了。
Liquid AI 刚出的 LFM2-2.6B-Exp,是我这周在旧款 Mac 上跑得最顺的“口袋大脑”,断网也能飞起。
1️⃣ 路子很野的“纯强化学习”
这模型完全跳过了 SFT(监督微调),直接用 Pure RL 训练。我实测下来, …
6mo ago
telegram
BrowserUse 刚出的 BU-30B-A3B-Preview,专门解决我们做网页自动化「既要聪明又要快」的痛点。
它就像个懂浏览器的特种兵:
1️⃣ 大模型智商,小模型身板
它是 MoE 架构,虽然总参数 30B,但推理时只激活 3B。这意味着你在单张消费级 GPU 上 …
6mo ago
telegram
离谱了,1min.AI 推出了终身订阅, 99 美元买断就能集齐 GPT-5、Claude、Midjourney 这些顶流模型。
但它本质上就是个 API 聚合商(Wrapper),最大的风险就是不仅要看上游脸色(API 涨价/政策变动),还得赌这公司能活多久, …
6mo ago
telegram
一张图+一段音频搞定全套数字人。
快手可灵 KlingAvatar 2.0 更新了,不仅是“对口型”,现在连肢体动作和微表情都能根据语气自动演,解决了只动嘴不走心的痛点。
这两天就在用它跑几个 Demo,这几点感知很明显:
1️⃣ 懂戏的“AI 导演”:以前的数字人像木头, …
6mo ago
telegram
Suno 推出了新版 Persona ,虚拟偶像 IP 终于能落地了。
这次更新把「人声」变成了独立资产,不用再担心换个曲风歌手就直接“变声”。
1️⃣ 人声彻底解耦:简单说就是把嗓音指纹单独提取出来。比如想把爵士女声转去做摇滚,声音总会变味,更新后把 R&B 男声扔进重金属 …
6mo ago
telegram
Google 新发了 MedASR 模型,手里的医疗听写项目终于不用硬磕 Whisper 了。
专门死磕医疗术语的 105M 小模型,本地跑得飞快。
1️⃣ 实测对比:以前用 Whisper v3 转录英文问诊,遇到“Hydrochlorothiazide”这种生僻药名经常乱 …