6mo ago
telegram
日本Rakuten集团推出了 Rakuten AI 3.0 ,这个日本本土化模型 70B 参数,主打一个「懂行」且「便宜」。
1️⃣ 懂“味”:把一封很含蓄的日语邮件扔进去,它解读出的潜台词比 GPT 更有“人味”。
MoE 架构(类似大脑分区处理)配合本土数据,在处理敬语和 …
6mo ago
telegram
🎄 谷歌这波「25天 AI Agent 特训」有点东西。
每天 5 分钟,从写第一行 YAML 到部署生产级 Agent,这是目前最丝滑的「实战路书」。
我跟着跑了一下,几个感触很深的点:
1️⃣ 门槛极低:Day 2 我只写了个配置文件(YAML),一行 Python 没 …
6mo ago
telegram
现在Gemini网页版创建Gems支持将NotebookLM设置成知识库了
6mo ago
telegram
Meta 刚发的 SAM Audio 这个多模态分离模型。
解决了我这种内容创作者最头疼的问题:在吵闹的街边拍Vlog,也能一键精准抠出人声,甚至能靠点选视频画面来分离声音。
1️⃣ 用眼睛「听」声音:它有个 PE-AV 感知编码器(像人的耳目协同)。我在视频里点一下吉他手, …
6mo ago
telegram
以前总觉得“Flash”就是“降智版”,但这次真被打脸。Gemini 3 Flash 实测下来,丢给它一坨屎山代码,218 tokens/s 的速度简直是在屏幕上飞。
最离谱的是在 SWE-bench 拿了 78%,写代码居然比自家 Pro 还强。
不过有一说一, …
6mo ago
telegram
OpenAI 的 Realtime API 贵到让我肉疼,xAI在语音AI领域推出了Grok Voice Agent API。
价格杀疯了,每分钟 $0.05,相比 OpenAI 的 ~$1,这简直是做慈善,直接便宜了 20 倍。实测下来,延迟低得吓人,而且因为它能实时扒 X …
6mo ago
telegram
YouTube 竟然整出了个 Playables Builder ( AI 游戏开发)。
底层是 Google 最新的 Gemini 3 Pro,这玩意儿离谱到什么程度?你给它一段话、几张图,甚至直接喂一段视频,它就能给你吐出一个能玩的交互游戏原型。
• 成本低得吓人: …
6mo ago
telegram
Apple Music 现在可以用 ChatGPT 创建自定义播放列表和查找歌曲。
Apple Music 的推荐算法一直是槽点,或许这次能靠 AI 翻身。
6mo ago
telegram
刷到小米把 MiMo-V2-Flash 给开源了。
代码能力直接硬刚 Claude Sonnet 4.5,但推理成本只有人家的 2.5%。最离谱的是它的生成速度,每秒 150 个 token,我跑了一下确实快得像开了挂。
技术上:
• MoE 架构:309B 的大块头,干活时 …
6mo ago
telegram
看了下美团新开源的 LongCat,LongCat 这次用“跨块拼接”把 虚拟数字人 稳定性做到了 EvalTalker 榜一。
实测下来口型和表情确实没崩,多个人同框也不打架。底层是 13.6B 的 DiT,MIT 协议直接给商用,这点必须给大哥点赞。👍
#AI工作流 #独 …