动态 | Yi

17d ago telegram

本地部署2B模型，让“龙虾”看懂视频 Marlin-2B 开源了，基于Qwen3.5-2B微调，Mac M1 16GB就能跑。这是一个视频理解模型，能理解视频里发生了什么，什么时候发生的。输入一段视频，输出带秒级时间戳的结构化描述。也能用自然语言定位片段，搜"有人推门进 …

17d ago telegram

Gemini支持采集自己的头像和声音了采集后，在提示词中＠me 调用，然后能生成自己的图片（nanobanana模型）或视频（omni模型）

17d ago telegram

我又发现了一个"龙虾"，有客户端易上手 OpenHuman，内置云端模型Chat V1（像是微调的开源模型），订阅费为20刀/月或者填入自己的AI API。亮点是能一键登录接入常见的应用，例如Gmail、GitHub、Slack、Notion、Stripe、Jira……点一 …

17d ago telegram

巨好笑，railway作为一个B轮融资的公司，因为Google cloud封了他们的账号，导致所有服务宕机。果然世界是个“草台班子”，但往往成功的产品又是“先射击再瞄准”

17d ago telegram

Antigravity进化了，从 IDE 变成开发平台了 Antigravity 2.0 独立桌面应用，agent-first 设计，多 agent 并行，定时任务，语音输入。有一说一，真的很像Codex的界面。还新出 Antigravity CLI，终端输入agy启动，不 …

17d ago telegram

Google AI Studio推出安卓版了手机上vibe coding写提示词能直接生成原生安卓 app，内置模拟器预览，不用装 SDK。前两个 app 免费部署到 Google Cloud，不用绑卡。

17d ago telegram

Google I/O 熬夜看完了，信息量很大，我挑了三个重点 Google上线了Gemini 3.5 Flash，编码和 agent 能力超过 3.1 Pro，Pro 版下月来。亮点是智能体能力史诗级增强，能执行操作，不只是聊天。 Gemini Spark 是新产品，像素级对 …

18d ago telegram

Gemini更新了电脑和手机端的界面，新UI还挺好看的，很有科技感

18d ago telegram

目前最接近opus 4.7的编程模型，价格仅是十分之一 cursor推出了Composer 2.5，这是一个cursor专属的编程模型，没有API，不支持第三方接入。价格方面，输入为$0.50/M，输出为$2.50/M。底座来源于Kimi开源的K2.5，在cursor自己的 …

18d ago telegram

你敢信？这是只有3B参数模型的效果字节放出了一个多模态模型Lance，一张40GB显存的显卡能跑，自己在家就能本地部署，AI视频行业的门槛再次被拉低。 Lance在视频图片理解、视频图片编辑、多轮编辑一致性上表现极佳，跑分多个榜单统一模型第一。 📦 …