动态
浩伊的最新动态,聚焦 AI 生产力工具、Claude、ChatGPT、AI Agent、RAG 知识库、AI 自动化与独立开发。
17d ago
telegram
本地部署2B模型,让“龙虾”看懂视频
Marlin-2B 开源了,基于Qwen3.5-2B微调,Mac M1 16GB就能跑。
这是一个视频理解模型,能理解视频里发生了什么,什么时候发生的。
输入一段视频,输出带秒级时间戳的结构化描述。也能用自然语言定位片段,搜"有人推门进 …
17d ago
telegram
Gemini支持采集自己的头像和声音了
采集后,在提示词中 @me 调用,然后能生成自己的图片(nanobanana模型)或视频(omni模型)
17d ago
telegram
我又发现了一个"龙虾",有客户端易上手
OpenHuman,内置云端模型Chat V1(像是微调的开源模型),订阅费为20刀/月或者填入自己的AI API。
亮点是能一键登录接入常见的应用,例如Gmail、GitHub、Slack、Notion、Stripe、Jira……点一 …
17d ago
telegram
巨好笑,railway作为一个B轮融资的公司,因为Google cloud封了他们的账号,导致所有服务宕机。
果然世界是个“草台班子”,但往往成功的产品又是“先射击再瞄准”
17d ago
telegram
Antigravity进化了,从 IDE 变成开发平台了
Antigravity 2.0 独立桌面应用,agent-first 设计,多 agent 并行,定时任务,语音输入。有一说一,真的很像Codex的界面。
还新出 Antigravity CLI,终端输入agy启动,不 …
17d ago
telegram
Google AI Studio推出安卓版了
手机上vibe coding写提示词能直接生成原生安卓 app,内置模拟器预览,不用装 SDK。
前两个 app 免费部署到 Google Cloud,不用绑卡。
17d ago
telegram
Google I/O 熬夜看完了,信息量很大,我挑了三个重点
Google上线了Gemini 3.5 Flash,编码和 agent 能力超过 3.1 Pro,Pro 版下月来。亮点是智能体能力史诗级增强,能执行操作,不只是聊天。
Gemini Spark 是新产品,像素级对 …
18d ago
telegram
Gemini更新了电脑和手机端的界面,新UI还挺好看的,很有科技感
18d ago
telegram
目前最接近opus 4.7的编程模型,价格仅是十分之一
cursor推出了Composer 2.5,这是一个cursor专属的编程模型,没有API,不支持第三方接入。价格方面,输入为$0.50/M,输出为$2.50/M。
底座来源于Kimi开源的K2.5,在cursor自己的 …
18d ago
telegram
你敢信?这是只有3B参数模型的效果
字节放出了一个多模态模型Lance,一张40GB显存的显卡能跑,自己在家就能本地部署,AI视频行业的门槛再次被拉低。
Lance在视频图片理解、视频图片编辑、多轮编辑一致性上表现极佳,跑分多个榜单统一模型第一。
📦 …