Yi
  • |
  • En
  • 关于
  • 邮箱
6mo ago telegram
现在网页版 Gemini 可以直接创建 Opal ( 一句话构建 AI 工作流),可以理解成 Gem(智能体) 的加强版。 顺便提一句,我个人理解工作流和智能体的区别是,一个工作流可能是由多个智能体组合。
6mo ago telegram
Google 推出了一款叫做 CC 的助手。 它会在清晨自动整理你的邮件、日历与文档内容,并日程预览简报形式发到你的邮箱
6mo ago telegram
OpenAI 推出了 GPT Image 1.5 !!! 用了下,最让我“卧槽”的是它的文字渲染能力。以前生成的 Logo 全是火星文,现在让它写个 文字海报,连衬线体细节都给你对齐。所谓的“手术式编辑”也不赖,指哪改哪,光影居然没崩。而且 API 价格降了 20%。 虽然号 …
6mo ago telegram
被 Kling 2.6 的 Voice Control 惊艳到了。 Kling 这次直接把桌子掀了:原生音视频同步。 实测下来,直接输入 Prompt,视频生成的瞬间,声音、口型、甚至背景里的车流声(环境音)全都有了。这就好比给 AI 装了个外挂大脑,它终于知道“说话”不仅仅是 …
6mo ago telegram
阿里这个 Wan 2.6 有点东西 实测 Wan 2.6 文字生成一段袋鼠和熊猫拳击比赛的视频,音画完全同步,根本不需要后期再修,这点对我们这种“能不动手就不动手”的懒人太友好了。 而且它那个 1.3B 的轻量版,居然只要 8.19GB 显存就能跑。 不过也别高兴太早,目前 …
6mo ago telegram
在 即梦 上测了下字节刚发的 Seedance 1.5 Pro。 它最变态的地方不是画质,而是原生音画同步。不是那种生成的“哑巴视频”再后期贴个 BGM,而是视频里的角色张嘴说话时,口型、表情和声音是完全咬合的,连环境音都有空间感。 实测下来,比我现在工作流里“Runway …
6mo ago telegram
ChatGPT App也支持“分支对话”功能了
6mo ago telegram
昨晚发现了智谱开源的这个 RealVideo。实测下来最吓人的是延迟只有 2-3 秒。什么概念?以前生成个 5 秒视频够我去冲杯咖啡,现在这玩意儿直接能跟我实时视频通话,连嘴型都能完美对上语音(TTS+视频生成一条龙)。感觉就像给 AI 装了个真·声带和脸,而不是在那念 PPT。 …
6mo ago telegram
本来以为又是个只活在 PPT 里的学术项目,结果看完 LivingSwap 的 Demo,我后背真有点发凉。 以前搞视频换脸,最烦的就是侧脸狂闪和光影崩坏,为了修那些破绽,我在 After Effects 里修帧修到想吐。LivingSwap 这货的路子很野,它不像传统 GAN …
6mo ago telegram
阿里这次开源的通义百聆(Fun-CosyVoice3)属实有点东西,特别是在“白嫖”和“本地部署”这件事上,给独立开发者留了条活路。 实测下来,几个感觉最明显的点: * 轻得离谱:0.5B 的参数量,直接跑在我的开发本上居然不卡。官方说首包延迟降了 50%,体感就是刚敲完回 …
← 上一页 下一页 →
Basjoo
Basjoo
AI 客服平台,包含 FastAPI 后端、Next.js 管理后台、可嵌入聊天组件与 Qdrant 知识检索。
查看源码 →
© 2019 - 2026 浩伊
🍪 Cookie 偏好设置 本站使用 Cookie 进行访问分析,并为广告和个性化广告保存偏好。 隐私政策

🍪 Cookie 偏好设置

必要
网站正常运行所必需的 Cookie(始终启用)
分析
帮助我们了解访问者如何使用网站
广告
用于展示相关广告