Yi
  • |
  • En
  • 关于
  • 邮箱
7mo ago telegram
为啥在Gemini App用Gems会丢聊天记录?
7mo ago telegram
本地跑通“类 GPT-4o”实时语音交互的最后门槛被踏平了 微软本周开源 VibeVoice-Realtime-0.5B,用极低算力实现 <300ms 延迟的流式 TTS,且支持 MIT 协议免费商用。 1️⃣ 消费级硬件门槛 仅 0.5B 参数,推理显存占用不到 2GB …
7mo ago telegram
语音交互延迟干到 97ms,不做这块优化的产品可能要掉队了 阿里 Qwen3-TTS-Flash 新版发布,一举解决“方言本地化”和“对话即时感”两大痛点,实测体验相当能打。 1️⃣ 快得像真人抢话 首包延迟(First Packet Latency)压到了 97ms。简单 …
7mo ago telegram
Google 推送的 Gemini 3 Deep Think,可能是目前唯一能在这个维度真正落地“慢思考”的 AI 方案。 其核心逻辑不是让你更快得到答案,而是像人类专家一样,先在后台进行“平行推演”和自我反思,再给出最优解。实测下来,对复杂逻辑的提升显而易见: 1️⃣ 突破 …
7mo ago telegram
阿里千问 App 刚上线 Qwen3-Learning 模型,主打 K-12 全科“拍题讲解”与“作业批改”,完全免费且不限次。 这不仅仅是传统的 OCR 搜题,而是把 LLM 的推理能力落地到了具体场景: 1️⃣ 从“给答案”到“教逻辑” 利用思维链(CoT)技术,模型不会 …
7mo ago telegram
快手可灵数字人 2.0 全量上线,解决真人出镜成本高、甚至不敢出镜的痛点,三步把一张静态图变成能连续演 5 分钟的专业视频。 🔹 表现力跃升 基于 DiT 架构(想象成既懂剧本又懂运镜的 AI 导演),不仅实现毫秒级口型对齐,现在的微表情、手势和体态能跟随语调自动演绎,摆脱了早 …
7mo ago telegram
字节跳动发布了 Seedream 4.5,把「多图一致性」和「文字渲染」直接拉到了商用成品级标准,不做单纯的艺术玩具,而是直接对标生产力。 1️⃣ 真·多图融合(Multi-Image Composition) 以前用 SD 做「产品+模特+背景」 …
7mo ago telegram
零代码开发红利窗口期,普通人 30 秒验证游戏创意的最低门槛 蚂蚁「灵光」更新闪游戏功能,实测可将一句话需求直接转化为可交互、可迭代的 Mini Game,大幅降低独立开发试错成本。 🔹 交互式迭代:这是区别于“一次性代码生成”的关键。支持多轮对话修改,输入“换个赛博朋克背 …
7mo ago telegram
首个全栈开源 GUI Agent,把移动端自动化的门槛打下来了 以前搞手机自动化要自己写 ADB 驱动、配环境,现在 GELab-Zero 直接开源了“模型+基建”整套流水线。 原理类似给手机装了个“AI 驾驶员”,但这回连车(基础设施)和路(环境配置)都给你铺好了,主打一个 …
7mo ago telegram
视频创作流彻底变天,还在用旧工具“抽卡”会直接拉低产出效率 可灵 O1 刚全量上线,这是首个将“生成+编辑”统一的多模态模型,真正实现像 P 图一样 P 视频。 🔹 底层逻辑重构 采用 MVL 架构并引入 Chain-of-Thought (CoT) 技术。简单说,模型在生成 …
← 上一页 下一页 →
Basjoo
Basjoo
AI 客服平台,包含 FastAPI 后端、Next.js 管理后台、可嵌入聊天组件与 Qdrant 知识检索。
查看源码 →
© 2019 - 2026 浩伊
🍪 Cookie 偏好设置 本站使用 Cookie 进行访问分析,并为广告和个性化广告保存偏好。 隐私政策

🍪 Cookie 偏好设置

必要
网站正常运行所必需的 Cookie(始终启用)
分析
帮助我们了解访问者如何使用网站
广告
用于展示相关广告