7mo ago
telegram
将长文档转为定制解说视频
Google NotebookLM 的“影片摘要”功能升级,从预设模板转向完全自定义生成。
🔹 任意风格:由 Nano Banana (基于 Gemini 2.5 Flash) 驱动。除了 6 种内置风格(如白板、水彩),现在可用文本提示指定“8 位 …
7mo ago
telegram
提升 AI 协作效率:ChatGPT 群聊功能试点
它正从个人工具转向多人协作空间,目前已在日、新、韩、台等地测试。
1️⃣ ChatGPT 群聊:通过链接邀请多人实时协作,支持文件上传、图像生成和搜索。
2️⃣ 隐私与管理:群聊的自定义指令(Custom …
7mo ago
telegram
设置一个目标价,让 AI 帮你自动下单
Google 刚发布的 Agentic Commerce (代理商业) 功能,接管繁琐的购物执行环节。
🔹 Agentic Checkout: 这不是简单的降价提醒。当你设置好目标价、尺码和颜色后,Google AI 代理会在价格达标时 …
7mo ago
telegram
快速生成可编辑的 3D 场景
李飞飞团队 World Labs 开放了首款商用世界模型 Marble。它能将文本、图片、视频或 3D 布局转为持久化、高保真的 3D 环境。
1️⃣ 多模态输入:支持从文本、单图、多图或视频片段生成空间连贯的 3D 世界。
2️⃣ AI 原生 …
7mo ago
telegram
让 AI 语音 Agent 不再“卡顿”的 ASR 方案
ElevenLabs 推出了 Scribe v2 Realtime,一个专注超低延迟的流式语音转文字模型。
🔹 延迟: 约 150ms 响应,比常规 ASR(如 Whisper)快,实现自然对话体验。
🔹 覆盖: …
7mo ago
telegram
用 3B 算力跑 28B 模型的推理
百度新开源了多模态模型 ERNIE-4.5-VL-28B-A3B-Thinking,重点是通过 MoE 架构实现低成本高性能。
MoE (混合专家) 原理好比:
你有一个 28 人的专家团 (总参数),但回答问题时只喊 3 …
7mo ago
telegram
用提示词生成全栈应用,并保持设计一致性
Webflow 新推出的 App Gen (公测中) ,允许你用自然语言构建生产级 Web 应用。
它最大的特点是“设计感知”:
1️⃣ 自动继承:App Gen 会自动应用你现有的设计系统 (颜色、字体、布局变量、组件),解决 AI …
7mo ago
telegram
本地部署 AI 高精解析筛选简历
阿里开源了 SmartResume,一个结合 LLM 与 OCR 的简历处理工具,适合个人优化或 HR 批量筛选。
🔹 精度与效率:单页信息提取准确率 93.1%,平均 1.22 秒处理一页,支持 PDF、图片等格式。
🔹 复杂布局: …
7mo ago
telegram
让 AI 视频不再“抽卡”
实现精准运镜与循环场景 可灵 (Kling AI) 2.5 Turbo 模型上线“首尾帧”功能,配合降价策略,将视频生成从随机碰撞拉回到可控工作流。
1️⃣ 成本效益 新模型算力优化后,费用较前代降低约 30%(1080p/5s 仅需 25 …
8mo ago
telegram
GPT-5.1 已发布,解决 GPT-5 的“冷漠”问题,带来更智能也更自然的 AI 体验。
OpenAI 听取了用户反馈,新版默认语气更“温暖”。
1️⃣ GPT-5.1 Instant (即时模型): 默认更会话化。亮点是“自适应推理”,遇到复杂问题会“先思考后回答”,提 …