9mo ago
telegram
免费平替 Claude Code: iFlow CLI 高效编程与自动化工作流
阿里巴巴心流团队推出的终端 AI 智能体 iFlow CLI 现已免费开放,它能用自然语言帮你完成代码编写、文件整理和复杂任务自动化。
1️⃣ 零成本与无障碍访问:永久免费使用, …
9mo ago
telegram
沃尔玛与 OpenAI 达成合作,将“即时结账”功能引入 ChatGPT,展示了 AI 从信息查询到直接完成交易的模式转变。
🔹 对话式购物
直接用自然语言描述需求,如“规划周末烧烤食材”,AI 会生成购物清单。点击“购买”即可下单,全程无需跳转 App 或网站。
🔹 账户自 …
9mo ago
telegram
OpenAI 正在测试 ChatGPT 原生的用户间通讯功能,将对话 AI 变为多人协作平台
1️⃣ 功能概览:Android 最新测试版 (v1.2025.273) 中出现代号为 Calpico 的新功能,支持用户间直接消息 (DM) 与群聊,并可邀请 AI 共同参与讨论。 …
9mo ago
telegram
微软发布首款自研文生图模型 MAI-Image-1,目标是为创作者提供快速、逼真的视觉生成
1️⃣ 性能不俗:首次亮相 LMArena 文生图排行榜即进入前十,在光影效果与自然景观渲染方面表现突出。
2️⃣ 低延迟交互:优化了生成流程,响应速度快,支持实时交互与快速修改。 …
9mo ago
telegram
Gemini AI 正在逐步取代 Google Maps 助手,为地图带来更自然的语音交互体验
1️⃣ 导航进化:驾驶时能用更自然的口语指令,如“帮我避开收费站”,或询问“沿途有什么值得看的历史景点”,AI 能在不干扰驾驶的情况下理解情境并回应。
2️⃣ 复杂场景搜索:主页将 …
9mo ago
telegram
Google Gemini 3.0 Pro 即将发布,采用 MoE 架构
MoE 架构与动态专家路由:如同一个智能团队,针对不同任务实时组合最合适的专家,总参数达数万亿,但单次查询只激活约 150-200 亿,兼顾效率与成本。
上下文窗口大幅扩展:从 2.5 的 100 …
9mo ago
telegram
免费创建音画同步的“数字演员”
GAGA-1 是首款将声音、嘴型与表情一次性生成的 AI 视频模型,解决了传统 AI 视频口型与情绪脱节的问题。
1️⃣ 音画同步生成
模型采用 co-generation 架构,类似人类一次性完成说话与表情,声音波形与面部动作同步输出,无需后 …
9mo ago
telegram
如何低成本搭建自己的多模态数字人
OpenAvatarChat 是一个模块化的开源对话系统,提供了一套灵活高效的解决方案。
它的核心设计就像搭积木,用户可以按需组合语音识别 (ASR)、大语言模型 (LLM)、语音合成 (TTS) 和数字人渲染 (Avatar) 等模块。 …
9mo ago
telegram
Affinity Photo 新增机器学习功能,永久免费使用AI。该功能支持本地化处理,无需联网,确保数据隐私,用于提升图像主体与对象的选择精度和速度。
对象选择工具 (Object Selection Tool): 基于分割模型,自动识别并选择图像中的人物、动物、建筑等对象。 …
9mo ago
telegram
用自然语言构建 AI 小程序,Google 的 Opal 把你的想法直接变成 Web 应用。
Opal 是 Google Labs 的 “vibe-coding” 实验项目,通过对话描述功能,即可生成可视化工作流,降低了 AI 应用开发门槛。
最近刚完成一轮重要更新:
1️⃣ …