6mo ago
telegram
🎙 刚看到通义实验室开源了这个端到端 (S2S) Fun-Audio-Chat 8B 模型,这不仅仅是陪聊工具,更像个长了耳朵的 Agent。
1️⃣ 动口不动手:最戳我的是 Voice Function Calling。以前我在开车时想处理个急事,只能干着急,现在直接吼一声让 …
6mo ago
telegram
Qwen 刚发布的这俩新模型,可能要省掉我每个月给 ElevenLabs 交的订阅费了。
主打「3 秒克隆」和「文本捏人声」,对于我们这种要做多语言视频的创作者来说,吸引力很大。
具体有两个新成员:
1️⃣ VoiceDesign (VD-Flash):不用找现成音色,直接 …
6mo ago
telegram
告别服务器运维,我这周用 EdgeOne Pages 跑通了出海 AI 项目。
一键托管加全球边缘部署,这应该是目前国内开发者做全球化 AI 工具门槛最低的路径之一。
以前我最烦熬夜调 Nginx 配置,尤其是做海外项目,延迟稍微高点,客户的方案就卡在加载动画上。这几天实测了 …
6mo ago
telegram
蚂蚁刚开源的 AntAngelMed,可能是目前普通开发者能本地部署的最强「AI 医生」。
这两周都在研究这个刚发布的 100B 模型,几个实测感受分享给想做垂直赛道的兄弟:
1️⃣ 架构聪明不吃灰:虽然是千亿参数,但用了 MoE(混合专家)架构。好比医院挂号,只唤醒对应科室 …
6mo ago
telegram
把 Claude 续费关了,强迫自己全流程用 GLM-4.7 写代码,结果意外:不仅没耽误,API 账单直接便宜 90%。
作为独立开发者,这模型简直是为我们这种「既要性能又要省钱」的人定制的:
1️⃣ 思考模式不输闭源:它这个「Thinking」机制很有意思,我在 VS …
6mo ago
telegram
这一周重测 MiniMax M2.1:从「便宜大碗」到「真生产力」,这次升级把 M2 的短板补齐了。
这几天在 Cursor 里高强度实测 M2.1,这 3 个变化让我决定把它设为「主力备胎」:
1️⃣ 不再「偏科」:以前 M2 写 Python 凑合,遇到 Rust 或跨文 …
6mo ago
telegram
不再傻傻 2 倍速刷视频,直接用 AI 提取核心逻辑+脑图,把「被动听课」变成「主动查阅」。
我是怎么用 NoteGPT 偷懒的:
1️⃣ 视频秒变结构图
实测扔进去一个 2 小时的 YouTube 深度访谈,大概 15 秒出摘要。最强的是它能直接生成脑图,本来要听半天才能理 …
6mo ago
telegram
最近把会议系统切到了 hq0,虽然配置花了一小时,但换来了完全「私有化」的接待体验。
1️⃣ 主场优势:以前发链接像第三方中介,现在直接甩出 meet.我的域名.com。上周给甲方做演示,对方第一反应是「你们居然有专门的会议系统?」,专业度直接拉满。
2️⃣ AI 闭环:不仅 …
6mo ago
telegram
我这周末扒了下 Nvidia 开源的 NitroGen 模型,它会玩包括《巫师3》、《赛博朋克2077》在内的 1000 多款游戏。
这是一个通用的「视觉-动作」模型:给它看游戏画面,它直接输出手柄操作。
1️⃣ 原理像极了自动驾驶:没搞复杂的奖励机制,直接喂了 40,000 …
6mo ago
telegram
别再调参数了,用 Emoji 控制 AI 语音也许是新解法。
这两天挖到了 Product Hunt 上热度很高的 NOIZ AI,实测确实能解决「AI 说话没味儿」的痛点。
原理其实特简单:它不让你调复杂的音高/语速参数,而是把 Emoji 直接当作情感指令。
加个 😢(流 …