当用户提供 B 站视频链接、BV 号或 b23.tv 短链,并希望转录、提取字幕、总结或分析视频内容时使用。先检查 Node.js 环境和 SILICONFLOW_API_KEY,优先尝试官方字幕;如果没有字幕,则获取匿名音频地址,下载为 .m4s 后直接改名为 .mp3,无需转码;有 API key 时调用硅基...
我看到很多人的方案都是本地whisper或者走gemini,但是会有硬件不支持&网络不支持的问题,所以想了一个完全免费的链路。需要大家提前去硅基流动注册一个账号获取api key,就可以使用他们的免费语音模型了。 这个skill的我还给自己写了Claude和codex等专用的skill版本(虽然这个版本应该也能用),后续会上传到GitHub。 本次更新特点: -支持根据用户输入的 B 站视频链接、BV 号或短链自动转录、提取字幕或总结视频内容。 - 首选官方字幕,无字幕时可匿名获取音频并用硅基流动 ASR 自动转写。 - 支持用户自定义总结要求,默认输出重点总结。 - 智能检测 Node.js 环境与 API key,首次成功后自动跳过重复环境检查。 - 执行结果输出为多个结构化文件,并可直接返回文字稿。