小宇宙FM:先看后听

获取链接

首先在手机上分享某一集节目,然后选择复制链接,如下图所示:

会得到一个小宇宙的 PC 端链接,如https://www.xiaoyuzhoufm.com/episode/67164e0d0d2f24f289c01c1e

下载音频

小宇宙没有对反爬做任何限制,音频文件的地址就放在了网页的Head中。

1
2
3
4
5
6
7
8
9
10
11
12
<html>
<head>
<meta
property="og:title"
content="寻根究底:物理层面上看,硅基生命能不能取代碳基生命存在?"
/>
<meta
property="og:audio"
content="https://media.xyzcdn.net/lmYfADB-A94B_DFJkN6YE4VgX_Y7.m4a"
/>
</head>
</html>

音频文件的网址https://media.xyzcdn.net/lmYfADB-A94B_DFJkN6YE4VgX_Y7.m4a可以直接下载。随便用一个爬虫就能下载到音频文件。

Speech To Text

STT可以使用OenAI的whisper

安装后可直接使用命令行:

1
whisper audio.m4a --language Mandarin

会生成.srt.vtt.txt三个文件,分别是字幕、视频字幕、文本。

也可以在Python中使用:

1
2
3
4
5
6
import whisper

model = whisper.load_model("turbo")
result = model.transcribe("audio.m4a")
text = '\n'.join([x['text'] for x in result['segments']])
open("audio.txt", "w").write(text)

校对与总结

使用LLM模型校对文本,然后总结要点。

1
2
3
4
5
你是一个文字处理专家,擅长校正语音识别出的文章和要点总结。

将下面文章中的错别字修正,加上合适的标点符号,分成合适的段落,去掉多余的语气词和重复的口癖。
文章内容如下:
<识别内容>
1
总结一下这篇文章的要点

也可以使用python脚本:

代码汇总在xiaoyuzhoufm项目。