小记：音频格式转化ByPython（下）

博客分享

 0  251

张三 2022-03-06 13:56:10

悬赏：0 积分收藏

小记：音频格式转化ByPython（下）

Python、网络爬虫、百度词条、周杰伦、数据清理、音频、格式转化、pydub、re、urllib

上文中我们已经大致明白了pydub库的使用方法，今天的目标是写个爬虫爬取歌曲信息。

关于网络爬虫，Python的标准库里是有相应的包的，可以直接打开：https://docs.python.org/zh-cn/ 去看Python相应版本的的官方中文文档（这个网站很有用，推荐学Python的小伙伴收藏），当然官方文档一般比较晦涩，可以再搜一些教程配合食用最佳。

通过学习了解到关于python网络爬虫可以使用传统的urllib库或者更高级的 Requests库，这里暂时选用urllib。其中urllib.request模块用于打开url，用法如下：

urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)

看起来很复杂，不过其他的默认可以不填，我们只需给出url参数就行了。打开百度百科搜索烟花易冷，发现网页url是这样的：https://baike.baidu.com/item/烟花易冷 /211 ，粘贴复制到文本后是这样的：https://baike.baidu.com/item/烟花易冷/211 ，看来浏览器自动进行了编码转化，尝试更改url，输入：https://baike.baidu.com/item/七里香，转到，成功进入七里香的百度词条界面，不过url自动更新为了：https://baike.baidu.com/item/七里香/2181450 （能用就行，选择性忽视）。观察网页，可以发现我们需要的信息是这样的：

posted @ 2022-03-06 13:53 hs3434 阅读(0) 评论(0) 编辑收藏举报

上一篇：GAN实战笔记——第六章渐进式增长生成对抗网络（PGGAN）

下一篇：通过对比语法差异，让会JAVA的你快速学会Kotlin的开源宝藏项目

回帖

张三（王者段位）

821 积分 (2)粉丝 (41)源码

温馨提示

您可以通过每日签到获得积分；
您也可以通过发布源码或者分享技术获得积分；

亦奇源码

小记：音频格式转化ByPython（下）

小记：音频格式转化ByPython（下）

张三 （王者 段位）

温馨提示

最新会员

张三（王者段位）