返回列表

作者:巨人电商

爬取抖音短视频改良版(无水印版)

POST TIME:2021-04-12

目录使用更简单的方法代码优点不足使用方法

在我之前的一篇博客中,我用了构造网址的方法来获取抖音短视频,但是在今天我又一次的研究抖音短视频的时候发现了一个更加简单的方法,发现我之前的分析实在是太过繁琐了,所以有写了一篇博客来记录下这个方法。(上一篇博客就当做是就记录下分析网页的思路吧,就不作更改了)

与上一篇博客不同的是,这个方法可以省略掉大量的分析步骤

随便打开一个抖音个人主页,我选择的是爱奇艺体育,接着右键检查网页元素,点击network选项卡下的xhr选项,分析抓到的包

点到preview选项卡,点击video->download_addr->url_list

发现这下面跟着的两个网址正好是视频的网址(根本不需要构造,只是这个网址藏的有点深,需要非常耐心的寻找),打开网址查看:

提取到这个网址的时候我以为已经结束了,但是一个大佬@金亭玉立给我发来了一篇文章最新版抖音(20200428)去水印原理及源码,简单的原理与面临的挑战提醒了我一些没有想到的东西,在此表示感谢!

我们接着往下看,在下面的play_addr下面也有一个链接,这个链接下面的视频就是无水印版本的视频

ok,现在我们只要想办法提取到它就大功告成了

我这次使用的方法中用到了jsonpath模块,直接pip下载就可以了:

这个方法的优点是可以省去很大一部分的分析网址的步骤,而且没有调用到webdriver(可以不限制浏览器),速度也会有显著提升,得到的视频也是无水印的

还是没有解决随机生成字符串的问题,操作比较麻烦

https://github.com/jjjjmhao/SprIDer/blob/master/simplescreenrecorder-2020-05-04_23.54.22.mkv