我们首先打开LOL游戏官网,登录自己嘚账号(因为牵扯到账号,所以需要用到cookie),然后选择你想爬取数据的大区!
在这个界面我们按下F12查看源代码,在Network下的JS里,刚开始什么都没有,我们需要重噺加载网页然后才会显示各种数据
如果你看下除了第一个?c=Battle的其他相同名字数据就会发现,下面的每一条数据正好对应着左侧的每一局游戏,我們点开几个游戏数据,在general的url里发现只有一个参数变了,那就是gameId,这个gameId在哪里得到的呢?就是从第一条?c=Battle的数据里得来的.
这里我们找到了gameId的位置,只要把所有的gameId得到,就可以进一步提取每一局的游戏数据了
我们通过第一条游戏数据,找到队伍里自己的位置,我是在第六的位置,然后在stats里就是自己的詳细游戏数据了,我们这次要爬取的数据主要就是在这里.
我们看下gameId的获取方式,知道url,请求方式为get,接下来就可以上代码了
try: #有的游戏某一项没有数據
,例如大乱斗没有插眼数据
,用
try防止报错
,
#你还想写什么可以按照这种方法找
,游戏模式
,使用英雄
,出装
,伤害等等都可以
else:#这是其他
9人的数据
,如果你想分析也可以下载看看
这是一局游戏的数据
,如果你想下载所有游戏数据只要加个循环就可以了
第三部分,存入Excel,方便可视化
'''省略获取数据部分''''
循环了20次,其中7次大乱斗的数值没有提取,Excel效果如下