前言

我们需要爬取的是腾讯实时疫情的数据–腾讯实时疫情网址

这里准备用两篇文章实现python爬取疫情数据,并结合pyecharts的南丁格尔(玫瑰图)实现数据可视化。

准备工作

本篇需要用到三个python库, 请自行安装

  • requests
  • pandas
  • json

例:安装方式->CMD命令行->安装requests

pip install requests

抓包分析

我用的是谷歌浏览器,进入腾讯实时疫情的网址,然后F12->Network->XHR,重新刷新下页面发现

img

确定这就是数据包。

下面是具体代码实现

import requests
import json
import pandas as pd

# 分析抓包
url = 'https://api.inews.qq.com/newsqa/v1/automation/foreign/country/ranklist'
response = requests.get(url)
content = json.loads(response.text)  # json.loads 将json格式数据转换为字典
# print(content)
df = pd.DataFrame(columns=['国家和地区','确诊病例','死亡病例','治愈病例'])
# 字典类型读取到DataFrame
for i in range(len(content['data'])):
        df.loc[i+1] = [
            content['data'][i]['name'],
            content['data'][i]['confirm'],
            content['data'][i]['dead'],
            content['data'][i]['heal']]
# 保存为xlsx格式文件
df.to_excel('data.xlsx',index=0, encoding='utf-8')
print('爬取完毕')

一个可爱的人