本文来自 @范洺源 投稿,在其基础上做了点修改
最近在学爬虫和数据分析,看到天气网上有国内城市一年的天气历史数据,想以此为数据源练习一下,于是就有了这个项目。今天在此简单介绍一下实现思路和最终效果。
用到的相关库包括:
requestsbs4pandasmatplotlibseabornpyecharts分析数据源
天气网的历史天气预报查询页面(http://lishi.tianqi.com/)上有各城市的数据。以北京为例,打开页面之后经过简单的尝试就可以发现,每个月的数据是以http://lishi.tianqi.com/{城市的拼音}/{年份+月份}.html这样的地址来展示的,于是可据此构建一个函数,函数的作用是默认返回北京市2018年1月到12月的 url:
爬取数据
有了 url 地址就可以用 requests 来抓取。这里要注意,得加上自己的 cookies,否则会返回 404 页面,应该是对方网站做了反爬。拿到返回值之后,我用 bs4 库的 select函数提取数据。select 函数使用的是 css 选择器的语法。由于需要进行一定的数据分析,所以这里没有将数据保存到文件,而是直接使用 pandas 的 dataframe 进行储存。
对12个月份进行抓取后再汇总,就得到了北京2018年全年的天气数据,包括最高温度、最低温度、天气状况、风向等信息。适当加工下信息,我们用一些图表来进行可视化的展示:
平均温度的分布

平均温度是使用每日最高温度和最低温度取平均的值。北京平均温度在0度和20多度的日子是最多的。
按月查看温度走势

天气状况分布

晴天和多云是北京一年中主要的天气。
各月降水天数统计

这里用 pyecharts 做了一个堆叠折线图。北京的降水天数不多,主要在7、8月份。可以对比下重庆的数据,差别就很明显了:

风向统计

为了让结果更加直观,这里采用了 pyecharts 里的雷达图,并且将8个维度按真实方向的角度来排列。通常认为,北京冬季盛行西北风,夏季盛行东南风。不过从数据上来看,西南风才是北京2018年的最热门的风向。
以上就是我这个项目所做的工作,内容还是比较基础的。大家可以做进一步的扩展,比如爬取其他的城市,然后进行全国多城市的天气比较,或者结合地图进行可视化。
几个相关库的官网都很不错,供参考:
requests http://cn.python-requests.org/zh_CN/latest/ bs4 https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/ pyecharts http://pyecharts.org/ seaborn http://seaborn.pydata.org/ pandas https://pandas.pydata.org/文章源码及相关文件已上传,获取代码及可视化效果可在公众号(Crossin的编程教室)回复关键字 天气
本文是我们编程教室新春征稿活动的一篇投稿,来自 @范洺源 同学。
我们编程教室会持续向所有人开放,如果有投稿或参与志愿者的意向,欢迎随时在公众号里给我们留言。
Python | 新手引导 | 一图学Python
开发案例:智能防挡弹幕 | 红包提醒 | 流浪地球 | 漫威
欢迎搜索及关注:Crossin的编程教室免责声明:文章内容来自互联网,本站仅提供信息存储空间服务,真实性请自行鉴别,本站不承担任何责任,如有侵权等情况,请与本站联系删除。
转载请注明出处:北京全年天气状况分析-北京全年气温曲线图 https://www.bxbdf.com/a/134232.shtml