In this assignment, you will identify a dataset of interest and perform an exploratory analysis to better understand the shape & structure of the data, investigate initial questions, and develop preliminary insights & hypotheses. Your final submission will take the form of a report consisting of annotated and/or captioned visualizations that convey key insights gained during your analysis.
选取了2017年美国每日天气,该数据集包含由NOAA每日全球历史气候学网络提供的2017年美国每日天气预报,基本记录了2017.1.1 - 2017.9.21时间段内美国各个气象站测得的降水量、降雪量、雪深、最高温度、最低温度、平均温度、日平均风速、最快的5秒风速、最快5秒风向等气象指标,我选取了其中降雪量、雪深、最高温度、最低温度、平均温度等指标来研究以下三个问题:
美国2017年美国降雪的空间分布情况降雪的影响因素及降雪与雪深的关系美国2017年气温的空间分布情况及气温的影响因素美国2017年美国降雪的空间分布情况 将美国各个气象站测得的降雪量表示在地图上得到上图,我们可以容易的感受到随着纬度的增加,降雪越来越少,并且东海岸降雪要明显集中并且多于西海岸,内陆地区降雪普遍偏少,为了更加直观的感受降雪量的分布情况,将每个州的内气象站统计得到每个州的年平均降雪如下图: 这图可以让人更加直观的感受降雪量在空间上的分布情况。
降雪的影响因素及降雪与雪深的关系 将各州的月降雪量随时间的变化转化为折线图、boxplot得到上图的中的前两图,将各州文图随时间的变化以boxplot的形式展现得到上图第三个框,我们可以发现,降雪量主要集中在1-3月份,并且随着时间的继续增加,降雪量越来越少,由最下面boxplot我们可以简单推知,降雪量的减少与季节转变温度上升密不可分。 为了进一步论证这一结论,我将降雪量与气温的变化用下面的折线图展示出来
我们非常明显地发现,随着温度的上升降雪量是逐渐减少的,并且降雪多的州主要集中在30-40华氏度之间。 由上图可知,总体的趋势是随着海拔的上升降雪量是逐渐减少的,但是在海拔为0的附近区域集中了许多低降雪量的地区,这一点也符合常理,因为美国南部常年气温高于0摄氏度,基本上不会存在降雪。 由上图可知,一般情况下随着降雪量的上升,雪深也会逐渐的增加,但是考虑到在一些海拔极高的地区终年积雪不化,但是又因为海拔等地理原因,这些地区降雪往往较少,所以存在在上图中低降雪区域存在一些雪深很高的点
美国2017年气温的空间分布情况及气温的影响因素将美国各个气象站测得的气温表示在地图上得到上图,我们可以容易的感受在东南部气温普遍较高,由东南区域向西北移动的过程中平均气温总体呈降低趋势。 最后将气温与海拔、时间的关系以上面两图的形式呈现出来,我们不难发现随着海拔的升高,气温呈降低趋势,这一点与随着海拔上升气温逐渐下降的常理相符合。再来看随着时间的变化,我们可以发现随着时间的推移气温越来越高,大约在7月份左右出现顶峰,这时候恰好是夏天,之后气温逐渐有下降的趋势。