农业部部长韩长赋近日透露,近期我国批发市场的猪肉价格已经连续13周呈现小幅下滑趋势。然而,对于普通消费者来说,猪肉的价位依然显得较高,不禁让人疑惑:猪肉价格真的有所下降吗?为了揭开这一谜团,本文将运用Excel工具,对9000条猪肉价格数据进行抓取与分析,以直观地呈现猪肉价格的走势,并探讨近期猪肉价格的具体情况。
本文所抓取的数据来源于一家专业的猪肉报价网站。该网站提供的是白条肉报价,即仅去除内脏、头、脚等部位,未经过任何加工的猪肉。这种猪肉报价基本可以视为猪肉的出厂价。接下来,我们将详细介绍数据抓取的过程。
一、数据抓取与整理格式
从网站页面我们可以发现,每一页的数据内容几乎相同,唯一的区别在于网址末尾的页码。因此,我们可以将网址分为两部分,将页码设置为变量,并将所有页码代入,从而获取全部数据。这就是我们抓取9000多条数据的原理。
首先,我们点击Excel的数据功能组,然后选择“获取数据”,再点击“来自其他源”,选择“来自网站”。在弹出的窗口中,我们点击“高级”,将网站分为两部分,将代表页码的数字单独放在一个输入框中。接着,点击“确定”,进入导航器界面,选择“table0”这个表,然后点击“转换数据”,将数据加载到PowerQuery中。
随后,我们需要对数据进行整理。在这里,我们先将第一行数据删除,并为表格添加一个标题。由于表格中存在一些无用的数据,我们仅保留日期、省份、报价地点以及价格,其余数据全部删除。
然后,我们点击“视图”,再点击“高级编辑器”,在“let”上方加入一行代码:(x as number) as table =>。接着,将网址中的“1”更改为(Number.ToText(x)),然后点击“确定”。这样,我们刚才的操作就被封装成了一个函数,输入页码即可跳转到对应的数据。
二、数据抓取
本数据共有304页。我们需要新建列表,将这304个页码代入我们刚才创建的函数中。首先,我们新建一个空查询,然后在编辑栏中输入={1, 2, 3, ..., 304},新建一个列表。接着,点击“转到表”,然后点击“添加列”,选择“调用自定义函数”,将函数设置为“table0”,点击“确定”。这样,Excel就会开始数据抓取,整个过程大约耗时5分钟。
抓取完成后,我们会看到数据中多了一列“table”列。我们点击右上方的箭头,扩展数据。然后,我们删除第一列数据,点击“价格”这一列数据,将单位替换掉,再将其格式设置为常规格式。最后,点击“关闭并上载至”,将数据加载到Excel中。
三、数据分析
将数据加载到Excel中后,我们插入一个数据透视表,并基于数据透视表构建图表。以下是近1个月的猪肉价格走势图(网址只保留一个月的数据,未抓取更多数据)。从图中可以看出,猪肉价格整体呈下降趋势,但幅度不大。在此,我们的计算单位为公斤。
接下来,我们再来看一下今天哪个区域的猪肉价格报价最高。从下图中可以看出,上海以每公斤49元的价格位居第一,其次是广西,每公斤48.33元。而猪肉价格最低的省份为陕西省,每公斤35元。
本文所抓取的是白条猪的价格。一般来说,白条猪价格加价10元左右即为猪肉的零售价格。据此计算,一斤猪肉的价格大约在25元左右。这样一来,猪肉似乎也没有那么“香”了。