完美统计图特训营② | 一图胜千言的证明

引言:很久以前,流传着这样一句话:“会写代码的干不过会做PPT的”。时光荏苒,演变至今变成了:“会做PPT的干不过会做统计图的”

现在的职场都这么直接了吗?

就是这么直接,在大数据时代,行行业业需要各种统计,要从数据中挖掘出有价值的东西,靠计算机是一条路,但是很多时候,还是需要手工把数据用可视化形式呈现出来,进而发现问题。而数据呈现的最常用方式,就是统计图。

虽说当前有各式各样的可视化工具、插件可以生成花花绿绿的统计图,但是我们在职场中应用最多的,还是OFFICE套件来做统计图。

统计图基于统计学,本身是规范严谨的,但是当前的统计图,可以说,绝大部分不符合规范,虽然有些很好看,但上不了台面。

接下来,我们一起来畅游统计图的世界,咱一起来制作规范的、清晰的、严谨的、漂亮的、上得了台面的统计图。。。。

本系列教程精选自《完美统计图》一书,章节保留原书章节,但是确保内容连贯,短小精悍的8节课,推倒统计图门槛。

第二课 一图胜千言

01

一图胜千言的一个示例

【例1-4】证明:字不如表,表不如图,一图胜千言。

一段文字如下所示:

主题:2015-2019年中国的快递业务量。

来源:中国国家统计局网站(http://www.stats.gov.cn/)。

正文:

中国国家统计局发布的《2019年中国国民经济与社会发展统计公报》显示:2015年,中国快递业务量为206.7亿件,2015年比2014年增长48%。

中国国家统计局发布的《2019年中国国民经济与社会发展统计公报》显示:2016年,中国快递业务量为312.8亿件,2016年比2015年增长51%。

中国国家统计局发布的《2019年中国国民经济与社会发展统计公报》显示:2017年,中国快递业务量为400.6亿件,2017年比2016年增长28%。

中国国家统计局发布的《2019年中国国民经济与社会发展统计公报》显示:2018年,中国快递业务量为507.1亿件,2018年比2017年增长27%。

中国国家统计局发布的《2019年中国国民经济与社会发展统计公报》显示:2019年,中国快递业务量为635.2亿件,2019年比2018年增长25%。

上面这段话,这样的表达,谁受得了!但如果要用文字来表达,估计就只能这样不厌其烦地说话。

好在表达数据的方式不止一种,把上面这段话简化成一张表,从一段话到一张表,结果如表1-6所示。

表1-6 2015-2019年中国快递业务量及其增长速度

表1-6清清爽爽,没有一句重复多余的话。统计表与前面那一段文字相比,哪一种表达更养眼,一目了然。

把表1-6画成一张图,从一张表到一张图,结果如图1-8所示。

图1-8 柱线图

图1-8是用表1-6的数据画的柱线图,统计图与统计表相比,哪一种更直观生动,一看便知。

由本章的4个例子可以看到,本章开篇的统计图春联没有白贴。

上联“文不如表”,统计表与一段话相比,删除了重复的语言,用格线来呈现数据,可不更为清爽迷人;下联“表不如图”,统计图与统计表相比,删除了格线,用图形来呈现数据,可不更加形象诱人;横批“一图胜千言”。实例胜于雄辩,的确如此,让人们的视线,直达数据的焦点。

字、表和图,呈现数据的这三种形式,从字到表,再从表到图,是你中有我,我中有你的关系。统计图从统计表而来,没有好的统计表,就画不出好的统计图。而统计表从提炼数据而来,没有好的数据,就画不出好的统计表。要把好的数据画成好的统计表,再把好的统计表画成好的统计图,这是一个不断创造的过程。

好的数据、统计表和统计图,怎样才算好呢?至少要做到以下两点,才能达到好的标准。

第一,三者都要具备数据语言的8个要素。数据不管以怎样的形式呈现,都必须具备时间、空间、主体、数据的名称、数据的取值、计量单位、计算方法和来源。

第二,三者都要根据自身的条件,选择最合适的形式来表达数据。这句话是讲,不是所有的数据都适合画统计表,不是所有的统计表都适合画统计图,不是统计图越多越好。比如,只有一个数据就无法画统计表。比如,统计表没有整理好数据就画不好统计图。又如,在一篇数据文章中,统计图并不是越多越好。

统计图是数据的形象大使。只有好的统计图,才能担当这样的大使。

要画好统计图,需要提前准备一点什么?这一点,正是下一章的风光。

02

画统计图的前奏

一个人写字,首先要看字写得对不对,然后才看字写得好不好。如果一个人写的字,一眼看上去很美,但仔细一看,写的却是错字,那么,就算笔力再好,也会让人摇头叹息。

同样,在数据可视化时代,一张好的统计图,不仅要画对,还要画得美。要画对和画美统计图,当然有章可循。这一章,解读画统计图的准备工作。本章内容的导航线路如图2-1所示。

图2-1 统计图之路的风光

图2-1呈现的4个地方,是本章4节的主打景点。第1节,先睹为快,有统计图的大合照。后面3节,是画统计图之前的准备,如同前奏曲,因3节中都含有“好”字,不妨笑称为“三好曲”。

要画好统计图,为什么要先画好统计表?面对若干统计图,面对一张统计表,怎样选择统计图?怎样选择适合统计图的颜色?这3个问题,本章用后面3节内容逐个回应。

1

数据可视化的示例

数据可视化是指以图形、图像和动画等更为生动、更易于理解的方式呈现具体数据,增强数据的吸引力,诠释数据之间的关系和发展趋势,以期更好地理解和使用数据。

1950年代,随着计算机图形学的发展,人们利用计算机技术,可以在计算机屏幕上绘制出各种各样的统计图。

在数据可视化中,应用最多最广的形式,当首推统计图。

数据可视化的关键词,就是“数据”和“可视化”,这如同拆词的结果。数据可视化与两个关键词的联系,如果要用一个简单的等式来表达,就是:数据可视化=数据+可视化,这如同在玩文字游戏。不过,要完美的呈现数据可视化,却实实在在离开不开在“数据”和“可视化”上面做文章。

数据可视化的两大特点自带两大关键词的特色。

第一,数据的规范性。

数据是“统计数据”的简称,是“统计语言”的俗称。任何语言都有语法,统计语言也不例外。统计语言的启蒙课就是数据的八大要素,即时间、空间、主体、数据的名称、数据的数值、计量单位、计算方法和数据来源。因此,可视化数据时,除了计算方法可以出镜也可以不出镜,其他的数据要素必须无条件地出现在统计图中。用搜索引擎搜出的统计图,之所以有不少画得丢三落四,是不是因为数据启蒙的第一课缺失了或没学好?

第二,可视化的艺术性。

数据本身其貌不扬,置身在文山字海中也不出众。但是数据一旦可视化,一旦借助点、线、面的形状,再添上五颜六色的衬托,马上就脱颖而出,神采飞扬,成为众所瞩目的对象。选择怎样的形状呈现数据的大小,这就需要了解数据的类型;选择怎样的颜色为数据的出场添彩,这就需要有独到的艺术眼光。

显然,数据可视化的中心思想就是:科学的数据可以艺术化的表达,要规范也要艺术。

下面展示几款经典的统计图,看一看可视化数据游走的模样,示例如表2-1所示。

表2-1 统计图是数据的形象大使

表2-1呈现的9款经典统计图,在本书第5章到第13章“玩转统计图”的开篇有相关说明。

这些国际名图,做起来挺费劲的,咱先不看那么远,下一课我们来合计个事:拿到数据,怎么挑选统计图形式。

往期回顾

第一天

数据语言,没听说?

1.1 数据语言的8个要素

1.3 这张统计图画得怎么样

下期预告

第二天

一图胜千言的证明

1.4 一图胜千言的一个示例

2.1 数据可视化的示例

第三天

统计图形,怎么挑?

2.2 画统计图的准备1:选好统计表

2.3 画统计图的准备2:选好统计图形

第四天

空姐出镜,话柱线图

7.1 柱线图简介

7.2 柱线图的画法(看视频)

第五天

技巧误区,怎么看?

7.3 柱线图的技巧

7.4 画柱线图的误区

第六天

商务图表,点点评

16.2 英国《经济学人》杂志中的统计图

16.3 美国《商业周刊》杂志中的统计图

第七天

扫一扫,看美视频

18.4 故事4:从统计图看拿破仑的博罗季诺之战(看视频)

第八天

来挑战吧,你也行

19.3 畅想3:用“手机法”画统计图

03

参考书籍

完美统计图——Word/PPT/Excel数据可视化宝典》

ISBN:978-7-302-57248-1

作者:邓力、韩际平、潘璠

定价:108元

04

精彩推荐

  • 人工智能经典案例 | 有经纪人的交易

  • 为什么选择HarmonyOS

  • 人工智能经典案例 | 九宫格游戏

  • 人工智能经典案例 | Shakey世界

  • 鸿蒙开发实例|构建轻量级智能穿戴设备用户界面

  • CCF CSP-J/S第一轮认证必考知识点:回溯算法

  • CCF CSP-J/S第一轮认证必考知识点:二值图像的最大连通块

  • CCF CSP-J/S第一轮认证必考知识点:哥德巴赫猜想

  • CCF CSP-J/S第一轮认证考纲详解

  • Python 韩信点兵思政案例(含优惠码)

  • 机器学习案例︱人脸识别和人脸检测(附视频)

  • Python ︱爬取天气预报信息(附视频)

  • 《机器学习》实验指导书(附实验参考+代码)

  • Python爬虫综合实战 │ 创建云起书院爬虫(附代码)

  • Python爬虫实战 │ Email提醒(附代码)

  • Python深度学习 │一文掌握卷积神经网络

主营产品:消防电源模块,浪涌保护器,电气火灾探测器