为什么你有时需要打破数据viz的规则

最佳实践有助于我们避免数据可视化中的常见陷阱 - 但我们不应该盲目地跟随它们

很容易可视化数据严重。选择错误的图表类型,省略标签或过载图形,您可以快速结束令人困惑,误导或无法讲故事的东西。

为了打击这种罪行,随着数据可视化领域已经成熟,许多最佳实践被涌现。从转向饼图的转向来摆脱“ChartJunk”,这些是涉及Data Viz的人应该先学习的约定。

但有时,利用经验重新审视我们早期所学的东西是有帮助的。在我进行数据可视化的六年中,我发现固执地坚持“规则”有时会阻碍有效的视觉传达。很容易陷入下面的技术性问题中,而忽略了实际情况作品.

麻烦的是,最好的做法往往有很少的细微差别,有时候他们可能是无关紧要的,或者值得破坏的成本。自加入以来经济学家我自己破坏了很多人。但如果你要做同样的事情,那么了解他们首先成为拇指规则的原因有助于。正如旧的谚语所说,你必须在打破它们之前了解规则。

考虑到这一点,借助经济学家s存档,我已经重新检查了五件事,当我第一次开始在数据可视化时,我没有做。

1:不要打破y轴比例

经济学家偶尔会从读者那里获得关于图表的读者的投诉,其中数值轴不会以零开始。难怪他们被怀疑对待。截断的轴可能导致较小的差异显得更大,或者提高或下降看起来更加戏剧性。误导使用破碎的鳞片 - 特别是政治运动- 给予了缺乏声誉的轴。但有时数据之间的小变化很重要,你需要限制图表的范围,以使故事可见:

图表:超级骑士的填补习惯,轴破
图表:超级骑士的填补习惯,轴破
原始图表
与不间断轴相同的图表
与不间断轴相同的图表
与不间断轴相同的图表

在这个图表中,我造成了超级骑手的尖端习惯,从归零开始掩藏故事,因为差异 - 虽然重要 - 小而不接近零。有必要打破轴以显示这些差异。在经济学家除了索引图表之外,我们始终使用符号签署破碎的秤:

索引折线图:病毒爆发对航空业的影响
索引折线图:病毒爆发对航空业的影响
以100为基线 索引图表 所以不需要破碎的秤图标

在制作条形图或列图表时,您不应该打破轴的一次,因为它会破坏矩形尺寸与数据之间的关系。

突破条形图轴,比较经济学家的旧和现代风格
突破条形图轴,比较经济学家的旧和现代风格
在我们的现代风格(右,从2019年起)中,当我们打破数值轴时,我们使用温度计图表而不是条形图(左,从2006年起)

2:不要去3d

3D列图
3D列图
你能准确解读吗?我不能。来源:WTF Viz公司

自从Microsoft Excel推出了一千个3D饼图以来,在商务会议中,3D图表一直是最具邪恶的数据可视化。有两种类型的3D可视化:第三维用于描绘第三变量的那个,以及其它纯粹化妆品的其他。装饰3d是特别皱起眉头由于不必要地扭曲数据以多种方式:透视导致更近的项目出现较大,并且使用卷以表示单个变量放大较大数据点的外观。

使用3D描绘三个变量,而稍微合理,通常会导致难以解释的图表。并且对于静态图表,不可能选择提供一个目标视图的角度 - 无论您查看它,哪个元素都会超过其他元素。例如,最好找到以泡沫大小显示第三个变量的另一种方式:

泡泡图:GDP与生育,2017年
泡泡图:GDP与生育,2017年
2D中的三个变量

但3D可以很好地工作某些情况下.在以下可视化中《经济学人》图形细节部分,我们使用了一系列立方体来展示北极海冰的相对体积变化:

图形细节:数据可视化和北极海冰的地图
图形细节:数据可视化和北极海冰的地图
北极海冰的相对体积变化,如三个冰块 (右上)

我想我们逃脱了使用3D违反“公约”,因为:

  • 有一个很好的理由去三维,因为我们想表示的东西,实际上有三维
  • 我们使用了等距投影-它缺乏透视-所以在前景和背景元素之间没有失真
  • 我们直接标记了数据,而不是使用比例更加难以读取。
  • 较小的元素放在前面,所以尽可能少的被遮挡

3D也可以更好地工作在可视化的动画或动画交互式,因为您不限于一个视图。

3:摆脱“ChartJunk”以最大限度地提高数据墨水比率

“图表垃圾”一词是由统计学家爱德华·塔夫特(Edward Tufte)创造的,用来描述图表上任何对解释图表不重要的东西。塔夫特认为插图和花哨的字体是一种不受欢迎的干扰:

“装饰性的装饰,经常扭曲数据,永远无法挽回潜在的内容不足。如果这些数字很无聊,那你就错了。”

“图形上的每一点墨水都需要一个理由。几乎所有的原因都应该是墨水呈现出新的信息”

Edward TUFTE,1983年的定量信息视觉显示

塔夫特可能不会赞同这张1997年版《经济学人》图表中的漫画。或者阴影。或是被打破的鳞片…

TUFTE的思想有助于提示转向数据可视化的最小主义,这些数据可视化仍然有影响力。这可能是我学到的第一个规则之一。但是有一些推回剥离图表回到他们的裸体骨骼,包括从数据可视化顾问Alberto Cairo。

“......在时间序列图表中的网格线,或识别图表讨论的主题的不引人注目和微妙的图标 - 可能根本不是垃圾。远离理解的障碍,他们可以提高理解。”

功能艺术

A.学习2010年,他还质疑了一种完全极简主义的图表设计方法,此前他发现,经过更多修饰的图表更容易被人记住,而且解释得也更好。其他从2015年发现,具有额外的“冗余”标签的图表 - 重申了可视化的主要趋势 - 更好地了解,而具有图标的图表更好地召回。难怪大多数信息设计师都不遵循塔菲特对这封信的建议。

虽然我喜欢分类图表,但我也想帮助读者。多余的装饰和额外的视觉元素是有区别的,它们为主题提供线索或加强关键发现。有点牵手没什么错,尤其是在一个有挑战性的课题上。

在我下面制作的密度图中,标签“更快地说出”并更快地传送信息“在字幕中已经给出的重复信息。在TUFTE的定义下,他们将被视为“垃圾”,因为它们没有呈现新信息 - 但他们帮助观众更快地了解轴。

密度图:选定语言的音节速率和信息速率
密度图:选定语言的音节速率和信息速率
为什么有些语言说得比其他语言快?

我在香港闹鬼的房子做过另一个图表可能没有需要香港塔楼的插图,但信息图表在视觉上更有趣,它们可以让你一目了然地识别主题。

一个温度计图表,与插图可以被视为'chartjunk'
一个温度计图表,与插图可以被视为'chartjunk'
鬼屋对房地产市场产生了寒蝉效应

4:使用少于七种颜色

颜色过多的平行坐标图
颜色过多的平行坐标图
大量颜色=混乱的负荷。来源:WTF Viz公司

虽然确切的数字变化有些有所不同,但有一般性共识,即在分类色标中使用太多颜色是一个坏主意。我们的眼睛并不擅长区分细微差异色调与其他可视化的数据描述方法相比。如果你用了很多颜色,很难一眼就知道是怎么回事,而且类似的颜色类别可能会被误读,特别是如果颜色区域很小(例如,一条细线)。

它往往有点凌乱。使用有限的调色板可以看起来更清晰,更醒目,特别是当在整个信息图表或数据仪表板中始终使用时。

那么,如果你的数据有很多类别,你该怎么办呢?您可以使用另一种可视化方法来显示分组,例如标签或将相关元素彼此相邻放置。另一种解决方案是通过创建“其他”分组来限制类别的数量:

英国政党持有的议会席位步
英国政党持有的议会席位步
使用“其他”类别使得图表更少嘈杂,并将重点放在两个主要方面。从 2019年12月13日

如果你有许多相关的类别,使用相同色调的不同色调也可以使设计看起来更干净。

使用相同色调的不同色调的折线图
使用相同色调的不同色调的折线图
类似于这样的色调更好地标记为直接标记。从 2019年11月14日

但是,如果你仍然需要使用大量的颜色有各种各样的设计技巧,你可以使用,使你的视觉更容易阅读。从以下考虑《经济学人》图案细节页:

数据可视化:反欧盟政党聚集在理想的极端
数据可视化:反欧盟政党聚集在理想的极端
中间派自由主义者在欧盟议会中获得了最大的权力

这张图表用九种颜色。我认为它能逃脱惩罚是因为:

  • 类别毗邻组,因此您无需匹配图例中的颜色以解释图表。删除额外的解释步骤也允许更快地阅读图表。
  • 形状有助于加强分组
  • 彩色区域覆盖了相对较大的区域,并使用了足够明显的色调

对于某些类型的图表,使用更多的颜色也比较容易,比如这个,因为:

  • 这里的颜色已应用于较小的区域,但是由于每个颜色仅用于一种形状,这与界图的问题较少。您不依赖于颜色来识别在上面的泡沫分散时识别一组许多不同的形状
  • 选择颜色时,请注意,以确保它们在互相交叉时容易遵循它们。微妙的白轮廓也有助于区分每条线
  • 同样,分类是直接标注的,因此正确匹配颜色对阅读图表来说不是必要的

5:避免使用红色和绿色的颜色鳞片

一个在12男人有色盲,最常见的形式是红绿色盲目(氘鸭)。因此,我被教导避免创建使用红色和绿色的数据的可视化。而这肯定是使您的可视化更可访问的良好起点。

但有时很难避免特定的颜色选择。例如,使用与特定政党相关的主要颜色以外的任何东西可能会使读者混淆。在英国,这意味着使用红色的劳动和绿色为绿党。幸运的是,有可达的红色和绿色组合:

用Deuteranopia的色盲模拟器测试经济学家的图表颜色方案
用Deuteranopia的色盲模拟器测试经济学家的图表颜色方案
红色和青色经济学家图表颜色方案对于Deuteranopia的人来说还可以(右侧模拟)

“红”和“绿”是模糊的,有些主观的范畴。在这里,图表使用了一种蓝绿色的阴影,它位于我所说的绿色的更蓝的一端。这个色盲模拟器表明,与这种红色的阴影一起使用很好。

用德国夜蛾色盲模拟机测试修订的图表配色方案
用德国夜蛾色盲模拟机测试修订的图表配色方案

当我把色调调整为草绿色时,它们看起来更相似,但仍然可以区分。为什么?因为绿色的阴影比较浅,不太饱和。红绿色盲的人仍然能分辨出浅绿色和深红色的区别。玩弄色调、饱和度和明度可以帮助你找到可分辨的色调。

另一种避免使用红色和绿色的方法是,通过使用图标或标签等其他元素,或为元素添加微妙的轮廓(见上文),确保颜色对理解视觉效果不是必需的。就我个人而言,我认为避免过多地依赖颜色是一个很好的做法,因为红色和绿色并不是色盲患者认为具有挑战性的唯一颜色组合。

我们需要最佳实践来指导我们通过众多决定进行可视化。但是,每个数据可视化都具有自己独特的设计挑战,而这些规则 - 这通常是一种广泛的主题的简化 - 可能无法在每种情况下工作。如果它使我们的可视化更清晰或更多的吸引力,我们不应该害怕打破它们。巧妙的规则弯曲 - 如在其他设计领域 - 可能导致我们最具创造力的工作。

也就是说,还有一些规则,我还没有找到打破的充分理由:

  • 饼图:对于我来说,作为一个单独的堆积条形图或另一种图表类型总是更好的,尽管有些人觉得当只显示几个度量值时它们是合理的
  • 彩虹序列色阶:并且无法访问,亮度的突然变化创造“假边界”
  • 吹气效果:判断地区和比较元素更难

如果你知道违反这些规则的一个好理由,或者你能想到任何其他的案例,我很乐意听听。

罗萨蒙德珍珠是一个视觉数据记者经济学家.您可以遵循经济学家数据团队的工作推特.

经济学家

关于国际新闻,政治的见解和意见......

谢谢玛丽塞格尔.

罗萨蒙德珍珠

作者

经济学家的视觉数据记者

经济学家

国际新闻,政治,商业,金融,科学,技术,书籍和艺术的见解和意见

罗萨蒙德珍珠

作者

经济学家的视觉数据记者

经济学家

国际新闻,政治,商业,金融,科学,技术,书籍和艺术的见解和意见

中等的是一个开放的平台,17亿读者来寻找洞察力和动态的思维。在这里,专家和未被发现的声音相似地潜入任何主题的核心,并将新的想法带到表面上。学到更多

关注作者、出版物和与你相关的主题,你会在主页和收件箱中看到它们。探索

如果您有一个故事来讲述,知识分享,或者提供提供的视角 - 欢迎回家。很容易和免费发布您对任何主题的思考。写在中等的

获取媒体应用程序

一个按钮,称“在App Store上下载”,如果点击它将导致您到iOS App Store
一个按钮说'获得它,Google Play',如果点击它将导致您进入Google Play商店