《用数据讲故事》读书笔记
Contents
本书最精彩的地方就是书里面提供的案例,循序渐进的一步步优化一个杂乱的图表:除去杂乱的图示,将次要的信息融入背景,突出重点关注的数据,顺着视觉移动,将需要传递的信息展现给受众。
数据沟通是从准备到展示的整个过程,其上下文通常包括需要解释的对象、内容和方式。
对象
你在跟谁沟通?沟通的第一步是明确沟通对象,细分清楚人群,再分析该群体对你的信任程度。在此基础上,你才能确定沟通目标、信息量。在《Resonate: Present Visual Stories That Transform Audiences》这本书中推荐了将受众视为主人公,并针对了解受众、划分受众、建立共识提出了具体的策略,关于沟通对象分析具体可参考该书。
内容
你需要受众了解或者做什么?在沟通过程中,你每时每刻都需要有个目标,并希望受众了解或者完成它。反过来,对受众来说,沟通要对他有意义。此时,需要你是最了解这个主题和这些数据的专家,需要从一开始就提出建设性建议,明确希望受众采取的行动,而不是让受众一看即过。如果不适合针对行为提出明确的建议,可以发起讨论。
方式
明确了沟通的对象和内容,那解释数据这件事就被约束在一个有明确边界的题解之中,迭代次数大大减小。此时,我们可以像做题一样去解决它,这个问题可能是:有什么数据可以用来表达观点?
沟通方式需要同时有数据和故事,故事展现具体的情境,能让受众更容易产生共鸣,而数据使得故事更加真实可信。
图表选择
常用数据可视化图表:
- 简单文本:只有一两项数据
- 表格:需要展示多个兴趣点(不同受众),采用不同计量单位的情况使用
- 热力图:表格的特例
- 散点图:常用于科学领域,探索性分析
- 折线图:绘制连续数据
- 斜率图:折线图的特例,用于两组或两个时段数据的对比
- 竖直条形图:用于比较大小,人们会自觉去对齐条形图末端;水平条形图比竖直条形图更易阅读
- 堆叠竖直条形图:展示不同类别间整体或者子成分的比较;堆叠水平条形图比堆叠竖直条形图更易阅读
- 瀑布图:用于抽离出堆叠条形图中的一部分进行重点关注,或者展示起点和结果以及其中的升降变化
- 方形面积图:一般避免使用,人眼不擅长在二维空间进行定量度量,除非相差极大的数值的比较
- 3D图表:永远别用,比例失真
- 饼图:不建议使用,人眼不易度量
- 双Y轴:重点不容易突出,可用变体替代
设计原则:突出焦点,一致风格,层次清晰
利用格式塔原则建立秩序
- 临近原则:物理上临近的个体属于一个群体
- 相似原则:颜色、形状、大小、方向相关的个体被视为一个群体
- 包围原则:物理上被包围在一起的个体属于同一个群体
- 闭合原则:分散的个体容易被大脑中已有的模式识别为一个群体
- 连续原则:人眼倾向于寻找平稳的路径并自然创造出连续性
- 连接原则:物理上连接在一起的个人被视为一个群体
利用布局和格式划分层次
- 对齐:建立横向和纵向的界限
- 留白:利用停顿增加回味的时间
- 简约:减少展示的图示,减少信息量,减少信息加工,例如将标签直接标记在图形上
- 层次感:将无用的边框、网格、节点去掉,将不重要的坐标轴、次要数据融于背景
利用前注意(形象记忆)属性聚焦重点
- 之字顺序:按「之」字的阅读顺序排列内容
- 独特标示:任何字体、颜色、边框、位移的变化都会吸引更多的注意
- 绑定解释:针对前注意属性聚焦的数据,在标题或者下一个注意的位置展示解释文字
- 无障碍:考虑8%男性红绿色盲和黑白打印的情形
其他资源
- eagereyes – Visualization and Visual Communication 包含关于数据可视化和图表讲故事的深刻思考
- FlowingData 数据可视化示例
- Junk Charts 关注如何绘制图表和改进
- Home - Visualising Data 每月「网络最佳图表」资源列表
- VizWiz 数据可视化最佳实践、改进现有作品的方法
- WTF Visualizations 数据可视化的反例