블로그 Hyndsight 를 운영하는 모나쉬 대학의 통계학자 로브 힌드맨은 좋은 그래프를 그리는 데 필요한 스무가지 규칙을 자신의 블로그에 정리했습니다.
- Eps 나 pdf 와 같은 벡터 그래픽 포맷을 사용하세요. 그래야 확대했을 때 보기싫지 않습니다. jpeg, bmp, png 포맷은 좋지 않습니다. 특히 jpeg 는 사진을 위해 만들어진 포맷으로 그래프와는 맞지 않습니다. (하지만 데이터 포인트가 10,000개 이상일 경우 벡터그래픽 포맷으로는 화일의 크기가 수십메가에 달할 수 있습니다. 이때에는 png 화일을 쓰는 것이 좋습니다.)
- 글자의 크기에 유념해야 합니다. 헬베티카나 아리엘 같은 산세리프가 좋습니다. 인쇄될 때 글자의 크기가 어떻게 될지를 생각해야 합니다.
- Legends(각 데이터에 대한 설명이 있는 작은 사각형 박스)를 사용하기 보다는 그 데이터 라인에 직접 이름을 다는 것이 좋습니다.
- Legends 를 꼭 배치해야 한다면 그래프 내부의 비어있는 영역에 배치해야 합니다
- 배경을 어둡게 만드는 것은 좋지 않습니다. 엑셀 프로그램은 기본적으로 배경을 어둡게 칠하는데, 이것은 인쇄되었을 때 보기에 좋지 않습니다.
- 역시 엑셀 프로그램의 그래프에 기본적으로 등장하는 진한 격자선을 피해야 합니다. 격자선은 유용하지만, 충분히 연해야 합니다.
- 각 x,y 축의 시작점과 끝점을 합리적으로 정하세요. 꼭 0을 포함할 필요는 없습니다. 여백이 너무 많지 않도록 정해야 합니다.
- 각 축의 척도(scale)를 주의해야 합니다. 엑셀은 때때로 x 축을 숫자가 아닌 항목으로 인식하고 제대로 비율을 유지하지 않으므로 이를 주의해야 합니다.
- 각 축에는 단위를 항상 표기해야 합니다.
- 각 축의 숫자들은 딱 떨어진 숫자들이 좋습니다. 어떤 프로그램은 매우 긴 숫자(예를 들어 2.0140922 등)를 표시하는 경우가 있습니다.
- 각 축이 무엇을 나타내는지 역시 표기되어야 합니다.
- 선의 굵기에 신경써야 합니다. 1포인트 선은 그래프 크기를 줄였을 때 사라지기도 합니다.
- 글자나 설명이 그래프의 요소 위에 겹치는 것은 좋지 않습니다.
- 투프트 원칙(Tufte’s principle)을 따라 필요없는 요소들을 지우고 데이터-잉크 비율을 높여야 합니다.
- 그래프와 캡션만으로도 내용을 이해할 수 있어야 합니다. 그래프의 설명을 본문에서 다시 찾지 않도록, 캡션에는 그래프에 대한 설명이 있어야 합니다.
- 가로 세로 비가 상식적이어야 합니다. 많은 경우 1.6:1 이 적절합니다.
- 최종 인쇄될 단계에 맞는 가로 세로 비로 그래프를 준비해야, 글자가 눌리지 않게 됩니다.
- 데이터의 종류에 따라 선을 이을 것인지, 점을 찍을 것인지를 구분해야 합니다.
- 만약 두 그래프가 비교대상이라면 축의 척도를 같게 해야 합니다. 가능하면 하나의 그래프에 두 데이터를 나타내는 것이 좋습니다.
- 파이-차트(원을 각도에 따라 나눈 그래프)를 피해야 합니다. 특히 3D 파이-차트는 더 나쁩니다. 최악은 3D 파이-차트에서 각 부채꼴들이 분리된 모양의 그래프입니다. 나는 학생들이그 그래프를 그려올 때 마다 즉시 “실패”를 외칩니다.
(Hyndsight)
원문 보기