GIS란 Geographic Information System의 약자로 단순히 번역하자면 공간정보시스템을 뜻한다. 쉽게 이해하자면 말 그대로 ‘공간’ 에 대한 데이터를 가지고 있다. 먼저 아래의 설명으로 이해를 해보도록 하자.

GIS데이터의 구조

GIS데이터는 두개의 데이터를 담고있다. 첫 번째는 공간데이터이고 두 번째는 속성데이터이다. 그리고 공간데이터는 다시 vector데이터와 raster데이터로 나누어진다.

Vector 데이터?

이번 주제에서 분석을 다룰 데이터로써 x와 y의 좌표로 이루어진 데이터이다. vector 데이터는 point(점), line(선), polygon(면) 세 종류로 이루어진다. 점은 x와 y의 순서쌍으로 나타나며 주로 POI(point of interest), 버스정류장, 교차로등을 나타내는데 쓰인다. 선의 경우 점들의 집합으로써 도로, 철도등을 나타내는데 쓰이며 면은 3개 이상의 선분으로 이루어지며 시작점과 끝점이 같은 경우를 뜻한다.(polygon은 수학에서 다각형이라는 뜻이며 그렇게 이해하면 편하다.)

정말 쉽게 예를 들자면 네이버 지도를 생각하면 된다.
아래의 지도를 보면 세븐일레븐, GS25, 황제참치, 버스정류장 등은 POI데이터로써 점으로 표현되어 있고 지하철노선은 선데이터, 그 외 건물들이 면데이터라고 이해하면 된다.

R에서는 흔히 sf객체와 sp객체 두개를 이용하여 data를 다루게 된다.

Raster 데이터?

raster데이터는 셀 혹은 픽셀 단위로 이루어진 데이터이며 고도, 습도, 온도등의 연속데이터를 저장하는데 용이하다. 하지만 픽셀단위로 이루어진 데이터이기 때문에 크게 확대하면 깨진다는 단점이 있다.(컴퓨터에서 사진을 그림판으로 연 뒤에 확대하면 깨지는 것을 생각하면 된다)

속성데이터

공간데이터는 ‘위치’ 를 나타낸다면 속성데이터는 공간데이터가 나타내는 위치가 어떠한 위치인지를 나타내는 데이터이다. 위의 네이버지도에서 예를 들자면 위의 지도에서 나타나는 POI ‘위치’ 는 공간데이터가 나타낸다고 하면 이러한 POI가 ‘버스정류장’ 혹은 ‘세븐일레븐’ 이라고 표현해주는 것은 속성데이터이다.

간단하게 GIS데이터가 어떠한 데이터인지 알아보았다. 설명이 조금 미흡한것 같아 실제로 데이터를 다루는 동안 실제 데이터를 이용하여 부연설명을 추가할 예정이다. 다음에는 간단하게 좌표계에 대하여 알아보도록 하자.

--

--