데이터 사이언스

[데이터 분석] 서울에서 면적 대비 카페가 가장 많은 동은?

판다의 삶 2020. 5. 5. 12:35
728x90

서울에서 면적 대비 카페가 가장 많은 동은 어디일까?

 

1. 주제 선정

 

한국의 카페 시장은 포화상태에 이르렀다. 전국에 7만1000여 곳의 커피 전문점이 영업 중인 가운데 지난 한 해 카페 창업 건수는 1만4000개, 폐업 건수는 9000개 수준으로 폐업 건수보다 창업 건수가 많은 상황이 지속되고 있다. 실제로 ‘한 집 건너 카페’라는 말처럼 한 골목에서 여러 카페가 함께 영업하고 있거나 심지어 한 건물에서 두세 개의 카페가 영업하고 있는 상황을 종종 목격할 수 있었다. 이에 다른 지역보다 카페가 상대적으로 많이 분포되어 있는 서울에서 각 법정동의 면적 대비 카페가 가장 많은 동은 어디일까라는 궁금증을 가지게 되어 데이터 분석을 통해 이를 알아보고자 하였다.

 

(참고: 한집 건너 카페..커피숍사업자 1년새 19%↑ '포화상태',

    지난해 커피전문점 창업 1만4천개·폐업 9천개, 10곳 중 1곳 적자···KB 자영업 보고서)

 

 

2. 데이터 수집

 

서울에서 면적 대비 카페가 가장 많은 동을 분석하기 위해서는 서울에 있는 카페의 위치 정보와 서울의 각 법정동에 대한 면적 정보가 필요하였다.

서울에 위치한 카페 정보를 수집하기 위해 공공데이터 포털에서 제공하는 2019년 6월 기준의 소상공인시장진흥공단 상가업소정보 데이터를 활용하였다. 이 데이터는 각 상가에 대해  ‘상가업소번호', '상호명', '지점명', '상권업종대분류명', '상권업종중분류명', ‘상권업종소분류명', ‘표준산업분류명', '시도명',  '시군구명', '행정동명', '법정동명', '경도', '위도' 등의 정보를 포함하고 있다.

서울의 각 법정동에 대한 면적 정보 수집을 위해서는 서울 열린 데이터 광장에서 제공하는 서울시 토지현황 (지목별/법정동별) 통계 데이터를 활용하였다. 서울시 토지현황 (지목별/법정동별) 통계 데이터에는 2018년 기준 각 자치구와 법정동 그리고 그에 따른 면적 정보가 1㎡ 단위로 포함되어 있다.

 

(소상공인시장진흥공단 상가업소정보 출처: https://www.data.go.kr/dataset/15012005/fileData.do)

(서울시 토지현황 (지목별/법정동별) 통계 출처: https://data.seoul.go.kr/dataList/datasetView.do?infId=10582&srvType=S&serviceKind=2¤tPageNo=1

 

 

3. 데이터 분석 과정

 

(1) 데이터 분석 방법 결정

서울의 면적 대비 카페가 가장 많은 동을 분석하기 위해 소상공인시장진흥공단 상가업소정보 데이터에 포함된 서울의 카페 위치 정보를 모두 전수조사하고 법정동별로 그룹화하여 카페 수를 조사하면 가장 정확하게 법정동별 카페 수를 조사할 수 있으리라 판단하였다. 또한, 법정동별 1㎡ 단위의 면적을 사용할 경우 법정동별 면적 대비 카페 수 비율의 값이 너무 작아져 비교하기 어려울 것이라 판단하여 1㎢ 단위의 면적을 사용하기로 결정하였다. 또한, 이 과정에서 데이터를 단순히 표 형태가 아닌 그래프로 나타내어 시각화함으로써 더욱 직관적으로 데이터를 분석하고 이해할 수 있을 것이라 생각하여 데이터 시각화를 함께 진행하기로 하였다.

 

(2) 데이터 분석 과정 

데이터셋의 용량을 고려하였을 때 로컬 환경에서 데이터 분석을 진행하기에는 어려움이 있어 데이터를 Google Drive에 업로드한 후 온라인으로 데이터 분석을 진행할 수 있는 Google Colaboratory 환경을 이용하여 데이터 분석을 진행하기로 했다. 데이터 분석을 위해 Python 언어를 사용하였으며 데이터 전처리에는 Pandas 패키지를, 데이터 시각화에는 Matplotlib, Seaborn 패키지를 활용하였다.

 

먼저 Google Colaboratory 환경에서 Google Drive를 마운트하여 소상공인시장진흥공단 상가업소정보 데이터를 불러왔다. 데이터는 ‘상가업소번호’, ‘상권업종소분류명’, ‘시도명, ‘법정동명’ 등 39개의 열과 565016개의 행으로 구성되어 있었다. ‘시도명’ 열의 값 집합이 ‘서울특별시’와 ‘부산광역시’로 나타나는 것으로 보아 부산의 상가업소정보가 함께 포함되어 있음을 알 수 있었다. 그래서 데이터에서 ‘시도명’이 ‘서울특별시’이고 ‘상권업종소분류명’에 커피가 포함되는 행만 추출하여 서울 카페 데이터를 구성하였다. 서울 카페 데이터는 상가업소정보 데이터와 동일한 39개의 열과 18341개의 행으로 이루어졌다. 서울 카페 데이터를 x축을 경도, y축을 위도로 하는 산점도 그래프로 나타내어 서울의 어느 구의 어느 동에 카페가 많이 분포되어 있는지 직관적으로 알아볼 수 있도록 했다. 그리고 서울 카페 데이터를 법정동 별로 그룹화하고 각 법정동별 카페 수를 계산하여 서울 법정동별 카페 수 데이터를 만들었다.

 

다음으로 마운트된 Google Drive에서 서울시 토지현황 (지목별/법정동별) 통계 데이터를 불러왔다. 데이터에서 ‘법정동’ 열과 ‘면적’ 열을 추출한 후 1㎡ 단위를 사용하고 있는 ‘면적’ 열을 ‘면적(1제곱미터)’로 변경하고 ‘면적(1제곱킬로미터)’ 열도 추가하여 서울 법정동별 면적 데이터를 구성했다. 서울 법정동별 카페 수 데이터와 서울 법정동별 면적 데이터를 병합하여 서울 법정동별 카페 수 및 면적 데이터를 구성하였다.

 

마지막으로 서울 법정동별 카페 수 및 면적 데이터에서 ‘카페수’ 열의 값을 ‘면적(1제곱킬로미터)’로 나누어 서울의 법정동별 1㎢ 면적 대비 카페 수를 계산하여 상위 20개의 법정동을 막대그래프로 나타내었다.

 

서울 행정구역별 카페 위치 산점도 그래프 - 서울의 행정구역별 카페 위치 데이터를 x축을 경도 y축을 위도로 하고 행정구역별로 색을 달리하여 산점도 그래프로 나타내었다.
서울 법정동별 카페 수 및 면적 대비 카페 수 표 - 서울의 법정동 별 카페의 수와 1㎢ 단위 법정동별 면적 대비 카페 수를 계산하여 내림차순으로 나타내었다. 

 

(3) 데이터 분석 결과

서울의 법정동별 면적 대비 카페 수를 ‘면적(1제곱킬로미터)’ 열의 값을 기준으로 상위 20개를 추출하여 x축을 ‘법정동명’, y축을 ‘면적(1제곱킬로미터) 대비 카페 수’로 하는 막대그래프로 나타내었다. 

서울에서 법정동별 면적 대비 카페가 가장 많은 동은 신정동으로 나타났다. 수하동, 충무로1가, 청진동, 관철동 등이 그 뒤를 이었다.

서울의 법정동별 면적 대비 카페 수 그래프

 

4. 결론

 

(1) 데이터 해석

공공데이터 포털에서 제공하는 2019년 6월 기준 소상공인시장진흥공단 상가업소 데이터와 서울시 열린 데이터 광장에서 제공하는 2018년 기준 법정동별 면적 데이터를 통해 서울의 법정동별 면적 대비 카페 수가 가장 많은 동을 분석하였다. 그 결과 서울에서 1㎢ 단위 면적 대비 카페가 가장 많은 동은 1㎢당 카페 1.49개가 분포하는 신정동인 것으로 분석되었다. 이는 뒤이은 1㎢당 0.6개의 카페가 분포하는 수하동보다 약 2배 이상 많은 수치로 일반적인 아파트 평수인 30평이 약 100㎡임을 고려하면 신정동의 경우 집 10채 중 1채 이상이 카페인 것으로 이해해 볼 수 있다.

 

(2) 한계점 및 개선 방향

위 데이터 분석 결과는 오직 서울의 법정동별 면적 대비 카페 수만을 나타내기 때문에 유동 인구에 대비하여 카페가 많은 편인지 적은 편인지 나타내지 못하는 한계가 있다. 이는 서울시 열린 데이터 광장 사이트에서 제공하고 있는 유동 인구 분석 데이터가 서울의 모든 법정동이 아닌 특정 상권의 유동 인구에 대한 정보만 포함하고 있었기 때문이다. 각 법정동에 대한 유동 인구 데이터를 면적 데이터와 함께 융합하여 데이터 분석을 진행한다면 더욱 체감할 수 있고 유의미한 결과를 도출해 낼 수 있으리라 생각된다.

 

 

728x90