데이터 사이언스

[데이터 사이언스] Seaborn 으로 샘플 데이터셋 가져오기

판다의 삶 2021. 4. 24. 17:59
728x90

파이썬 Seaborn 패키지는 데이터 로딩이나 랭글링 작업에 소요되는 시간과 모듈 활용 시 혼동을 줄이기 위해 패키지 차원에서 샘플 데이터셋을 제공한다. 특정 함수가 호출되면 연결된 온라인 레포지토리에서 데이터를 가져 오기 때문에 인터넷 연결이 필요하다.

 

1. Seaborn 패키지 불러오기

import seaborn as sns

 

2. 샘플 데이터셋 목록 확인하기

dataset_names = sns.get_dataset_names()

작성일 기준 샘플 데이터 목록

 

3. 샘플 데이터셋 가져오기

2.에서 확인한 샘플 데이터셋 명을 인자로 함수를 호출하면 데이터를 가져올 수 있다.

diamonds = sns.load_dataset('diamonds') # 다이아몬드 데이터셋

다이아몬드 데이터셋

 

+ 원본 데이터셋이 업로드되어 있는 온라인 레포지토리 

github.com/mwaskom/seaborn-data

 

mwaskom/seaborn-data

Data repository for seaborn examples. Contribute to mwaskom/seaborn-data development by creating an account on GitHub.

github.com

 

 

 

728x90