Seaborn
Seaborn은 파이썬의 시각화 라이브러리 중 하나로, Matplotlib을 기반으로 만들어진 통계 데이터 시각화 패키지다. Matplotlib의 기능을 확장하여 통계 데이터를 보다 쉽게 시각화할 수 있도록 고급 기능과 스타일을 제공한다.
통계적 분석에 유용한 다양한 시각화 기능을 제공한다. 예를 들어 산점도, 히스토그램, 상자 그림, 히트맵, 선 그래프 등을 그릴 수 있다.

이런 데이터프라임이 있다고 가정한다.
countplot
Seaborn 라이브러리에서 제공하는 함수 중 하나로, 카테고리형 변수의 빈도수를 시각화하는 데 사용된다. countplot은 주어진 데이터에서 각 카테고리 값의 개수를 세어 막대 그래프로 나타낸다다.
sb.countplot(data = df, x='generation_id')
# 그래프 출력
plt.show()

'generation_id' 의 사용 빈도에 따른 막대그래프가 출력된다
regplot
Seaborn 라이브러리에서 제공하는 함수 중 하나로, 두 변수 간의 관계를 시각화하는 데 사용됩된다. 주로 산점도와 선형 회귀 선을 함께 그려주어 두 변수 간의 선형 관계를 확인할 때 유용하다.

sb.regplot(data= df, x='displ', y='comb')
#그래프 출력
plt.show()

x 는 'duspl' y는 comb로 이루어진 산점도와 선형 회귀선이 출력된다. .
이 선은 주어진 데이터에 대해 최적의 선형 모델을 나타낸다. 즉, 주어진 독립 변수에 대한 종속 변수의 예측값을 나타내는 선이다.
Heat Maps
데이터의 특성을 색상으로 나타내는 시각화 기법 중 하나이다. 2차원 그리드로 구성된 데이터를 색상으로 표현하여 데이터의 패턴을 시각적으로 파악할 수 있다. 주로 행렬 형태의 데이터를 표현할 때 사용되며, 데이터의 밀도와 패턴을 직관적으로 이해할 수 있도록 도와준다.
plt.hist2d(data= df, x='displ', y='comb')
#그래프 출력
plt.show()

이상태로는 가독성이 안좋아서 데이터를 확인하기 어려우니 그래프를 꾸며서 가독성이 좋아지게 하겠다.
plt.hist2d(data= df, x='displ', y='comb',cmin = 0.5, cmap= 'viridis_r')
plt.colorbar()
plt.show()

- cmin:
- cmin은 컬러맵에 플로팅되는 셀의 최소 값입니다.
- 이 값보다 적은 빈도수를 가진 셀은 플로팅되지 않습니다.
- 즉, 히스토그램에서 특정 구간의 빈도수가 cmin보다 작으면 해당 셀은 플로팅되지 않습니다.
- cmap:
- cmap은 컬러 맵(colormap)을 지정하는 매개변수입니다.
- 컬러 맵은 데이터 값과 색상 간의 대응 관계를 정의하는데 사용됩니다.
- 여러 종류의 컬러 맵이 있으며, 각각의 컬러 맵은 데이터의 특성에 따라 적합한 색상을 제공합니다.
- colorbar:
- colorbar는 컬러 바를 플로팅하는 함수입니다.
- 히스토그램의 색상과 데이터 값의 대응 관계를 시각적으로 보여줍니다.
- 컬러 바는 히스토그램의 색상 맵과 함께 사용되어 데이터의 분포를 이해하는 데 도움이 됩니다.
'Python > Matplotlib' 카테고리의 다른 글
| [Python] Matplotlib 그래프, 차트 (plot(), scatter(), bar(), hist()) 데이터 시각화 (0) | 2024.04.11 |
|---|