본문 바로가기
Python/Matplotlib

[Python] seaborn 데이터 그래프 출력(countplot,regplot, Heat Maps )

by 코끼리똥11 2024. 4. 11.

Seaborn

Seaborn은 파이썬의 시각화 라이브러리 중 하나로, Matplotlib을 기반으로 만들어진 통계 데이터 시각화 패키지다. Matplotlib의 기능을 확장하여 통계 데이터를 보다 쉽게 시각화할 수 있도록 고급 기능과 스타일을 제공한다.

통계적 분석에 유용한 다양한 시각화 기능을 제공한다. 예를 들어 산점도, 히스토그램, 상자 그림, 히트맵, 선 그래프 등을 그릴 수 있다.

 

변수명 : df

이런 데이터프라임이 있다고 가정한다.

countplot 

Seaborn 라이브러리에서 제공하는 함수 중 하나로, 카테고리형 변수의 빈도수를 시각화하는 데 사용된다. countplot은 주어진 데이터에서 각 카테고리 값의 개수를 세어 막대 그래프로 나타낸다다.

sb.countplot(data = df, x='generation_id')

# 그래프 출력
plt.show()

'generation_id' 의 사용 빈도에 따른 막대그래프가 출력된다

 

regplot

Seaborn 라이브러리에서 제공하는 함수 중 하나로, 두 변수 간의 관계를 시각화하는 데 사용됩된다. 주로 산점도와 선형 회귀 선을 함께 그려주어 두 변수 간의 선형 관계를 확인할 때 유용하다.

 

변수명 : df

sb.regplot(data= df, x='displ', y='comb')

#그래프 출력
plt.show()

 

x 는 'duspl' y는 comb로 이루어진 산점도와 선형 회귀선이 출력된다. .

이 선은 주어진 데이터에 대해 최적의 선형 모델을 나타낸다. 즉, 주어진 독립 변수에 대한 종속 변수의 예측값을 나타내는 선이다.

 

Heat Maps

데이터의 특성을 색상으로 나타내는 시각화 기법 중 하나이다. 2차원 그리드로 구성된 데이터를 색상으로 표현하여 데이터의 패턴을 시각적으로 파악할 수 있다. 주로 행렬 형태의 데이터를 표현할 때 사용되며, 데이터의 밀도와 패턴을 직관적으로 이해할 수 있도록 도와준다.

plt.hist2d(data= df, x='displ', y='comb')

#그래프 출력
plt.show()

이상태로는 가독성이 안좋아서 데이터를 확인하기 어려우니 그래프를 꾸며서 가독성이 좋아지게 하겠다.

plt.hist2d(data= df, x='displ', y='comb',cmin = 0.5, cmap= 'viridis_r')
plt.colorbar()
plt.show()

  1. cmin:
    • cmin은 컬러맵에 플로팅되는 셀의 최소 값입니다.
    • 이 값보다 적은 빈도수를 가진 셀은 플로팅되지 않습니다.
    • 즉, 히스토그램에서 특정 구간의 빈도수가 cmin보다 작으면 해당 셀은 플로팅되지 않습니다.
  2. cmap:
    • cmap은 컬러 맵(colormap)을 지정하는 매개변수입니다.
    • 컬러 맵은 데이터 값과 색상 간의 대응 관계를 정의하는데 사용됩니다.
    • 여러 종류의 컬러 맵이 있으며, 각각의 컬러 맵은 데이터의 특성에 따라 적합한 색상을 제공합니다.
  3. colorbar:
    • colorbar는 컬러 바를 플로팅하는 함수입니다.
    • 히스토그램의 색상과 데이터 값의 대응 관계를 시각적으로 보여줍니다.
    • 컬러 바는 히스토그램의 색상 맵과 함께 사용되어 데이터의 분포를 이해하는 데 도움이 됩니다.