본문 바로가기
Python/Project

[Python]Pandas 예제. (unique, apply , groupby)

by 코끼리똥11 2024. 4. 8.
  1. unique():
    • unique() 메서드는 pandas의 시리즈(Series) 객체에 적용되며, 시리즈에 있는 고유한 값들을 반환한다.
    • 주어진 시리즈에서 중복되지 않는 값을 찾아 반환한다.

df라는 DataFrame이 있다.

 

나라를 중복되지 않도록 가져와서 countries 변수에 저장하고, 화면에 출력해보자.

countries= df['country'].unique()

country에 있는 나라를 중복하지않고 모두 출력 가능하다.

  1. apply():
    • apply() 메서드는 pandas의 데이터프레임(DataFrame)이나 시리즈(Series) 객체에 적용되며, 주어진 함수를 각 행(axis=0) 또는 열(axis=1)에 적용한다.
    • 사용자가 정의한 함수를 사용하여 데이터프레임의 각 요소나 행, 열에 함수를 적용할 수 있습니다.

별점 시스템을 만들려고 한다. 별점은 1,2,3 즉 3개로 만들것이다.

포인트가 95점 이상이면 3점, 85점 이상이면 2점, 나머지는 1점으로 할 것이다.

리뷰데이터를 통해 각 데이터의 별점을 구하라.

def get_group(points):
    if points >=95:
        return '★★★'
    elif points >= 85:
        return '★★'
    else :
        return '★'

 

점수에따라 별의 갯수를 출력하는 함수를 만들어준다.

  1. groupby():
    • groupby() 메서드는 pandas의 데이터프레임(DataFrame) 객체에 적용되며, 특정 열을 기준으로 그룹을 형성합니다.
    • 그룹별로 계산을 수행하거나, 그룹별로 연산을 적용할 때 사용됩니다.
    • groupby() 메서드를 사용한 후에는 집계 함수(예: sum(), mean(), count() 등)를 적용하여 그룹별 통계를 계산할 수 있습니다.
    • 예를 들어, df.groupby('column').mean()은 'column' 열을 기준으로 그룹을 형성한 후, 각 그룹의 평균을 계산합니다.