- unique():
- unique() 메서드는 pandas의 시리즈(Series) 객체에 적용되며, 시리즈에 있는 고유한 값들을 반환한다.
- 주어진 시리즈에서 중복되지 않는 값을 찾아 반환한다.

df라는 DataFrame이 있다.
나라를 중복되지 않도록 가져와서 countries 변수에 저장하고, 화면에 출력해보자.
countries= df['country'].unique()

country에 있는 나라를 중복하지않고 모두 출력 가능하다.
- apply():
- apply() 메서드는 pandas의 데이터프레임(DataFrame)이나 시리즈(Series) 객체에 적용되며, 주어진 함수를 각 행(axis=0) 또는 열(axis=1)에 적용한다.
- 사용자가 정의한 함수를 사용하여 데이터프레임의 각 요소나 행, 열에 함수를 적용할 수 있습니다.
별점 시스템을 만들려고 한다. 별점은 1,2,3 즉 3개로 만들것이다.
포인트가 95점 이상이면 3점, 85점 이상이면 2점, 나머지는 1점으로 할 것이다.
리뷰데이터를 통해 각 데이터의 별점을 구하라.
def get_group(points):
if points >=95:
return '★★★'
elif points >= 85:
return '★★'
else :
return '★'
점수에따라 별의 갯수를 출력하는 함수를 만들어준다.
- groupby():
- groupby() 메서드는 pandas의 데이터프레임(DataFrame) 객체에 적용되며, 특정 열을 기준으로 그룹을 형성합니다.
- 그룹별로 계산을 수행하거나, 그룹별로 연산을 적용할 때 사용됩니다.
- groupby() 메서드를 사용한 후에는 집계 함수(예: sum(), mean(), count() 등)를 적용하여 그룹별 통계를 계산할 수 있습니다.
- 예를 들어, df.groupby('column').mean()은 'column' 열을 기준으로 그룹을 형성한 후, 각 그룹의 평균을 계산합니다.
'Python > Project' 카테고리의 다른 글
| [Python] Pandas Dataframe 예제.(인덱스 재정렬, 상위 n개 데이터 출력 ,str.contains ,str.startswith,isin, ~ False만 출력) (0) | 2024.04.09 |
|---|---|
| [Python] Pandas DataFrame예제. index 변환, 컬럼 추가, 연산을 통한 데이터 추출 (0) | 2024.04.08 |