본문 바로가기
Python/Pandas

[Python]DataFrame 열, 컬럼마다 최댓값(max) 구하기

by 코끼리똥11 2024. 4. 11.

 

지하철 사용횟수와 날짜가 적인 DataFrame이 있다.

 

유임승차, 유임하차, 무임승차, 무임하차 4가지 별로, 각각 가장 많은 역을 찾아보자.

df[['유임승차', '유임하차', '무임승차', '무임하차']]

 

 

df[['유임승차', '유임하차', '무임승차', '무임하차']].max()

 

 

  1. df[['유임승차', '유임하차', '무임승차', '무임하차']]:
    • 이 부분은 데이터프레임 df에서 '유임승차', '유임하차', '무임승차', '무임하차' 열을 선택하는 작업을 한다.
    • 대괄호 안에 열 이름들을 리스트 형태로 넣어주었다.
    • 따라서 이 부분은 해당 열들을 포함한 새로운 데이터프레임을 생성한다.
  2. .max():
    • 선택된 열들에 대해 최댓값을 구하는 함수이다.
    • 이 함수를 사용하면 각 열의 최댓값을 구할 수 있다.
    • 최댓값이 구해진 결과는 시리즈(Series) 객체로 반환된다.
    • 시리즈 객체의 인덱스는 각 열의 이름이며, 값은 해당 열의 최댓값이다.

유임승차인원중 제일 많은 행을 출력해라.

df.loc[df['유임승차']==df['유임승차'].max()]

 

  1. df['유임승차'].max():
    • 이 부분은 '유임승차' 열의 최댓값을 구하는 작업이다.
    • 데이터프레임 df의 '유임승차' 열에서 .max() 함수를 호출하여 최댓값을 구힌다.
    • 이 값은 해당 열의 최댓값을 나타낸다.
  2. df.loc[]:
    • loc[] 메서드는 행을 선택하는 데 사용된다.
    • 행 인덱스 또는 행 인덱스의 조건을 사용하여 특정 행을 선택할 수 있다.
  3. df['유임승차']==df['유임승차'].max():
    • 이 부분은 '유임승차' 열의 값이 '유임승차' 열의 최댓값과 동일한지 여부를 판별하는 조건식이다.
    • 데이터프레임 df의 '유임승차' 열에서 최댓값을 구하고, 이 값과 각 행의 '유임승차' 열 값과 비교하여 True 또는 False 값을 반환합니다.
    • 따라서 이 조건식은 '유임승차' 열 값이 최댓값인지 여부를 나타냅니다.
  4. df.loc[df['유임승차']==df['유임승차'].max()]:
    • 이 부분은 '유임승차' 열의 값이 최댓값인 행을 선택하는 작업이다.
    • df.loc[]을 사용하여 행을 선택하고, 그 안에 '유임승차' 열의 값이 최댓값과 동일한지 여부를 조건으로 넣어주어 조건에 해당하는 행을 선택한다.
    • 따라서 이 부분은 '유임승차' 열의 값이 최댓값인 행을 선택하는 것이다.