[Python]DataFrame 열, 컬럼마다 최댓값(max) 구하기

지하철 사용횟수와 날짜가 적인 DataFrame이 있다.

df[['유임승차', '유임하차', '무임승차', '무임하차']]

df[['유임승차', '유임하차', '무임승차', '무임하차']].max()

df[['유임승차', '유임하차', '무임승차', '무임하차']]:
- 이 부분은 데이터프레임 df에서 '유임승차', '유임하차', '무임승차', '무임하차' 열을 선택하는 작업을 한다.
- 대괄호 안에 열 이름들을 리스트 형태로 넣어주었다.
- 따라서 이 부분은 해당 열들을 포함한 새로운 데이터프레임을 생성한다.
.max():
- 선택된 열들에 대해 최댓값을 구하는 함수이다.
- 이 함수를 사용하면 각 열의 최댓값을 구할 수 있다.
- 최댓값이 구해진 결과는 시리즈(Series) 객체로 반환된다.
- 시리즈 객체의 인덱스는 각 열의 이름이며, 값은 해당 열의 최댓값이다.

df.loc[df['유임승차']==df['유임승차'].max()]

df['유임승차'].max():
- 이 부분은 '유임승차' 열의 최댓값을 구하는 작업이다.
- 데이터프레임 df의 '유임승차' 열에서 .max() 함수를 호출하여 최댓값을 구힌다.
- 이 값은 해당 열의 최댓값을 나타낸다.
df.loc[]:
- loc[] 메서드는 행을 선택하는 데 사용된다.
- 행 인덱스 또는 행 인덱스의 조건을 사용하여 특정 행을 선택할 수 있다.
df['유임승차']==df['유임승차'].max():
- 이 부분은 '유임승차' 열의 값이 '유임승차' 열의 최댓값과 동일한지 여부를 판별하는 조건식이다.
- 데이터프레임 df의 '유임승차' 열에서 최댓값을 구하고, 이 값과 각 행의 '유임승차' 열 값과 비교하여 True 또는 False 값을 반환합니다.
- 따라서 이 조건식은 '유임승차' 열 값이 최댓값인지 여부를 나타냅니다.
df.loc[df['유임승차']==df['유임승차'].max()]:
- 이 부분은 '유임승차' 열의 값이 최댓값인 행을 선택하는 작업이다.
- df.loc[]을 사용하여 행을 선택하고, 그 안에 '유임승차' 열의 값이 최댓값과 동일한지 여부를 조건으로 넣어주어 조건에 해당하는 행을 선택한다.
- 따라서 이 부분은 '유임승차' 열의 값이 최댓값인 행을 선택하는 것이다.

[Python] Pandas DataFrame 2개 합치기, concat ,merge (0)	2024.04.08
[Python] Pandas 데이터 억세스 (loc, iloc, NaN, ) (0)	2024.04.08
[Python] Pandas 데이터 파일 읽어오기, 저장하기 (0)	2024.04.08
[Python] Pandas 의 장점, 활용도, Serise , DataFrame (0)	2024.04.08

코딩일지