
지하철 사용횟수와 날짜가 적인 DataFrame이 있다.
유임승차, 유임하차, 무임승차, 무임하차 4가지 별로, 각각 가장 많은 역을 찾아보자.
df[['유임승차', '유임하차', '무임승차', '무임하차']]

df[['유임승차', '유임하차', '무임승차', '무임하차']].max()

- df[['유임승차', '유임하차', '무임승차', '무임하차']]:
- 이 부분은 데이터프레임 df에서 '유임승차', '유임하차', '무임승차', '무임하차' 열을 선택하는 작업을 한다.
- 대괄호 안에 열 이름들을 리스트 형태로 넣어주었다.
- 따라서 이 부분은 해당 열들을 포함한 새로운 데이터프레임을 생성한다.
- .max():
- 선택된 열들에 대해 최댓값을 구하는 함수이다.
- 이 함수를 사용하면 각 열의 최댓값을 구할 수 있다.
- 최댓값이 구해진 결과는 시리즈(Series) 객체로 반환된다.
- 시리즈 객체의 인덱스는 각 열의 이름이며, 값은 해당 열의 최댓값이다.
유임승차인원중 제일 많은 행을 출력해라.
df.loc[df['유임승차']==df['유임승차'].max()]

- df['유임승차'].max():
- 이 부분은 '유임승차' 열의 최댓값을 구하는 작업이다.
- 데이터프레임 df의 '유임승차' 열에서 .max() 함수를 호출하여 최댓값을 구힌다.
- 이 값은 해당 열의 최댓값을 나타낸다.
- df.loc[]:
- loc[] 메서드는 행을 선택하는 데 사용된다.
- 행 인덱스 또는 행 인덱스의 조건을 사용하여 특정 행을 선택할 수 있다.
- df['유임승차']==df['유임승차'].max():
- 이 부분은 '유임승차' 열의 값이 '유임승차' 열의 최댓값과 동일한지 여부를 판별하는 조건식이다.
- 데이터프레임 df의 '유임승차' 열에서 최댓값을 구하고, 이 값과 각 행의 '유임승차' 열 값과 비교하여 True 또는 False 값을 반환합니다.
- 따라서 이 조건식은 '유임승차' 열 값이 최댓값인지 여부를 나타냅니다.
- df.loc[df['유임승차']==df['유임승차'].max()]:
- 이 부분은 '유임승차' 열의 값이 최댓값인 행을 선택하는 작업이다.
- df.loc[]을 사용하여 행을 선택하고, 그 안에 '유임승차' 열의 값이 최댓값과 동일한지 여부를 조건으로 넣어주어 조건에 해당하는 행을 선택한다.
- 따라서 이 부분은 '유임승차' 열의 값이 최댓값인 행을 선택하는 것이다.
'Python > Pandas' 카테고리의 다른 글
| [Python] Pandas DataFrame 2개 합치기, concat ,merge (0) | 2024.04.08 |
|---|---|
| [Python] Pandas 데이터 억세스 (loc, iloc, NaN, ) (0) | 2024.04.08 |
| [Python] Pandas 데이터 파일 읽어오기, 저장하기 (0) | 2024.04.08 |
| [Python] Pandas 의 장점, 활용도, Serise , DataFrame (0) | 2024.04.08 |