본문 바로가기
Python/Project

[Python] Pandas DataFrame예제. index 변환, 컬럼 추가, 연산을 통한 데이터 추출

by 코끼리똥11 2024. 4. 8.

1. index, 컬럼 데이터로 저장하기

df라는 변수에 14000개의 데이터가 저장되잇는 Dataframe이 있다.

 

1. 인덱스를 title 컬럼으로 셋팅하라.

df.set_index('title', inplace=True)
print(df)

 

title의 데이터가 index로 이동했다.

 

2. 새로운 컬럼 추가하는법

 

리뷰에 새로운 컬럼 critic 만들고, everyone 이라고 값 넣어라.

df['critic'] = 'everyone'

 

우측에 critic 이라는 컬럼이 생겼고 모든 값에 'everyone'이 들어갔다.

 

3. 연산을 통한 데이터 추출

리뷰의 포인트의 평균을 구하고, 리뷰의 포인트값이, 평균보다 큰 데이터 (즉, 평가가 좋은 와인) 만 가져오시오.

df['points'].mean()

#출력값
88.44713820775404

 

array를 기반으로 한 라이브러리임으로 mean()을 써서 평균값을 알 수 있다.

 

df['points'] > df['points'].mean()
0         False
1         False
2         False
3         False
4         False
          ...  
129966     True
129967     True
129968     True
129969     True
129970     True

df[ 'points' ] 가 평균을 넘을시에 True를 출력한다.

 

df.loc[df['points'] > df['points'].mean() , :]
 
df[ 'points' ] 의 행이 True값만 찾아서 열을 모두 출력한다.
 

 

points가 88.44713820775404 가 넘는 값만 출력된걸 볼수 있다,