Python/Project

[Python] Pandas DataFrame예제. index 변환, 컬럼 추가, 연산을 통한 데이터 추출

코끼리똥11 2024. 4. 8. 17:42

1. index, 컬럼 데이터로 저장하기

df라는 변수에 14000개의 데이터가 저장되잇는 Dataframe이 있다.

 

1. 인덱스를 title 컬럼으로 셋팅하라.

df.set_index('title', inplace=True)
print(df)

 

title의 데이터가 index로 이동했다.

 

2. 새로운 컬럼 추가하는법

 

리뷰에 새로운 컬럼 critic 만들고, everyone 이라고 값 넣어라.

df['critic'] = 'everyone'

 

우측에 critic 이라는 컬럼이 생겼고 모든 값에 'everyone'이 들어갔다.

 

3. 연산을 통한 데이터 추출

리뷰의 포인트의 평균을 구하고, 리뷰의 포인트값이, 평균보다 큰 데이터 (즉, 평가가 좋은 와인) 만 가져오시오.

df['points'].mean()

#출력값
88.44713820775404

 

array를 기반으로 한 라이브러리임으로 mean()을 써서 평균값을 알 수 있다.

 

df['points'] > df['points'].mean()
0         False
1         False
2         False
3         False
4         False
          ...  
129966     True
129967     True
129968     True
129969     True
129970     True

df[ 'points' ] 가 평균을 넘을시에 True를 출력한다.

 

df.loc[df['points'] > df['points'].mean() , :]
 
df[ 'points' ] 의 행이 True값만 찾아서 열을 모두 출력한다.
 

 

points가 88.44713820775404 가 넘는 값만 출력된걸 볼수 있다,