본문 바로가기

분류 전체보기64

[Python]Pandas 예제. (unique, apply , groupby) unique():unique() 메서드는 pandas의 시리즈(Series) 객체에 적용되며, 시리즈에 있는 고유한 값들을 반환한다.주어진 시리즈에서 중복되지 않는 값을 찾아 반환한다.df라는 DataFrame이 있다. 나라를 중복되지 않도록 가져와서 countries 변수에 저장하고, 화면에 출력해보자.countries= df['country'].unique()country에 있는 나라를 중복하지않고 모두 출력 가능하다.apply():apply() 메서드는 pandas의 데이터프레임(DataFrame)이나 시리즈(Series) 객체에 적용되며, 주어진 함수를 각 행(axis=0) 또는 열(axis=1)에 적용한다.사용자가 정의한 함수를 사용하여 데이터프레임의 각 요소나 행, 열에 함수를 적용할 수 있습.. 2024. 4. 8.
[Python] Pandas DataFrame예제. index 변환, 컬럼 추가, 연산을 통한 데이터 추출 1. index, 컬럼 데이터로 저장하기df라는 변수에 14000개의 데이터가 저장되잇는 Dataframe이 있다. 1. 인덱스를 title 컬럼으로 셋팅하라.df.set_index('title', inplace=True)print(df) title의 데이터가 index로 이동했다. 2. 새로운 컬럼 추가하는법  리뷰에 새로운 컬럼 critic 만들고, everyone 이라고 값 넣어라. df['critic'] = 'everyone' 우측에 critic 이라는 컬럼이 생겼고 모든 값에 'everyone'이 들어갔다. 3. 연산을 통한 데이터 추출 리뷰의 포인트의 평균을 구하고, 리뷰의 포인트값이, 평균보다 큰 데이터 (즉, 평가가 좋은 와인) 만 가져오시오. df['points'].mean()#출력값88.. 2024. 4. 8.
[Python] Pandas DataFrame 2개 합치기, concat ,merge concat() -  pandas 라이브러리에서 제공하는 함수 중 하나로, 데이터프레임을 연결하거나 병합하는 데 사용된다. 이 함수는 여러 개의 데이터프레임을 하나로 합치는데 유용하다.df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']},index=[0, 1, 2, 3])df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 'B': .. 2024. 4. 8.
[Python] Pandas 데이터 억세스 (loc, iloc, NaN, ) "데이터 프레임" 에서 원하는 데이터 억세스를 하는 방법1. 컬럼의 데이터를 가져오는 방법 DataFrame[column] :  변수명 바로 오른쪽에 대괄호 사용한다.df["watches"]#출력값store1 35store2 10Name: watches, dtype: int64 df['pants']['store1'] # [칼럼][인덱스]#출력값30   2. 행과 열의 정보로, 원하는 데이터를 가졍오는 방법loc[ clumn ] [ index ] : 인덱스 라벨을 기반으로 행을 선택하고, 열을 지정하여 데이터에 접근하는 데 사용된다.칼럼명과 인덱스명을 문자열로 입력하여 출력 가능하다.df.loc['store1' ,'pants' ] # [인덱스][칼럼]#출력값30  3. 행과 열의 정보로 데이터.. 2024. 4. 8.
[Python] Pandas 데이터 파일 읽어오기, 저장하기 데이터 읽어오기 (Read Data)판다스는 다양한 데이터 형식을 읽어와서 데이터프레임(DataFrame)으로 변환할 수 있는 기능을 제공한다. 가장 일반적인 데이터 형식은 CSV(comma-separated values) 파일이다. 하지만 엑셀 파일, JSON, SQL 데이터베이스, HTML 등의 다양한 형식을 지원한다. import pandas as pd# CSV 파일 읽어오기df = pd.read_csv('파일경로/파일이름.csv')  CSV 파일로 저장하기# 데이터프레임을 CSV 파일로 저장df.to_csv('저장경로/저장파일이름.csv') 2024. 4. 8.
[Python] Pandas 의 장점, 활용도, Serise , DataFrame 판다스(Pandas)는 파이썬 프로그래밍 언어로 작성된 데이터 조작 및 분석을 위한 라이브러리이다. 주로 데이터 처리 및 조작, 그리고 통계 분석에 사용된다. 주요 기능은 다음과 같다: 데이터 구조: 판다스는 두 가지 주요 데이터 구조를 제공한다.Series: 1차원 배열로 색인(index)이 있는 데이터를 담고 있다.DataFrame: 2차원 테이블 구조로, 여러 개의 Series를 포함하고 있다. 이는 행과 열로 구성되며, 행과 열에 각각 색인(index)이 지정된다.데이터 읽기 및 쓰기: 다양한 데이터 형식으로부터 데이터를 읽어들이고, 판다스 객체로 변환할 수 있다. 또한, 판다스 객체를 다시 다양한 형식으로 저장할 수 있다.데이터 조작: 판다스는 데이터를 조작하고 변형하는 다양한 메서드와 기능을 .. 2024. 4. 8.