본문 바로가기

Python/Pandas5

[Python]DataFrame 열, 컬럼마다 최댓값(max) 구하기 지하철 사용횟수와 날짜가 적인 DataFrame이 있다. 유임승차, 유임하차, 무임승차, 무임하차 4가지 별로, 각각 가장 많은 역을 찾아보자.df[['유임승차', '유임하차', '무임승차', '무임하차']]  df[['유임승차', '유임하차', '무임승차', '무임하차']].max()  df[['유임승차', '유임하차', '무임승차', '무임하차']]:이 부분은 데이터프레임 df에서 '유임승차', '유임하차', '무임승차', '무임하차' 열을 선택하는 작업을 한다.대괄호 안에 열 이름들을 리스트 형태로 넣어주었다.따라서 이 부분은 해당 열들을 포함한 새로운 데이터프레임을 생성한다..max():선택된 열들에 대해 최댓값을 구하는 함수이다.이 함수를 사용하면 각 열의 최댓값을 구할 수 있다.최댓값이 구해진.. 2024. 4. 11.
[Python] Pandas DataFrame 2개 합치기, concat ,merge concat() -  pandas 라이브러리에서 제공하는 함수 중 하나로, 데이터프레임을 연결하거나 병합하는 데 사용된다. 이 함수는 여러 개의 데이터프레임을 하나로 합치는데 유용하다.df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']},index=[0, 1, 2, 3])df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 'B': .. 2024. 4. 8.
[Python] Pandas 데이터 억세스 (loc, iloc, NaN, ) "데이터 프레임" 에서 원하는 데이터 억세스를 하는 방법1. 컬럼의 데이터를 가져오는 방법 DataFrame[column] :  변수명 바로 오른쪽에 대괄호 사용한다.df["watches"]#출력값store1 35store2 10Name: watches, dtype: int64 df['pants']['store1'] # [칼럼][인덱스]#출력값30   2. 행과 열의 정보로, 원하는 데이터를 가졍오는 방법loc[ clumn ] [ index ] : 인덱스 라벨을 기반으로 행을 선택하고, 열을 지정하여 데이터에 접근하는 데 사용된다.칼럼명과 인덱스명을 문자열로 입력하여 출력 가능하다.df.loc['store1' ,'pants' ] # [인덱스][칼럼]#출력값30  3. 행과 열의 정보로 데이터.. 2024. 4. 8.
[Python] Pandas 데이터 파일 읽어오기, 저장하기 데이터 읽어오기 (Read Data)판다스는 다양한 데이터 형식을 읽어와서 데이터프레임(DataFrame)으로 변환할 수 있는 기능을 제공한다. 가장 일반적인 데이터 형식은 CSV(comma-separated values) 파일이다. 하지만 엑셀 파일, JSON, SQL 데이터베이스, HTML 등의 다양한 형식을 지원한다. import pandas as pd# CSV 파일 읽어오기df = pd.read_csv('파일경로/파일이름.csv')  CSV 파일로 저장하기# 데이터프레임을 CSV 파일로 저장df.to_csv('저장경로/저장파일이름.csv') 2024. 4. 8.
[Python] Pandas 의 장점, 활용도, Serise , DataFrame 판다스(Pandas)는 파이썬 프로그래밍 언어로 작성된 데이터 조작 및 분석을 위한 라이브러리이다. 주로 데이터 처리 및 조작, 그리고 통계 분석에 사용된다. 주요 기능은 다음과 같다: 데이터 구조: 판다스는 두 가지 주요 데이터 구조를 제공한다.Series: 1차원 배열로 색인(index)이 있는 데이터를 담고 있다.DataFrame: 2차원 테이블 구조로, 여러 개의 Series를 포함하고 있다. 이는 행과 열로 구성되며, 행과 열에 각각 색인(index)이 지정된다.데이터 읽기 및 쓰기: 다양한 데이터 형식으로부터 데이터를 읽어들이고, 판다스 객체로 변환할 수 있다. 또한, 판다스 객체를 다시 다양한 형식으로 저장할 수 있다.데이터 조작: 판다스는 데이터를 조작하고 변형하는 다양한 메서드와 기능을 .. 2024. 4. 8.