[파이썬] 데이터 집계, 피벗 테이블 생성

Python

[파이썬] 데이터 집계, 피벗 테이블 생성 - pivot_table

weweGH 2025. 4. 9. 09:00

데이터 집계, 피벗 테이블 생성 - pivot_table

들어가며

데이터분석을 하기 위해 피벗 테이블을 생성해야 할 때는 pivot_table을 활용합니다. 방대한 양의 데이터를 한눈에 보기 쉽게 집계표를 나타낼 수 있습니다.

피벗 테이블

먼저 필요한 패키지인 pandas를 import합니다.

# pip install pandas
import pandas as pd

예제 데이터로 2024년 3월 14일의 시간대별 ID별 속도 데이터를 사용하겠습니다. 아래의 csv파일을 다운로드하여 사용해 보세요:)

test_df.csv

0.47MB

df = pd.read_csv('test_df.csv', encoding='euc-kr')
df.head()

아래 그림과 같이 행에 ID를 열에 시간대를 놓고, 그에 맞는 속도를 나타내보겠습니다.

df_pivot = df.pivot_table(index='ID', columns='STIME', values='SPD')
df_pivot.head()

현재 인덱스인 ID를 해제하고 싶다면, reset_index를 추가합니다.

df_pivot2 = df.pivot_table(index='ID', columns='STIME', values='SPD').reset_index()
df_pivot2.head()

현재 df에는 결측값이 없지만, 데이터에 결측값이 있다면 fill_value를 통해 결측값을 채워 넣을 수도 있습니다.

df_pivot3 = df.pivot_table(index='ID', columns='STIME', values='SPD', fill_value = 95)

전체 코드

# pip install pandas
import pandas as pd

# 예제 데이터
df = pd.read_csv('test_df.csv', encoding='euc-kr')
df.head()

# df_pivot
df_pivot = df.pivot_table(index='ID', columns='STIME', values='SPD')
df_pivot.head()

# df_pivot2: index 해제
df_pivot2 = df.pivot_table(index='ID', columns='STIME', values='SPD').reset_index()
df_pivot2.head()

# df_pivot3: 결측값 처리
df_pivot3 = df.pivot_table(index='ID', columns='STIME', values='SPD', fill_value = 95)

저작자표시 비영리 변경금지 (새창열림)

'Python' 카테고리의 다른 글

[파이썬] OpenWeather API 활용 방법 - 실시간 날씨 데이터 수집 (2)	2025.04.11
[파이썬] 특정 경로에 폴더, directory 생성 - os, mkdir (0)	2025.04.10
[파이썬] 범주형 변수 처리, 더미변수 - get_dummies, OneHotEncoder (2)	2025.04.08
[파이썬] 패키지 설치 자동화 스크립트 - subprocess, importlib (0)	2025.04.07
[파이썬] 피벗 테이블 멀티 인덱스 해제 (4)	2025.04.06

현재글[파이썬] 데이터 집계, 피벗 테이블 생성 - pivot_table

안녕하세요 6년차 데이터사이언티스트/데이터분석가 GH입니다. 지금까지 겪었던 시행착오에 관해 기록합니다. 찾아와주셔서 감사합니다. ** 한걸음(명): 쉬지 아니하고 더 나아가 걷는 걸음이나 움직임. e-mail: wewegahyun@gmail.com

160x600

Folium, matplotlib, xlsx, print, OS, BeautifulSoup, datetime, 딥러닝, pivot_table, KONLPY, Python, AttributeError, openweather, cx_oracle, API, 파이썬, numpy, Error, tfidvectorizer, pandas,

Today :
Yesterday :

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

데이터 사이언스로 한걸음