반응형

Python 74

[파이썬] 데이터프레임 형태 변환 - pandas, melt

데이터프레임 형태 변환 - pandas, melt들어가며  데이터프레임의 형태 변환이 필요할 때, pandas의 melt를 활용한다. melt는 단어 그대로 데이터프레임을 녹여 원하는 형태로 재생성하는 것이다. 특정 열을 기준으로 다른 하나의 열을 활용하여 새로운 데이터프레임을 생성한다.melt먼저 필요한 패키지인 pandas를 import 하고, 데이터를 불러옵니다. sample_melt.csv는 난수를 활용하여 생성한 sample 데이터입니다. 위 파일을 다운로드하여 연습해 보세요.import pandas as pddf = pd.read_csv('sample_melt.csv')dfdf는 10x10 형태의 데이터프레임입니다. df를 melt를 활용하여 데이터 분석에 적합한 형태로 변환하면 다음과 같습니..

Python 2024.10.21

[파이썬] 데이터 집계 및 요약 - pandas, pivot_table, aggfunc

데이터 집계 및 요약 - pandas, pivot_table들어가며파이썬으로 데이터 분석을 하기 위해 데이터를 집계하고 요약이 필요한 경우에는 pandas의 pivot_table이 매우 유용합니다. 한눈에 보기 편한 표를 만들 수 있는 피벗 테이블 기능에 집계를 할 때 사용하는 groupby의 기능을 aggfunc으로 옵션을 추가하여 사용할 수 있습니다.캐글 데이터 소개이 글에서 활용할 데이터는 캐글 데이터셋 중 미국의 전력 가격에 대한 데이터셋입니다. 2001년부터 2024년 기간 동안의 연도별 월별 지역별 전력 가격, 수익, 판매량에 대한 정보가 있습니다. 자세한 내용은 캐글 사이트를 참고 부탁드립니다.데이터 분석위에서 설명한 데이터셋으로 여러 컬럼들을 활용하여 피벗테이블을 만들어보겠습니다. 피벗테이..

Python 2024.10.14

[파이썬] 파이썬을 활용한 이미지 배경 제거 - PIL, rembg

파이썬을 활용한 이미지 배경 제거 - PIL, rembg들어가며이미지를 활용하여 학습 데이터셋을 생성할 때, 이미지 전처리가 필요합니다. 불필요한 노이즈가 많이 생긴 이미지는 배경 제거가 필수 과정입니다. 이 글에서는 파이썬으로 이미지의 배경을 제거하는 방법을 소개합니다.먼저 필요한 패키지를 import합니다.from rembg import removefrom PIL import Image배경을 제거할 이미지의 input 경로와 output 경로를 input_path와 output_path에 저장합니다.input_path = 'horse_asis.jpg'output_path = 'output.png'이미지 샘플은 픽사베이의 무료 이미지를 사용하겠습니다. 샘플은 다음과 같습니다. 샘플 이미지의 배경인 잔디..

Python 2024.10.07

[파이썬] 데이터프레임 행, 열 선택 - iloc, loc

데이터프레임 행, 열 선택 - loc, iloc들어가며파이썬에서 데이터프레임의 행, 열을 선택하는 경우에는 loc, iloc를 사용합니다. 여러 행 또는 열을 선택할 때, 인덱스를 통하여 손쉽게 원하는 데이터 형태로 인덱싱할 수 있습니다.iloc와 loc를 사용하기 위해서는 인덱스와 라벨에 대한 이해가 필요합니다. 파이썬에서 인덱스는 0부터 시작하므로 순서대로 아래의 이미지와 같이 번호가 부여됩니다. 즉, 행과 열의 위치를 나타내는 번호입니다. 라벨은 컬럼명을 의미합니다. 예를 들어, 아래 데이터프레임의 Occupation 컬럼의 인덱스 번호는 3이고, 라벨은 'Occupation'입니다.데이터 소개  이 글에서 활용할 데이터는 캐글 데이터셋 중 Online Food Dataset로 온라인 음식 주문 플..

Python 2024.10.07
반응형