본문 바로가기
카테고리 없음

파이썬 Pandas로 데이터프레임의 수치 연산하기

by excel-master 2025. 4. 3.
반응형
파이썬 Pandas로 데이터프레임의 수치 연산하기

데이터 분석의 세계에서 Pandas는 필수적인 라이브러리입니다. 특히, 데이터프레임을 통해 수치 연산을 수행하는 것은 데이터 분석가에게 매우 중요한 작업입니다. 이 글에서는 Pandas 모듈을 사용하여 데이터프레임에서 수치 연산을 수행하는 5가지 방법을 자세히 살펴보겠습니다.

1. 기본 수치 연산

Pandas를 사용할 때 가장 기본적인 수치 연산은 덧셈, 뺄셈, 곱셈, 나눗셈입니다. 데이터프레임에서 이러한 연산을 수행할 수 있습니다. 예를 들어, 두 개의 열 간의 합계를 구할 수 있습니다.

제품 가격 수량 총 금액
사과 1000 5 5000
바나나 800 3 2400

위의 데이터프레임에서 총 금액은 가격과 수량을 곱하여 계산할 수 있습니다. 다음과 같이 코드를 작성할 수 있습니다:


import pandas as pd

data = {'제품': ['사과', '바나나'], '가격': [1000, 800], '수량': [5, 3]}
df = pd.DataFrame(data)
df['총 금액'] = df['가격'] * df['수량']
print(df)
    

2. 집계 함수 사용하기

데이터프레임에서 수치 데이터를 집계하는 것은 중요한 작업입니다. mean(), sum(), count()와 같은 집계 함수를 사용하여 데이터를 요약할 수 있습니다. 예를 들어, 총 금액의 평균을 구하는 방법은 다음과 같습니다:


average = df['총 금액'].mean()
print("평균 총 금액:", average)
    

3. 조건부 연산

데이터프레임에서 조건부 연산을 사용하여 특정 조건을 만족하는 데이터만 필터링할 수 있습니다. 예를 들어, 총 금액이 4000 이상인 제품만 선택할 수 있습니다. 이 작업은 loc 함수를 통해 수행할 수 있습니다:


high_sales = df.loc[df['총 금액'] >= 4000]
print(high_sales)
    

4. 데이터 변환

Pandas는 데이터를 변환하는 다양한 방법을 제공합니다. 예를 들어, 모든 가격을 10% 인상하고 싶다면 apply() 함수를 사용할 수 있습니다:


df['가격'] = df['가격'].apply(lambda x: x * 1.1)
print(df)
    

5. 누적 합계 계산하기

또한, 누적 합계를 계산하는 것도 매우 유용합니다. cumsum() 함수를 사용하여 누적 합계를 쉽게 구할 수 있습니다. 다음은 누적 총 금액을 계산하는 예제입니다:


df['누적 총 금액'] = df['총 금액'].cumsum()
print(df)
    

실용적인 팁 5가지

1. 데이터프레임의 인덱스 사용하기

인덱스를 활용하면 데이터를 더 쉽게 조작할 수 있습니다. 예를 들어, 상품명이나 날짜를 인덱스으로 설정하면 데이터 선택 시 매우 유용합니다. set_index() 메소드를 사용하여 특정 열을 인덱스로 설정할 수 있습니다.

2. 결측치 처리하기

결측치는 데이터 분석 시 큰 문제를 일으킬 수 있습니다. fillna() 함수를 사용하여 결측치를 특정 값으로 대체하거나 dropna() 함수를 사용하여 결측치가 포함된 행을 삭제할 수 있습니다.

3. 데이터 시각화하기

Pandas는 Matplotlib과 함께 사용할 수 있어 데이터 시각화가 가능합니다. 데이터를 분석한 후, plot() 함수를 사용하여 시각적으로 표현하면 통찰력을 얻는 데 도움이 됩니다.

4. 데이터 정렬하기

데이터를 정렬하는 것은 분석에 필수적입니다. sort_values() 메소드를 사용하여 특정 열을 기준으로 정렬할 수 있으며, 이를 통해 데이터를 쉽게 확인할 수 있습니다.

5. 데이터프레임 병합하기

다양한 데이터프레임을 병합할 필요가 있을 때 merge() 함수를 사용하면 유용합니다. 키를 기준으로 여러 데이터프레임을 결합하여 분석의 범위를 넓힐 수 있습니다.

요약 및 실천 팁


Pandas를 통해 데이터프레임의 수치 연산을 효율적으로 수행하는 방법을 살펴보았습니다. 기본 수치 연산, 집계 함수, 조건부 연산, 데이터 변환 및 누적 합계 계산까지 다양한 방법을 배웠습니다. 이를 통해 복잡한 데이터 분석을 더 쉽게 수행할 수 있습니다.

실제 활용을 위해 다음의 실천 팁을 고려해 보세요:

  • 자주 사용하는 데이터프레임의 구조를 미리 설계하여 효율성을 높이세요.
  • 결측치 처리 방법을 사전에 정해 두어 데이터 분석의 일관성을 유지하세요.
  • 시각화를 통해 데이터 분석 결과를 명확하게 전달하세요.
  • 데이터프레임 병합과 정렬 기능을 활용하여 다양한 분석을 수행하세요.
  • 코드를 주석으로 남겨 다음에 작업할 때 쉽게 이해할 수 있도록 하세요.
반응형