[Python] `Counter` 클래스 완벽 가이드: 데이터 카운팅부터 분석까지

0171-cloud 2024. 11. 20. 09:00

2024. 11. 20. 09:00

Python의 `Counter` 클래스 완벽 가이드: 데이터 카운팅부터 분석까지

Python의 collections 모듈에 포함된 Counter 클래스는 데이터를 카운팅하는 데 매우 유용한 도구입니다. 반복적인 데이터에서 빈도를 계산하거나, 가장 많이 등장한 요소를 파악해야 할 때 직관적이고 빠르게 사용할 수 있습니다. 특히, 데이터 분석, 로그 처리, 텍스트 분석 등 다양한 상황에서 활용할 수 있습니다.

이번 글에서는 Counter의 기본 사용법부터, 실제 코드에서 활용할 수 있는 유용한 예제를 중심으로 Counter 클래스를 완벽히 이해할 수 있도록 도와드리겠습니다.

1. `Counter` 클래스란?

Counter는 Python의 collections 모듈에 포함된 클래스 중 하나로, 반복 가능한(iterable) 객체의 요소 개수를 손쉽게 셀 수 있도록 설계되었습니다. 기본적인 딕셔너리 형태로 동작하며, 각 요소를 키(key)로, 그 요소의 개수를 값(value)으로 저장합니다.

2. 기본 사용법: 데이터 카운팅하기

Counter의 기본적인 사용법은 리스트나 문자열에서 각 요소의 등장 횟수를 카운팅하는 것입니다.

from collections import Counter

# 리스트 카운팅
fruits = ["apple", "banana", "apple", "orange", "banana", "apple"]
fruit_counter = Counter(fruits)

print(fruit_counter)
print(fruit_counter["apple"])  # 특정 요소의 개수 확인

결과

Counter({'apple': 3, 'banana': 2, 'orange': 1})
3

설명

Counter(fruits)는 리스트의 요소를 카운팅하여 각 요소와 빈도를 저장합니다.
fruit_counter["apple"]는 "apple"의 등장 횟수를 반환합니다.
이 방식으로 데이터의 빈도를 직관적으로 파악할 수 있습니다.

3. 텍스트 분석에 활용하기

Counter는 텍스트 분석에서 자주 사용됩니다. 예를 들어, 텍스트에서 각 단어의 빈도를 계산해 가장 많이 등장한 단어를 찾는 데 사용할 수 있습니다.

from collections import Counter

# 텍스트 데이터
text = "Python is amazing and Python is fun. Python is powerful."

# 단어 분리 후 카운팅
words = text.lower().split()
word_counter = Counter(words)

print(word_counter)
print(word_counter.most_common(3))  # 상위 3개 단어 출력

결과

Counter({'python': 3, 'is': 3, 'amazing': 1, 'and': 1, 'fun.': 1, 'powerful.': 1})
[('python', 3), ('is', 3), ('amazing', 1)]

설명

text.lower().split()로 텍스트를 소문자로 변환하고 단어를 분리합니다.
Counter(words)를 사용해 각 단어의 빈도를 계산합니다.
most_common(3) 메서드는 가장 많이 등장한 3개의 단어와 그 빈도를 반환합니다.

4. 로그 데이터 분석에 활용하기

로그 파일에서 특정 이벤트나 에러 코드의 빈도를 확인할 때도 Counter를 사용할 수 있습니다. 아래는 웹 서버 로그에서 요청 URL의 빈도를 계산하는 예제입니다.

from collections import Counter

# 샘플 로그 데이터
logs = [
    "/home",
    "/about",
    "/home",
    "/products",
    "/home",
    "/products",
    "/contact"
]

log_counter = Counter(logs)
print(log_counter)
print(log_counter.most_common(1))  # 가장 많이 요청된 URL

결과

Counter({'/home': 3, '/products': 2, '/about': 1, '/contact': 1})
[('/home', 3)]

설명

Counter(logs)는 각 URL의 요청 빈도를 계산합니다.
most_common(1)을 사용해 가장 많이 요청된 URL을 찾을 수 있습니다.
이 방식으로 로그 데이터를 효율적으로 분석하고, 트래픽이 많은 페이지를 파악할 수 있습니다.

5. 데이터 비교 및 업데이트

Counter는 두 데이터 간의 차이나 합집합을 계산하거나, 기존 카운팅 데이터에 새로운 데이터를 추가하는 작업을 간단히 처리할 수 있습니다.

데이터 합치기

from collections import Counter

counter1 = Counter({"apple": 3, "banana": 2})
counter2 = Counter({"apple": 1, "orange": 4})

# 데이터 합치기
combined = counter1 + counter2
print(combined)

결과

Counter({'apple': 4, 'orange': 4, 'banana': 2})

데이터 차이 계산

# 데이터 차이 계산
difference = counter1 - counter2
print(difference)

결과

Counter({'apple': 2, 'banana': 2})

설명

counter1 + counter2는 각 요소의 빈도를 더한 결과를 반환합니다.
counter1 - counter2는 counter1에서 counter2의 요소 개수를 뺀 결과를 반환합니다.
이를 통해 두 데이터 세트 간의 차이나 중복 요소를 빠르게 계산할 수 있습니다.

6. 데이터 필터링: 특정 조건의 데이터 추출

Counter는 데이터를 카운팅한 뒤 특정 조건에 맞는 데이터만 필터링하는 데 유용합니다.

from collections import Counter

# 샘플 데이터
ages = [23, 23, 25, 30, 30, 30, 35, 35, 40]

# 카운팅
age_counter = Counter(ages)

# 2번 이상 등장한 나이만 필터링
filtered = {age: count for age, count in age_counter.items() if count > 1}
print(filtered)

결과

{23: 2, 30: 3, 35: 2}

설명

Counter(ages)는 각 나이의 빈도를 계산합니다.
딕셔너리 컴프리헨션을 사용해 빈도가 2 이상인 나이만 필터링합니다.
이를 통해 특정 조건을 만족하는 데이터를 추출할 수 있습니다.

요약: Python `Counter`의 장점과 활용법

Python의 Counter 클래스는 다음과 같은 상황에서 강력한 도구로 활용될 수 있습니다:

데이터 빈도 분석: 리스트, 문자열, 로그 파일 등에서 요소의 빈도를 빠르게 계산할 수 있습니다.
텍스트 분석: 단어 빈도를 계산하여 가장 많이 사용된 단어나 패턴을 파악할 수 있습니다.
로그 분석: 웹 서버 로그, 시스템 로그 등에서 특정 요청이나 에러 코드의 빈도를 분석할 수 있습니다.
데이터 비교: 두 데이터 세트 간의 차이와 합집합을 간단히 계산할 수 있습니다.
조건부 데이터 필터링: 특정 조건에 맞는 데이터를 손쉽게 추출할 수 있습니다.

Python의 Counter를 활용하면 데이터 처리와 분석이 더욱 간단하고 효율적으로 변합니다. 이제 Counter와 함께 더 빠르고 직관적인 코드를 작성해보세요!

저작자표시 비영리 변경금지 (새창열림)

'개발 > Python 스터디' 카테고리의 다른 글

[Python] `setdefault`로 안전한 딕셔너리 관리하기: 코드를 간결하게 만드는 꿀팁 (1)	2024.11.22
[Python] `itertools` 완벽 가이드: `product`와 `permutations` 활용법 (0)	2024.11.21
[Python] `ChainMap`으로 중첩 딕셔너리 깔끔하게 다루기: 딕셔너리 합치기의 종결자 (0)	2024.11.19
[Python] `lambda` 완벽 가이드: 익명 함수로 코드 간결하게 만들기 (0)	2024.11.18
[Python] 리스트 효율적으로 나누기: `chunks` 함수 만들기 가이드 (0)	2024.11.18

0171-cloud’s Tech Record

[Python] `Counter` 클래스 완벽 가이드: 데이터 카운팅부터 분석까지

Python의 `Counter` 클래스 완벽 가이드: 데이터 카운팅부터 분석까지

1. `Counter` 클래스란?

2. 기본 사용법: 데이터 카운팅하기

결과

설명

3. 텍스트 분석에 활용하기

결과

설명

4. 로그 데이터 분석에 활용하기

결과

설명

5. 데이터 비교 및 업데이트

데이터 합치기

결과

데이터 차이 계산

결과

설명

6. 데이터 필터링: 특정 조건의 데이터 추출

결과

설명

요약: Python `Counter`의 장점과 활용법

'개발 > Python 스터디' 카테고리의 다른 글

+ Recent posts

티스토리툴바

0171-cloud’s Tech Record

[Python] `Counter` 클래스 완벽 가이드: 데이터 카운팅부터 분석까지

Python의 Counter 클래스 완벽 가이드: 데이터 카운팅부터 분석까지

1. Counter 클래스란?

2. 기본 사용법: 데이터 카운팅하기

결과

설명

3. 텍스트 분석에 활용하기

결과

설명

4. 로그 데이터 분석에 활용하기

결과

설명

5. 데이터 비교 및 업데이트

데이터 합치기

결과

데이터 차이 계산

결과

설명

6. 데이터 필터링: 특정 조건의 데이터 추출

결과

설명

요약: Python Counter의 장점과 활용법

'개발 > Python 스터디' 카테고리의 다른 글

+ Recent posts

티스토리툴바

Python의 `Counter` 클래스 완벽 가이드: 데이터 카운팅부터 분석까지

1. `Counter` 클래스란?

요약: Python `Counter`의 장점과 활용법