개발자 팁

[Python] `lambda` 완벽 가이드: 익명 함수로 코드 간결하게 만들기

0171-cloud 2024. 11. 18. 09:00

2024. 11. 18. 09:00

Python `lambda` 완벽 가이드: 익명 함수로 코드 간결하게 만들기

Python에서 lambda는 익명 함수를 생성하기 위한 키워드로, 이름 없는 간단한 함수를 한 줄로 작성할 수 있게 도와줍니다. 복잡한 함수 선언 없이 간단한 작업을 처리할 때 매우 유용하지만, lambda를 처음 접하면 그 문법과 용도가 낯설 수 있습니다.

이번 글에서는 lambda 함수의 개념과 작성법, 그리고 실제 코드에서 어떻게 활용할 수 있는지 다양한 예제를 통해 알아보겠습니다.

`lambda` 함수란?

lambda는 한 줄로 간단히 정의할 수 있는 익명 함수를 생성하는 Python 키워드입니다. 일반 함수와는 달리 def 키워드로 이름을 정의하지 않고도 간단한 작업을 처리할 수 있습니다.

기본 문법

lambda arguments: expression

arguments: 함수의 인자
expression: 반환할 값이나 계산식 (한 줄로 작성)

1. `lambda`로 간단한 함수 생성하기

lambda를 사용하면 간단한 함수를 한 줄로 정의할 수 있습니다. 아래는 두 숫자의 합을 구하는 함수를 일반 함수와 lambda로 각각 작성한 예제입니다.

# 일반 함수
def add(a, b):
    return a + b

# lambda 함수
add_lambda = lambda a, b: a + b

# 실행 예시
print(add(5, 3))          # 8
print(add_lambda(5, 3))   # 8

결과

8
8

설명

add 함수는 일반적으로 정의된 함수입니다.
add_lambda는 동일한 작업을 수행하지만, lambda를 사용해 한 줄로 작성되었습니다.
간단한 작업의 경우 lambda를 사용하면 코드를 더 간결하게 작성할 수 있습니다.

2. `lambda`와 `map`을 활용한 리스트 처리

리스트의 각 요소에 함수를 적용하려면 lambda와 map을 함께 사용할 수 있습니다. 아래는 리스트의 각 요소를 제곱하는 예제입니다.

numbers = [1, 2, 3, 4, 5]

# lambda와 map 사용
squared = map(lambda x: x ** 2, numbers)

# 결과 출력
print(list(squared))

결과

[1, 4, 9, 16, 25]

설명

map 함수는 첫 번째 인자로 전달된 함수를 리스트의 각 요소에 적용합니다.
lambda x: x ** 2는 각 요소를 제곱하는 익명 함수입니다.
이를 통해 복잡한 코드 없이 간단히 리스트의 요소를 변환할 수 있습니다.

3. `lambda`와 `filter`로 조건부 리스트 생성

리스트에서 특정 조건에 맞는 요소만 추출하려면 lambda와 filter를 사용할 수 있습니다. 아래는 짝수만 추출하는 예제입니다.

numbers = [1, 2, 3, 4, 5, 6, 7, 8]

# lambda와 filter 사용
even_numbers = filter(lambda x: x % 2 == 0, numbers)

# 결과 출력
print(list(even_numbers))

결과

[2, 4, 6, 8]

설명

filter 함수는 조건을 만족하는 요소만 반환합니다.
lambda x: x % 2 == 0은 요소가 짝수인지 확인하는 익명 함수입니다.
이를 통해 리스트에서 필요한 데이터만 간단히 추출할 수 있습니다.

4. `lambda`와 `sorted`로 정렬 기준 지정하기

리스트나 딕셔너리를 정렬할 때, lambda를 사용해 정렬 기준을 간단히 지정할 수 있습니다. 아래는 이름과 나이가 포함된 튜플 리스트를 나이에 따라 정렬하는 예제입니다.

people = [("Alice", 30), ("Bob", 25), ("Charlie", 35)]

# lambda를 사용해 나이에 따라 정렬
sorted_people = sorted(people, key=lambda person: person[1])

# 결과 출력
print(sorted_people)

결과

[('Bob', 25), ('Alice', 30), ('Charlie', 35)]

설명

sorted 함수는 key 매개변수를 통해 정렬 기준을 지정합니다.
lambda person: person[1]은 각 튜플의 두 번째 값(나이)을 기준으로 정렬합니다.
이를 통해 복잡한 기준이 필요하지 않은 경우 간단히 정렬 기준을 정의할 수 있습니다.

5. `lambda`와 `reduce`로 값 누적 계산하기

functools.reduce와 lambda를 함께 사용하면 리스트의 값을 누적 계산할 수 있습니다. 아래는 리스트의 요소를 모두 곱하는 예제입니다.

from functools import reduce

numbers = [1, 2, 3, 4]

# lambda와 reduce 사용
product = reduce(lambda x, y: x * y, numbers)

# 결과 출력
print(product)

결과

설명

reduce 함수는 리스트의 요소를 누적하여 계산합니다.
lambda x, y: x * y는 이전 값과 현재 값을 곱하는 익명 함수입니다.
이를 통해 리스트의 모든 요소를 한 번에 처리할 수 있습니다.

6. `lambda`와 함께 사용하는 주요 함수 정리

Python에서는 lambda와 함께 사용하면 유용한 함수들이 많습니다. 아래는 그중 몇 가지를 정리한 표입니다.

함수	역할	예제 코드
`map`	리스트의 각 요소에 함수 적용	`map(lambda x: x+1, [1, 2, 3])`
`filter`	조건을 만족하는 요소만 반환	`filter(lambda x: x > 2, [1, 2, 3])`
`sorted`	정렬 기준 지정	`sorted(data, key=lambda x: x[1])`
`reduce`	누적 계산	`reduce(lambda x, y: x*y, [1, 2, 3])`

7. `lambda` 사용 시 주의점

코드 가독성: lambda는 간단한 작업에 적합하지만, 너무 복잡한 계산식이 들어가면 가독성이 떨어질 수 있습니다. 복잡한 로직은 일반 함수를 사용하는 것이 더 좋습니다.
디버깅 어려움: lambda 함수는 이름이 없기 때문에 디버깅이 어려울 수 있습니다. 디버깅이 필요하다면 이름 있는 함수를 사용하는 것이 좋습니다.

요약: `lambda`를 활용해 코드 간결화하기

Python의 lambda는 간단한 함수 선언을 대체하고, 다양한 작업을 한 줄로 처리할 수 있는 강력한 도구입니다. 특히 map, filter, sorted, reduce와 함께 사용하면 불필요한 코드 줄을 줄이고 간결한 코드를 작성할 수 있습니다.

lambda는 다음과 같은 상황에서 유용합니다:

간단한 계산: 한 줄로 작성할 수 있는 작업
일회성 함수: 함수 이름이 필요 없는 경우
함수형 프로그래밍: map, filter, reduce와 같은 함수와 함께 사용

이제 lambda를 사용해 코드를 더 간결하고 효율적으로 만들어보세요!

저작자표시 비영리 변경금지 (새창열림)

'개발 > Python 스터디' 카테고리의 다른 글

[Python] `Counter` 클래스 완벽 가이드: 데이터 카운팅부터 분석까지 (1)	2024.11.20
[Python] `ChainMap`으로 중첩 딕셔너리 깔끔하게 다루기: 딕셔너리 합치기의 종결자 (0)	2024.11.19
[Python] 리스트 효율적으로 나누기: `chunks` 함수 만들기 가이드 (0)	2024.11.18
[Python] `defaultdict`로 편리한 딕셔너리 생성: 기본값으로 딕셔너리 쉽게 관리하기 (0)	2024.11.12
[Python] `zip`과 `zip_longest`로 두 리스트 병합하기: 짝 맞추기 대작전 (0)	2024.11.11

[Python] `enumerate`로 간편하게 인덱스 추적하기: 인덱스와 값 모두 쉽게 관리하기

0171-cloud 2024. 11. 10. 09:00

2024. 11. 10. 09:00

Python `enumerate`로 간편하게 인덱스 추적하기: 인덱스와 값 모두 쉽게 관리하기

Python에서 리스트나 튜플과 같은 시퀀스를 순회할 때 인덱스와 값을 동시에 다뤄야 하는 경우가 자주 있습니다. 이때 enumerate 함수는 인덱스와 값을 동시에 반환해주어 코드를 깔끔하고 간단하게 만들어 줍니다. 이번 글에서는 enumerate의 개념과 기본 사용법을 살펴보고, 실전에서 유용하게 활용할 수 있는 예제를 소개하겠습니다.

`enumerate`란 무엇일까?

enumerate는 Python의 내장 함수로, 반복 가능한 객체(리스트, 튜플 등)를 인덱스와 함께 튜플 형태로 반환합니다. 기본적으로 리스트를 순회할 때 for문과 함께 사용되며, 인덱스와 값을 한 번에 다룰 수 있어 인덱스를 별도로 관리하지 않아도 됩니다. 이로 인해 코드가 간결해지고, 실수 없이 인덱스와 값을 동시에 활용할 수 있습니다.

기본 사용법: `enumerate`로 리스트 인덱스와 값 출력하기

기본적으로 enumerate는 인덱스와 값을 튜플 형태로 반환합니다. 아래는 enumerate를 사용해 리스트의 인덱스와 값을 동시에 출력하는 예제입니다.

fruits = ["apple", "banana", "cherry"]

for index, fruit in enumerate(fruits):
    print(f"{index}: {fruit}")

결과

0: apple
1: banana
2: cherry

설명

enumerate(fruits)는 fruits 리스트의 각 요소와 그에 해당하는 인덱스를 튜플 형태로 반환합니다.
index와 fruit로 인덱스와 값을 각각 받아 출력할 수 있습니다.
리스트가 길거나 인덱스를 별도로 관리하기 어려운 경우, enumerate를 사용하면 자동으로 인덱스를 관리할 수 있어 실수를 줄일 수 있습니다.

`enumerate`로 커스텀 인덱스 시작점 지정하기

기본적으로 enumerate의 인덱스는 0부터 시작하지만, 원하는 숫자부터 시작하도록 설정할 수 있습니다. 예를 들어, 1부터 인덱스를 시작하도록 변경할 수 있습니다.

fruits = ["apple", "banana", "cherry"]

for index, fruit in enumerate(fruits, start=1):
    print(f"{index}: {fruit}")

결과

1: apple
2: banana
3: cherry

설명

enumerate(fruits, start=1)은 인덱스가 1부터 시작하도록 합니다.
start 파라미터를 사용해 기본값 외의 시작 인덱스를 지정할 수 있어, 목록이나 순서를 표시할 때 유용합니다.
인덱스를 1부터 시작하는 것은 사용자에게 더 직관적일 수 있으며, 번호 매기기 작업을 할 때도 깔끔합니다.

실전 예제 1: `enumerate`로 특정 값의 인덱스 찾기

리스트에서 특정 값의 인덱스를 찾아야 할 때, enumerate를 활용하면 조건을 체크하면서 인덱스를 추적할 수 있습니다. 아래는 enumerate를 사용해 "cherry"의 인덱스를 찾는 예제입니다.

fruits = ["apple", "banana", "cherry", "date"]

for index, fruit in enumerate(fruits):
    if fruit == "cherry":
        print(f"'cherry' is found at index {index}")

결과

'cherry' is found at index 2

설명

enumerate를 사용해 각 인덱스와 값을 반복하면서 조건을 체크할 수 있습니다.
특정 값이 리스트에서 위치하는 인덱스를 쉽게 추적할 수 있어, 검색이나 필터링 작업에서 유용합니다.
리스트 내의 값을 찾고자 할 때 인덱스를 별도로 계산할 필요 없이 enumerate로 효율적으로 처리할 수 있습니다.

실전 예제 2: `enumerate`로 두 개의 리스트 비교하기

두 개의 리스트를 비교할 때 enumerate를 사용하면 각 리스트의 인덱스를 자동으로 맞춰가며 값을 비교할 수 있습니다. 아래 예제에서는 두 학생 목록을 비교하여 서로 다른 이름이 위치한 인덱스를 출력합니다.

students_a = ["Alice", "Bob", "Charlie"]
students_b = ["Alice", "Bobby", "Charlie"]

for index, (a, b) in enumerate(zip(students_a, students_b)):
    if a != b:
        print(f"Difference at index {index}: {a} vs {b}")

결과

Difference at index 1: Bob vs Bobby

설명

enumerate(zip(students_a, students_b))를 통해 두 리스트를 동시에 순회하며 인덱스를 추적할 수 있습니다.
zip과 enumerate를 함께 사용하면 두 리스트의 값이 서로 다를 때 인덱스와 값을 동시에 확인할 수 있어, 데이터 비교 작업에 유용합니다.

실전 예제 3: `enumerate`와 조건문으로 데이터 필터링하기

리스트의 요소 중 특정 조건을 만족하는 요소의 인덱스를 찾아야 할 때 enumerate를 사용하면 편리합니다. 아래 예제는 짝수 값을 가진 요소의 인덱스를 출력하는 예제입니다.

numbers = [10, 15, 20, 25, 30]

for index, num in enumerate(numbers):
    if num % 2 == 0:
        print(f"Even number at index {index}: {num}")

결과

Even number at index 0: 10
Even number at index 2: 20
Even number at index 4: 30

설명

enumerate를 사용해 리스트의 인덱스와 값을 동시에 순회하면서 짝수 조건을 만족하는 값만 출력합니다.
이처럼 조건에 맞는 요소의 인덱스를 추적하고자 할 때, enumerate는 필터링 작업을 간단하게 만들어 줍니다.

응용 예제: 딕셔너리에 `enumerate` 사용하기

리스트가 아닌 딕셔너리에서도 enumerate를 사용할 수 있습니다. 딕셔너리의 각 키-값 쌍을 인덱스와 함께 관리할 수 있어 유용합니다. 아래는 딕셔너리의 각 항목을 인덱스와 함께 출력하는 예제입니다.

person_info = {"name": "Alice", "age": 30, "city": "New York"}

for index, (key, value) in enumerate(person_info.items()):
    print(f"{index}: {key} -> {value}")

결과

0: name -> Alice
1: age -> 30
2: city -> New York

설명

enumerate(person_info.items())는 딕셔너리의 키-값 쌍에 인덱스를 추가해줍니다.
이 방식으로 딕셔너리 항목을 인덱스와 함께 다룰 수 있어 데이터를 순서대로 정리하는 작업에 유용합니다.

요약: `enumerate`로 간편하게 인덱스 관리하기

Python의 enumerate는 시퀀스를 순회하면서 인덱스와 값을 동시에 처리할 수 있는 강력한 도구입니다. 반복 작업에서 인덱스를 따로 계산할 필요 없이 자동으로 추적할 수 있어, 특히 리스트나 튜플을 다루는 코드에서 유용하게 사용됩니다.

enumerate는 다음과 같은 상황에서 유용합니다:

리스트나 튜플 순회 시 인덱스와 값을 동시에 다루어야 할 때.
특정 조건에 맞는 값의 인덱스를 찾을 때.
두 리스트를 동시에 비교하거나 데이터를 필터링할 때.

저작자표시 비영리 변경금지 (새창열림)

'개발 > Python 스터디' 카테고리의 다른 글

[Python] `defaultdict`로 편리한 딕셔너리 생성: 기본값으로 딕셔너리 쉽게 관리하기 (0)	2024.11.12
[Python] `zip`과 `zip_longest`로 두 리스트 병합하기: 짝 맞추기 대작전 (0)	2024.11.11
[Python] 리스트 컴프리헨션과 메모리 절약: 더 빠르고 효율적인 코드 작성법 (1)	2024.11.09
[Python] `yield` 완벽 가이드: 효율적인 데이터 처리와 제너레이터 사용법 (0)	2024.11.08
[Python] ``와 `*`를 함께 사용하기: 위치 인자와 키워드 인자 활용법 (0)	2024.11.07

[Python] 리스트 컴프리헨션과 메모리 절약: 더 빠르고 효율적인 코드 작성법

0171-cloud 2024. 11. 9. 09:00

2024. 11. 9. 09:00

Python 리스트 컴프리헨션과 메모리 절약: 더 빠르고 효율적인 코드 작성법

Python의 리스트 컴프리헨션(list comprehension)은 짧고 간결하게 리스트를 생성할 수 있는 문법입니다. 반복문과 조건문을 결합해 하나의 줄로 리스트를 생성하면서, 메모리를 절약할 수 있는 방법도 제공합니다. 이번 글에서는 리스트 컴프리헨션의 기본 개념과, 메모리 사용을 최소화하면서 효율적으로 코드를 작성할 수 있는 활용법을 설명합니다.

1. 리스트 컴프리헨션이란?

리스트 컴프리헨션은 하나의 표현식으로 리스트를 생성할 수 있는 Python의 특별한 문법입니다. 일반적인 for 반복문으로 리스트를 작성하는 방법보다 간결하고 읽기 쉽습니다.

기본 구조

리스트 컴프리헨션의 기본 구조는 다음과 같습니다:

[표현식 for 요소 in 반복 가능한 객체 if 조건]

위 구조에서, if 조건은 옵션으로 사용할 수 있는 필터입니다. 이 조건에 맞는 요소만 리스트에 포함됩니다.

2. 기본 예제: 리스트 컴프리헨션을 활용한 간결한 리스트 생성

다음은 for 반복문을 사용한 코드와 동일한 작업을 리스트 컴프리헨션으로 간단하게 작성한 예제입니다.

# 기존 방식
numbers = []
for i in range(10):
    if i % 2 == 0:
        numbers.append(i)

print(numbers)  # [0, 2, 4, 6, 8]

# 리스트 컴프리헨션 사용
numbers = [i for i in range(10) if i % 2 == 0]
print(numbers)  # [0, 2, 4, 6, 8]

결과

[0, 2, 4, 6, 8]

설명

기존 방식에서는 for 반복문과 if 조건을 사용해 짝수를 골라내 리스트에 추가해야 했습니다.
리스트 컴프리헨션을 사용하면 하나의 줄로 같은 결과를 얻을 수 있습니다. 간결하고, 읽기 쉬운 코드가 됩니다.

3. 메모리 절약하기: 제너레이터 표현식 사용

리스트 컴프리헨션은 메모리를 많이 사용하는 큰 리스트를 만들 때 부담이 될 수 있습니다. 이때는 제너레이터 표현식(generator expression)을 사용하여 메모리를 절약할 수 있습니다. 제너레이터는 모든 값을 한꺼번에 생성하지 않고 필요할 때마다 값을 생성하여 메모리 사용을 최소화합니다.

# 리스트 컴프리헨션 - 메모리 많이 사용
squares_list = [i * i for i in range(1000000)]

# 제너레이터 표현식 - 메모리 절약
squares_gen = (i * i for i in range(1000000))

print(sum(squares_list))  # 리스트 전체를 메모리에 올리므로 메모리 많이 사용
print(sum(squares_gen))   # 필요할 때마다 값을 생성하여 메모리 절약

설명

[i * i for i in range(1000000)]는 리스트 컴프리헨션으로 모든 제곱 값을 메모리에 저장합니다.
(i * i for i in range(1000000))는 제너레이터 표현식으로 값을 필요할 때마다 생성하므로 메모리 사용을 줄일 수 있습니다.
큰 데이터나 무한 시퀀스를 처리할 때 제너레이터 표현식을 사용하면 메모리 부담 없이 작업을 수행할 수 있습니다.

4. 조건부 리스트 컴프리헨션으로 필터링 작업 단순화하기

리스트 컴프리헨션의 if 조건을 활용하면 필터링 작업을 간단하게 수행할 수 있습니다. 조건에 맞는 요소만 포함하도록 리스트를 생성해보겠습니다.

# 기존 방식
filtered_numbers = []
for i in range(20):
    if i % 3 == 0:
        filtered_numbers.append(i)

print(filtered_numbers)  # [0, 3, 6, 9, 12, 15, 18]

# 리스트 컴프리헨션 사용
filtered_numbers = [i for i in range(20) if i % 3 == 0]
print(filtered_numbers)  # [0, 3, 6, 9, 12, 15, 18]

결과

[0, 3, 6, 9, 12, 15, 18]

설명

if 조건을 사용하면 조건에 맞는 요소만 리스트에 추가할 수 있습니다.
필터링 작업이 간단해지고, 코드를 읽는 사람도 조건이 무엇인지 쉽게 이해할 수 있어 가독성이 높아집니다.

5. 리스트 컴프리헨션으로 중첩 반복문 처리하기

중첩 반복문이 필요할 때도 리스트 컴프리헨션을 사용하면 코드를 훨씬 짧고 간결하게 만들 수 있습니다.

# 기존 방식
pairs = []
for i in range(3):
    for j in range(3):
        pairs.append((i, j))

print(pairs)  # [(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)]

# 리스트 컴프리헨션 사용
pairs = [(i, j) for i in range(3) for j in range(3)]
print(pairs)  # [(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)]

결과

[(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)]

설명

리스트 컴프리헨션을 사용하면 중첩 반복문을 간결하게 표현할 수 있습니다.
(i, j) for i in range(3) for j in range(3)는 i와 j의 모든 조합을 리스트로 만듭니다. 코드가 짧아지고, 반복문이 한 줄로 정리되어 가독성이 높아집니다.

6. 조건문을 이용해 값 변환과 필터링을 동시에 수행하기

리스트 컴프리헨션은 조건에 따라 값을 변환하면서 리스트를 만들 수 있어, 코드가 간단해지고 실행 속도가 빨라집니다.

# 짝수는 그대로, 홀수는 제곱하여 리스트에 추가
numbers = [i if i % 2 == 0 else i * i for i in range(10)]
print(numbers)  # [0, 1, 2, 9, 4, 25, 6, 49, 8, 81]

결과

[0, 1, 2, 9, 4, 25, 6, 49, 8, 81]

설명

i if i % 2 == 0 else i * i는 짝수는 그대로 추가하고, 홀수는 제곱하여 리스트에 추가합니다.
리스트 컴프리헨션을 사용하면 조건에 맞는 값을 쉽게 변환할 수 있어 필터링과 값 변환 작업을 동시에 수행할 수 있습니다.

7. 다중 조건을 사용해 복잡한 필터링 수행하기

리스트 컴프리헨션에서 if 조건을 여러 개 사용할 수 있어 다중 조건 필터링을 간단히 처리할 수 있습니다.

# 3의 배수이면서 짝수인 수만 리스트에 포함
numbers = [i for i in range(30) if i % 3 == 0 if i % 2 == 0]
print(numbers)  # [0, 6, 12, 18, 24]

결과

[0, 6, 12, 18, 24]

설명

if i % 3 == 0 if i % 2 == 0은 3의 배수이면서 짝수인 조건을 만족하는 값을 필터링합니다.
다중 조건을 사용할 수 있어, 복잡한 조건이 필요한 필터링 작업도 한 줄로 간단하게 작성할 수 있습니다.

요약: 리스트 컴프리헨션과 메모리 절약

Python의 리스트 컴프리헨션은 간결하게 리스트를 생성하면서도 복잡한 조건을 적용하거나 필터링 작업을 수행할 수 있어 코드 가독성이 높아집니다. 또한, 메모리를 효율적으로 사용하는 제너레이터 표현식을 통해 대용량 데이터를 다룰 때도 부담을 줄일 수 있습니다.

리스트 컴프리헨션의 장점은 다음과 같습니다:

간결한 코드 작성: 반복문과 조건문을 하나의 표현식으로 작성하여 코드가 짧아지고 가독성이 높아집니다.
메모리 절약: 제너레이터 표현식을 사용하여 큰 데이터를 메모리에 부담 없이 다룰 수 있습니다.
필터링과 변환의 동시 수행: 조건문을 통해 데이터를 필터링하거나 변환하는 작업을 한 줄로 작성할 수 있습니다.

리스트 컴프리헨션과 제너레이터 표현식을 활용해 더 효율적이고 빠른 Python 코드를 작성해보세요!

저작자표시 비영리 변경금지 (새창열림)

'개발 > Python 스터디' 카테고리의 다른 글

[Python] `zip`과 `zip_longest`로 두 리스트 병합하기: 짝 맞추기 대작전 (0)	2024.11.11
[Python] `enumerate`로 간편하게 인덱스 추적하기: 인덱스와 값 모두 쉽게 관리하기 (0)	2024.11.10
[Python] `yield` 완벽 가이드: 효율적인 데이터 처리와 제너레이터 사용법 (0)	2024.11.08
[Python] ``와 `*`를 함께 사용하기: 위치 인자와 키워드 인자 활용법 (0)	2024.11.07
[Python] `**` 문법으로 복잡한 코드를 간단하게: 딕셔너리 언패킹과 키워드 인자 사용법 (1)	2024.11.06

[Python] `yield` 완벽 가이드: 효율적인 데이터 처리와 제너레이터 사용법

0171-cloud 2024. 11. 8. 09:00

2024. 11. 8. 09:00

Python `yield` 완벽 가이드: 효율적인 데이터 처리와 제너레이터 사용법

Python을 배우다 보면 yield라는 키워드를 만날 때가 있습니다. yield는 함수의 실행을 잠시 멈추고, 데이터를 하나씩 반환하는 특별한 역할을 하는 키워드입니다. 특히 yield를 사용하면 큰 데이터나 반복 작업을 더 효율적으로 처리할 수 있어요. 이번 글에서는 yield의 개념을 이해하고, yield를 활용해 제너레이터를 만드는 방법과 함께 실제 코드에서 유용하게 활용할 수 있는 예제를 소개합니다.

`yield`란 무엇일까? - 제너레이터와의 관계

yield는 Python의 함수에서 데이터를 반환하고 함수의 상태를 유지하는 키워드입니다. yield를 만나면 함수는 그 시점에서 잠시 멈추고, 값을 반환한 후 필요할 때 다시 실행을 시작합니다. 이 yield가 제너레이터(generator)를 만드는 핵심입니다.

제너레이터란?

제너레이터는 yield를 사용해 만든 반복 가능한 객체입니다. 일반적인 함수는 값을 한 번에 모두 반환하는 반면, 제너레이터는 필요한 시점에 값을 하나씩 반환하여 메모리 사용을 줄입니다. 이 덕분에 데이터가 많아도 메모리에 부담 없이 다룰 수 있는 것이 큰 장점입니다.

기본 예제: `yield`를 사용해 제너레이터 만들기

yield를 사용해 기본적인 제너레이터 함수를 만들어보겠습니다. 이 함수는 1부터 n까지의 숫자를 차례로 반환합니다.

def count_up_to(n):
    count = 1
    while count <= n:
        yield count
        count += 1

# 제너레이터 호출
counter = count_up_to(5)
print(next(counter))  # 1
print(next(counter))  # 2
print(next(counter))  # 3
print(next(counter))  # 4
print(next(counter))  # 5

결과

설명

yield count는 count 값을 반환하고 함수의 상태를 유지합니다.
next(counter)를 호출할 때마다 함수가 중단된 곳부터 다시 시작하며, 다음 값을 반환합니다.
count_up_to(5) 제너레이터는 1부터 5까지의 숫자를 순서대로 반환합니다.

`yield`와 `return`의 차이점 이해하기

함수에서 yield 대신 return을 사용하면 제너레이터가 아니라 일반 함수가 됩니다. 일반 함수는 값을 모두 계산해 한 번에 반환하는 반면, yield는 필요한 시점에 하나씩 값을 전달합니다.

def normal_function():
    return 1
    return 2  # 이 부분은 실행되지 않습니다

def generator_function():
    yield 1
    yield 2

# 결과 확인
print(normal_function())  # 1
for value in generator_function():
    print(value)  # 1, 2

결과

1
1
2

설명

normal_function()은 1을 반환하고 함수가 끝납니다. 이후 코드는 실행되지 않습니다.
generator_function()은 yield를 통해 값을 순서대로 반환합니다. 제너레이터는 for문을 통해 각 값을 하나씩 출력할 수 있습니다.

`yield`의 실제 활용 예제: 큰 데이터 처리하기

큰 데이터를 다룰 때 yield는 메모리 사용을 최소화하는 데 매우 유용합니다. 예를 들어, 큰 파일을 한 줄씩 읽어들이는 제너레이터를 만들어보겠습니다.

def read_large_file(file_path):
    with open(file_path, "r") as file:
        for line in file:
            yield line.strip()  # 한 줄씩 반환

# 파일 읽기
for line in read_large_file("large_text_file.txt"):
    print(line)

설명

read_large_file 제너레이터는 파일을 한 줄씩 읽고, 각 줄을 yield를 통해 반환합니다.
큰 파일을 한꺼번에 메모리에 올리지 않기 때문에 파일 크기와 상관없이 효율적으로 읽을 수 있습니다.

`yield`를 이용한 무한 시퀀스 생성

일정한 패턴의 무한 시퀀스를 생성할 때도 yield는 유용합니다. 아래 예제는 피보나치 수열을 생성하는 제너레이터입니다.

def fibonacci_sequence():
    a, b = 0, 1
    while True:
        yield a
        a, b = b, a + b

# 피보나치 수열 출력
fibo_gen = fibonacci_sequence()
for _ in range(10):
    print(next(fibo_gen))

결과

설명

fibonacci_sequence()는 무한히 피보나치 수열을 생성합니다.
next(fibo_gen)를 호출할 때마다 yield로 인해 다음 피보나치 숫자를 반환합니다.
무한 시퀀스를 생성할 때 yield는 효율적이고 간결하게 코드를 작성할 수 있는 방법입니다.

`yield from`으로 중첩된 제너레이터 처리하기

Python에서는 yield from 문법을 사용해 중첩된 제너레이터에서 값을 가져올 수 있습니다. 여러 제너레이터에서 데이터를 합쳐서 반환할 때 유용합니다.

def generator1():
    yield "A"
    yield "B"

def generator2():
    yield from generator1()
    yield "C"
    yield "D"

# 실행 예시
for value in generator2():
    print(value)

결과

A
B
C
D

설명

generator2는 yield from generator1()을 통해 generator1의 값을 모두 반환한 후 자신의 값을 추가로 반환합니다.
yield from을 사용하면 중첩된 제너레이터에서 값을 한꺼번에 가져올 수 있어 코드가 간결해집니다.

실전 예제: 데이터 파이프라인에서 `yield` 활용하기

데이터를 여러 단계로 처리해야 할 때 yield는 중간 결과를 순차적으로 전달해주므로 매우 유용합니다. 예를 들어, 데이터를 필터링하고 처리하는 파이프라인을 구성할 수 있습니다.

def data_generator(data):
    for item in data:
        yield item

def filter_data(data_gen, threshold):
    for item in data_gen:
        if item > threshold:
            yield item

def process_data(filtered_data):
    for item in filtered_data:
        yield item * 2

# 데이터 생성 및 처리
data = [1, 5, 10, 15, 20]
data_gen = data_generator(data)
filtered_data = filter_data(data_gen, 10)
processed_data = process_data(filtered_data)

for item in processed_data:
    print(item)

결과

20
30
40

설명

data_generator는 데이터를 생성하고, filter_data는 조건에 맞는 데이터만 필터링하며, process_data는 필터링된 데이터에 처리를 적용합니다.
각 단계에서 yield를 사용하여 데이터를 필요한 만큼만 처리하고 전달하므로 메모리를 절약하면서 효율적으로 데이터를 다룰 수 있습니다.

요약: `yield`의 장점과 활용법

Python에서 yield는 메모리 효율적인 데이터 처리를 가능하게 해주며, 제너레이터를 통해 값이 필요할 때마다 순차적으로 데이터를 생성할 수 있습니다. 이를 통해 코드가 간결해지고, 큰 데이터를 다루거나 무한 반복 작업을 수행할 때 매우 유용합니다.

yield는 특히 다음과 같은 상황에서 유용하게 활용됩니다:

큰 데이터를 처리할 때: 메모리 절약을 통해 효율적으로 데이터를 읽을 수 있습니다.
무한 반복 생성이 필요한 경우: yield를 사용해 무한 시퀀스를 간단히 구현할 수 있습니다.
중첩된 데이터를 다룰 때: yield from을 사용해 중첩된 제너레이터를 간단히 처리할 수 있습니다.

저작자표시 비영리 변경금지 (새창열림)

'개발 > Python 스터디' 카테고리의 다른 글

[Python] `enumerate`로 간편하게 인덱스 추적하기: 인덱스와 값 모두 쉽게 관리하기 (0)	2024.11.10
[Python] 리스트 컴프리헨션과 메모리 절약: 더 빠르고 효율적인 코드 작성법 (1)	2024.11.09
[Python] ``와 `*`를 함께 사용하기: 위치 인자와 키워드 인자 활용법 (0)	2024.11.07
[Python] `**` 문법으로 복잡한 코드를 간단하게: 딕셔너리 언패킹과 키워드 인자 사용법 (1)	2024.11.06
[Python] `*` 문법 완벽 가이드: 함수 인자, 언패킹, 가변 인자까지 (2)	2024.11.05

[Python] `**` 문법으로 복잡한 코드를 간단하게: 딕셔너리 언패킹과 키워드 인자 사용법

0171-cloud 2024. 11. 6. 09:56

2024. 11. 6. 09:56

Python `**` 문법으로 복잡한 코드를 간단하게: 딕셔너리 언패킹과 키워드 인자 사용법

Python에서 ** 문법은 딕셔너리를 언패킹하거나 가변 키워드 인자를 받아, 함수 호출을 더 유연하게 하고 코드 작성을 훨씬 간단하게 만들어줍니다. 특히, 반복적인 코드나 설정값이 많은 함수에서 불필요한 부분을 줄여, 코드가 읽기 쉽고 유지보수하기 쉬워집니다.

1. `**kwargs`로 가변 키워드 인자 받기

함수에 많은 인자를 전달해야 하거나 인자의 수가 변동적일 때, **kwargs를 사용하면 필요한 인자만 딕셔너리 형태로 받아 쉽게 처리할 수 있습니다. 여러 개의 키워드 인자를 사용하는 경우 **kwargs가 없으면 함수 호출이 복잡해질 수 있습니다.

def user_info(name, age, **kwargs):
    print(f"Name: {name}, Age: {age}")
    for key, value in kwargs.items():
        print(f"{key.capitalize()}: {value}")

# 사용 예시
user_info("Alice", 30, location="New York", job="Engineer", hobby="Reading")

설명

위 예제에서 **kwargs를 사용하여 임의의 키워드 인자를 받아 처리할 수 있습니다. user_info 함수에 location, job, hobby와 같은 인자를 추가해도 함수 정의를 바꿀 필요가 없습니다. 예전 방식으로 하려면 인자마다 함수 정의를 변경해야 했겠지만, **kwargs를 통해 더 깔끔하고 유연하게 코드를 작성할 수 있습니다.

2. 딕셔너리 언패킹으로 함수 호출을 간단히

기존 방식에서는 딕셔너리의 각 값을 하나씩 인자로 전달해야 했습니다. 그러나 **를 사용하면 딕셔너리를 바로 언패킹하여, 각 키를 인자명으로, 값을 인자 값으로 함수에 전달할 수 있습니다. 이로써 불필요한 반복을 줄이고, 코드 가독성을 높일 수 있습니다.

def display_order(item, price, quantity):
    print(f"Item: {item}, Price: {price}, Quantity: {quantity}")

order = {
    "item": "Laptop",
    "price": 1200,
    "quantity": 1
}

# 기존 방식
# display_order(order["item"], order["price"], order["quantity"])

# 언패킹 사용
display_order(**order)

설명

display_order(**order)는 딕셔너리 order의 키-값 쌍을 자동으로 언패킹하여 함수 인자로 전달합니다. 이전 방식에서는 각각의 키를 지정하여 값을 하나하나 전달해야 했지만, **를 사용하면 더 간단하고 직관적인 코드가 됩니다.

3. 기본값 설정이 많은 함수에서 `**`로 코드 단순화하기

기본값이 많은 함수에서 **를 사용하면, 코드가 짧아지고 관리하기 쉬워집니다. 기본 설정값을 가진 딕셔너리와 **kwargs를 함께 사용하여 특정 설정값만 쉽게 오버라이드할 수 있습니다.

def setup_environment(**config):
    # 기본 설정값
    default_config = {
        "resolution": "1080p",
        "color": "blue",
        "fullscreen": True
    }
    # 전달된 값만으로 기본값을 덮어씁니다.
    final_config = {**default_config, **config}

    for key, value in final_config.items():
        print(f"{key.capitalize()}: {value}")

# 사용 예시 - 일부 설정값만 오버라이드
setup_environment(resolution="4K", color="green")

설명

이 예제에서 setup_environment 함수는 default_config 딕셔너리와 config를 병합하여 최종 설정을 자동으로 조정합니다. 예전 방식대로라면 기본값을 개별적으로 지정하거나 모든 설정을 한꺼번에 전달해야 했지만, ** 문법을 통해 필요한 부분만 선택적으로 변경할 수 있어 코드가 더 유연해집니다.

4. 딕셔너리 병합하기

Python 3.9 이상에서는 ** 문법을 사용해 여러 딕셔너리를 간단히 병합할 수 있습니다. 이전 방식에서는 update() 메서드나 반복문을 사용해야 했던 불편함이 있었지만, **를 활용하면 훨씬 간결해집니다.

default_settings = {"theme": "dark", "font": "Arial"}
user_settings = {"font": "Helvetica", "fontsize": 12}

# 여러 딕셔너리를 한 번에 병합
settings = {**default_settings, **user_settings}

print(settings)

설명

{**default_settings, **user_settings}를 사용하여 두 딕셔너리를 손쉽게 병합할 수 있습니다. 중복된 키가 있을 경우, user_settings의 값이 우선 적용됩니다. 이 방법은 코드 작성과 유지보수가 간편해지며, 특히 설정값을 다룰 때 유용합니다.

5. 클래스 인스턴스 생성 시 유연하게 인자 전달하기

클래스를 사용할 때 ** 문법을 통해 유연하게 인자를 전달하면, 인스턴스 생성 과정에서 불필요한 코드를 줄일 수 있습니다. 특히 클래스 속성이 많을 때 편리합니다.

class Product:
    def __init__(self, **attributes):
        for key, value in attributes.items():
            setattr(self, key, value)

# 딕셔너리로 속성 값을 한 번에 전달
product_info = {"name": "Laptop", "price": 1200, "stock": 5}
product = Product(**product_info)

print(product.__dict__)

설명

위 코드에서 Product 클래스의 __init__ 메서드는 **attributes를 사용해 여러 속성을 한꺼번에 추가합니다. 이렇게 하면 클래스의 속성이 많을 때도 인스턴스를 간단하게 생성할 수 있습니다. 기존 방식대로라면 인스턴스를 생성할 때 속성을 일일이 지정해줘야 했지만, **를 사용하면 코드가 훨씬 간결해집니다.

요약: Python에서 `**` 문법으로 코드 간소화하기

Python의 ** 문법은 다음과 같은 방식으로 복잡한 코드를 간소화합니다.

함수에서 가변 키워드 인자를 받아, 불필요한 함수 정의 수정 없이 다양한 인자를 처리할 수 있음.
딕셔너리의 키-값 쌍을 언패킹하여 함수에 간편히 전달할 수 있음.
기본 설정값을 딕셔너리로 관리하고, 필요한 부분만 오버라이드할 수 있어 유연한 코드 작성 가능.
여러 딕셔너리를 손쉽게 병합하여 관리할 수 있음.
클래스 인스턴스를 생성할 때 동적으로 속성 추가가 가능해짐.

이처럼 ** 문법은 코드의 가독성과 유지보수성을 크게 개선하므로, Python을 더 효율적으로 사용하고 싶다면 이 문법을 익혀두세요!

저작자표시 비영리 변경금지 (새창열림)

'개발 > Python 스터디' 카테고리의 다른 글

[Python] `yield` 완벽 가이드: 효율적인 데이터 처리와 제너레이터 사용법 (0)	2024.11.08
[Python] ``와 `*`를 함께 사용하기: 위치 인자와 키워드 인자 활용법 (0)	2024.11.07
[Python] `*` 문법 완벽 가이드: 함수 인자, 언패킹, 가변 인자까지 (2)	2024.11.05
[Python] `pdb`와 데코레이터 활용 가이드: 특정 함수만 효율적으로 디버깅하기 (0)	2024.11.04
[python] 아직도 print로 디버깅하시나요? Python pdb 디버거로 효율적인 디버깅 시작하기 (0)	2024.11.03

PREV 이전 1 2 NEXT 다음

0171-cloud’s Tech Record

개발자 팁