파이썬에서 정규 표현식 활용하기: re 모듈을 이용한 문자열 검색 및 추출

파이썬은 다양한 문자열 처리 기능을 제공하며, 그 중에서도 정규 표현식은 강력한 도구입니다. 정규 표현식은 특정 패턴을 정의하여 문자열에서 원하는 부분을 검색하고 추출하는 데 사용됩니다. 파이썬에서는 re 모듈을 통해 정규 표현식을 사용할 수 있습니다.

1. 정규 표현식 기초

정규 표현식은 특수 문자와 메타 문자를 사용하여 패턴을 표현합니다. 몇 가지 주요 메타 문자와 그 의미는 다음과 같습니다.

예를 들어, \d+ 는 숫자 1개 이상을 나타내고, [a-z]+ 는 소문자 1개 이상을 나타냅니다.

re 모듈은 정규 표현식을 사용하여 문자열을 처리하는 다양한 함수를 제공합니다.

다음은 re 모듈을 사용하여 문자열을 처리하는 몇 가지 예제입니다.

1. 이메일 주소 추출

```python import re

text = "제 이메일 주소는 test@example.com입니다." email = re.findall(r'[\w.-]+@[\w.-]+.\w+', text) print(email) # ['test@example.com'] ```

2. 전화번호 추출

```python import re

text = "제 전화번호는 010-1234-5678입니다." phone = re.findall(r'\d{3}-\d{4}-\d{4}', text) print(phone) # ['010-1234-5678'] ```

3. 문자열 대체

```python import re

text = "파이썬은 강력한 프로그래밍 언어입니다." new_text = re.sub(r'파이썬', 'Python', text) print(new_text) # Python은 강력한 프로그래밍 언어입니다. ```

4. 문자열 분리

```python import re

text = "사과, 바나나, 딸기" fruits = re.split(r', ', text) print(fruits) # ['사과', '바나나', '딸기'] ```

정규 표현식은 파이썬에서 문자열을 처리하는 강력한 도구입니다. 위의 예제들을 참고하여 다양한 상황에 맞게 정규 표현식을 활용해 보세요.

Q1. 정규 표현식이 뭔가요? 어떻게 사용하나요?

A: 정규 표현식 (Regular Expression)은 문자열 패턴을 표현하는 데 사용되는 특수 문자열입니다. 파이썬에서는 re 모듈을 사용하여 정규 표현식을 활용할 수 있습니다.

re.search(pattern, string) : 문자열에서 패턴과 일치하는 부분이 있는지 확인하고, 있다면 일치하는 부분을 나타내는 Match 객체를 반환합니다. 없다면 None 을 반환합니다.
re.findall(pattern, string) : 문자열에서 패턴과 일치하는 모든 부분을 리스트 형태로 반환합니다.
re.sub(pattern, replacement, string) : 문자열에서 패턴과 일치하는 부분을 replacement로 대체합니다.

예시:

```python import re

text = "My phone number is 123-456-7890" pattern = r"\d{3}-\d{3}-\d{4}"

match = re.search(pattern, text) if match: print(f"전화번호: {match.group(0)}")

phone_numbers = re.findall(pattern, text) print(f"전화번호 목록: {phone_numbers}")

new_text = re.sub(pattern, " - -****", text) print(f"변경된 문자열: {new_text}") ```

Q2. 특수 문자를 정규 표현식에서 어떻게 사용하나요?

A: 정규 표현식에서 특수 문자는 특별한 의미를 갖습니다. 예를 들어, . 은 임의의 문자 하나를 나타내고, * 는 앞 문자가 0번 이상 반복되는 것을 나타냅니다. 특수 문자를 그 자체로 사용하려면 백슬래시( \ )로 이스케이프해야 합니다.