파이썬
19. 정규표현식(정규식)
미스터 한뺑
2022. 8. 9. 17:53
반응형
정규식
- 정규표현식은 복잡한 문자열을 처리할때 사용하는 기법
- 파이썬만의 고유한 기법이 아니라 문자열을 처리하는 모든 곳에서 사용
위 사진은 data 안에 있는 문자열 중 전화번호만 출력을 하는 문제이다 .
번호찾는 걸 구현하기위해 긴 코드를 작성을 했다 .
그러나 정규식을 이용하면 간결하게 코드를 짤수가 있다.
위 사진 처럼 3줄 만에 만들수가 있다.
re(regular expression) 모듈
- 파이썬의 정규표현식을 지원하기 위한 모듈
- <<<match 함수>>>
- pattern 맞는 문자열로 시작하는지 검사하고 매칭이 되면 match 객체를 반환하고 그렇지 않으면 none반환
match 함수는 문자열이 내가 적은 문자열이 시작하는지 맞으면 내가 적은 문자를 반환하고 아니면 none을 반환한다,=.
match 함수의 구조는 re.match("내가 쓸 문자열", data") 이런식으로 쓰면 된다.
- <<<search 함수>>>>
- pattern에 맞는 문자열을 검사하고 매칭되면 바로 match 객체를 반환한다. 매칭이 안되면 None을 반환
re.seach함수 구조는 re.search("내가 쓸 문자열",data)
이렇게 쓰면 된다 .
내가 쓴 문자열이 data 문자열에 있는지 검사하고 있으면 반환한다.
- <<<findall 함수>>>
- 정규식과 매칭되는 모든 문자열을 리스트로 반환한다.
구조는 re.findall("내가 칠 문자열",data) 이렇게 쓰면 된다.
위 사진은 findall 함수에 대한 설명이다 .
data에 번호가 두번 들어가 있기 때문에 번호가 2번 출력된걸 볼수 있고
리스트형태로 나오는걸 볼 수 있다.
- <<<sub 함수>>>
- 정규식과 매칭되는 부분을 치환해준다.
sub 함수의 구조는 re.sub("있는 문자열","바꿀 문자열",data) 이렇게 바꾸면된다.
반응형