반응형
정규표현식 - 특수문자 제거 방법
정규표현식을 사용하면 아주 간단하게 문자열을 다룰 수 있습니다.
이번에는 문자열에 특수문자가 포함되어 있을 경우, 해당 특수문자를 제거하는 방법에 대해서 알아 보겠습니다.
만약 정규표현식을 사용하지 않는다면, 어떤 방법이 있을까요?
문자열 내 문자하나씩 For loop 를 돌면서 replace 함수를 실행시켜야 하겠죠? (너무 비효율적이야 ㅠ)
import re
def cleanText(readData):
# 텍스트에 포함되어 있는 특수 문자 제거
text = re.sub('[-=+,#/\?:^$.@*\"※~&%ㆍ!』\\‘|\(\)\[\]\<\>`\'…》]', '', readData)
return text
inputText = '안$녕^하세요.. 테스트^ 데이터 #입니다.'
outputText = cleanText(readData=inputText)
print(f'in :{inputText} \nout:{outputText}')