자기개발/데이터분석

[ERROR] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte

코대장 2021. 4. 18. 09:46
반응형

pandas 파일읽기 ERROR

pandas 에서 CSV 읽기(read_csv), 엑셀 읽기(read_excel) 등 파일 읽어 들일때,

가끔 아래와 같은 에러를 내뱉는 경우가 있습니다.

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte

인코딩의 문제로 아래와 같이 "encoding='cp949'" 또는 "encoding='eun-kr'" 파라미터로 추가함으로써 해결할 수 있습니다.

 

 

반응형

 

import pandas as pd
df = pd.read_csv('blabla.csv', encoding='cp949')
import pandas as pd
df = pd.read_csv('blabla.csv', encoding='euc-kr')

EUC-KR 인코딩의 확장버전이 CP949 이라고 하니, 마음 편하게 CP949 갖다 쓰시면 될거 같습니다.

 

 

 

 

 

이상. 끝.