반응형
pandas 파일읽기 ERROR
pandas 에서 CSV 읽기(read_csv), 엑셀 읽기(read_excel) 등 파일 읽어 들일때,
가끔 아래와 같은 에러를 내뱉는 경우가 있습니다.
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte
인코딩의 문제로 아래와 같이 "encoding='cp949'" 또는 "encoding='eun-kr'" 파라미터로 추가함으로써 해결할 수 있습니다.
반응형
import pandas as pd
df = pd.read_csv('blabla.csv', encoding='cp949')
import pandas as pd
df = pd.read_csv('blabla.csv', encoding='euc-kr')
EUC-KR 인코딩의 확장버전이 CP949 이라고 하니, 마음 편하게 CP949 갖다 쓰시면 될거 같습니다.
이상. 끝.
'자기개발 > 데이터분석' 카테고리의 다른 글
[공모전] GTX 지하 대심도 철도사업 안전 아이디어 공모전 (0) | 2021.04.25 |
---|---|
[ERROR] ParserError: Error tokenizing data. C error: Expected 5 fields in line 3, saw 6 (0) | 2021.04.18 |
[정보공유] 데이터 수집 가능한 공공데이터 개방 사이트 (0) | 2021.04.17 |
[ERROR] folium RecursionError: maximum recursion depth exceeded in comparison (0) | 2021.04.14 |
[데이터분석] 국토부 아파트 실거래가 분석 - 2. 데이터 수집(2) (0) | 2021.04.11 |