데이터를 다루다 보면 한 번에 한 건의 값만 replace를 하는 경우도 있지만 여러 건의 값을 일괄적으로 다른 값들로 replace 하고 싶은 경우도 있다. 보통 다른 웹사이트에서는 한꺼번에 replace 하는 경우에 대해서는 잘 다루고 있지 않아 내가 직접 서치하고 적용해 본 것을 공유한다.
예를 들어서, 2027, 2028, 2029, 2030 은 2021 으로 변경하고, 2023, 2024, 2025, 2026 은 2022 으로 변경 하고 싶다고 하자. 이럴 경우에는 아래와 같이 replace 안에서 dictionary 형식으로 원하는 변환 형태를 선택하고 마지막에 regex = True 로 설정하면 된다.
# 연도 변환
# 2027, 2028, 2029, 2030년도: 2021년으로 변경
# 2023, 2024, 2025, 2026년도: 2022년으로 변경
df["date"]= df.date.astype(str)\
.replace({'2027':'2021','2028':'2021','2029':'2021','2030':'2021',
'2023':'2022','2024':'2022','2025':'2022','2026':'2022'}, regex=True)
반응형
'데이터 사이언스' 카테고리의 다른 글
LAIDD 인공지능 & 파이썬 프로그래밍 역량강화 교육과정과 함께하는 신약개발 (0) | 2024.08.25 |
---|---|
데이터 거버넌스: 표준화를 안하면 어떻게 될까 (0) | 2024.07.11 |
데이터 분석가로 취업한 이후의 현실과 난관 극복기 (0) | 2023.09.17 |
순수학문 전공자가 데이터 사이언티스트로 전향 하는 이유 (0) | 2023.09.17 |
SK 디스커버리 데이터사이언티스트 포지션 면접 후기 (0) | 2023.07.11 |