본문 바로가기

파이썬 기초3

전처리 과정 유용한 코드들 과제를 하면서 유용하게 만들었던 부분들을 정리해보고자 한다. 아래의 git_gist에서 풀 코드를 확인 할 수 있다. https://gist.github.com/GiJungCho/08f767a46a3a07742f59d34ae8451dcf 전처리 전처리. GitHub Gist: instantly share code, notes, and snippets. gist.github.com ==전체적 과정 == 원핫 인코딩을 사용하기 위해 컬럼을 타입별로 나누었고, (ex: 명목형 변수=> object)타입을 변환했습니다. 변환이 되지 않는 컬럼은 이상치 값을 None값로 만든후 변환하였습니다. 파생변수로는 원하는 몸무게와 현재 몸무게를 뺸 컬럼을 생성하였습니다. 힙과 엉덩이 사이즈의 null값을 성,몸무게,키의 .. 2023. 4. 9.
데이터 프레임 모든 컬럼 시각화(plot plt) import matplotlib.pyplot as plt import seaborn as sns import matplotlib as mpl mpl.rcParams['axes.unicode_minus'] = False # 그래프에서 한글 폰트 깨지는 문제에 대한 대처(전역 글꼴 설정) from matplotlib import font_manager, rc font_name = font_manager.FontProperties(fname='c:/Windows/Fonts/malgun.ttf').get_name() 한글 깨짐을 방지 위해서 위 코드를 먼저 실행할 수 있다면 실행하는 것이 좋다 # pip install koreanize_matplotlib # @ 한글 깨짐 방지 import math #math .. 2022. 4. 28.
데이터 프레임 여러조건에 부합하는 행 가져오기 보기와 같이 데이터 프레임을 보면 여러가지 컬럼별로 다른 속성을 지닌 값들이 있다. 이중에서 성별이 남성인 행(컬럼)만 가져오려면 편하게 df[df["Sex"] == 'male'] 이라고 쓰면 이런식으로 나온다. 하지만 여러가지 조건을 입력할 경우는 조금 다르다. df.loc[((df["Sex"] == 'male') | (df["Survived"]) == 1)] 이렇게 데이터프레임.loc를 사용하는 방법이 좋다. 또한 이런방식으로 loc를 사용할 경우의 조건문은 " | "은 or을 나타내고 "~"은 not을 나타내며 "&"은 and 를 나타낸다. df.loc[((df["Sex"] == 'male') | (df["Survived"]) == 1)].shape 즉 첫번째는 남성이거나 살아남은 사람들이고 , d.. 2022. 4. 27.