보기와 같이 데이터 프레임을 보면 여러가지 컬럼별로 다른 속성을 지닌 값들이 있다.
이중에서 성별이 남성인 행(컬럼)만 가져오려면 편하게
df[df["Sex"] == 'male']
이라고 쓰면 이런식으로 나온다. 하지만 여러가지 조건을 입력할 경우는 조금 다르다.
df.loc[((df["Sex"] == 'male') | (df["Survived"]) == 1)]
이렇게 데이터프레임.loc를 사용하는 방법이 좋다.
또한 이런방식으로 loc를 사용할 경우의 조건문은 " | "은 or을 나타내고 "~"은 not을 나타내며 "&"은 and 를 나타낸다.
df.loc[((df["Sex"] == 'male') | (df["Survived"]) == 1)].shape
즉 첫번째는 남성이거나 살아남은 사람들이고 ,
df.loc[~((df["Sex"] == 'male') | (df["Survived"]) == 1)].shape
두 번째는 남성이거거나 살아남지 않은 사람들이다
df.loc[((df["Sex"] == 'male') & (df["Survived"]) == 1)].shape
세번째는 남성이고 살아남은 사람들을 뜻한다.
'파이썬 기초 > 데이터 프레임 다루기' 카테고리의 다른 글
전처리 과정 유용한 코드들 (0) | 2023.04.09 |
---|---|
데이터 프레임 모든 컬럼 시각화(plot plt) (0) | 2022.04.28 |