본문 바로가기
파이썬 기초/데이터 프레임 다루기

데이터 프레임 여러조건에 부합하는 행 가져오기

by 조기정 2022. 4. 27.

train.csv
0.06MB

보기와 같이 데이터 프레임을 보면 여러가지 컬럼별로 다른 속성을 지닌 값들이 있다.

이중에서 성별이 남성인 행(컬럼)만 가져오려면 편하게 

df[df["Sex"] == 'male']

이라고 쓰면 이런식으로 나온다. 하지만 여러가지 조건을 입력할 경우는 조금 다르다.

df.loc[((df["Sex"] == 'male') | (df["Survived"]) == 1)]

남성이고 살아남은 사람들인 행만 가져옮

이렇게 데이터프레임.loc를 사용하는 방법이 좋다.

 

또한 이런방식으로 loc를 사용할 경우의 조건문은 " | "은 or을 나타내고 "~"은 not을 나타내며 "&"은 and 를 나타낸다.

df.loc[((df["Sex"] == 'male') | (df["Survived"]) == 1)].shape

즉 첫번째는 남성이거나 살아남은 사람들이고 ,

df.loc[~((df["Sex"] == 'male') | (df["Survived"]) == 1)].shape

두 번째는 남성이거거나 살아남지 않은 사람들이다

df.loc[((df["Sex"] == 'male') & (df["Survived"]) == 1)].shape

세번째는 남성이고 살아남은 사람들을 뜻한다.