Pandas #2

각 index마다의 데이터를 선택해서 볼 수 있는 방법이 존재한다.

print(df['이름'])		//'이름'이라는 키를 가진 index를 출력
print(df[df.columns[0]])	//column중에 0번째 index를 출력
print(df[df.columns[-1]])	//column중에 가장 마지막 index 출력

아래와 같이 출력되는 것을 확인할 수 있다.

기존 파이썬의 배열에서 사용하던 슬라이싱도 여기서 그대로 사용할 수 있다.

print(df['영어'][0:5])		//영어 index의 0번째 부터 4번째 까지의 데이터 출력
print(df[['이름','키']][:3])	//이름과 키 데이터의 2번째 데이터 까지 출력

column별로 출력을 해줄 수 있지만 row 별로도 출력이 가능하다.

print(df.loc[1])	//1의 인덱스를 가진 row를 출력한다
print(df.loc[0:2])	//0부터 2까지의 인덱스를 가진 row를 출력한다

row를 출력하면 위와 같이 나오게 된다. loc는 인덱스의 값을 정확하게 알아야지만 해당 row를 가져올 수 있다. 하지만, 해당 Index를 정확히 모를 수도 있기 때문에 배열과 같이 index번호로 출력하게 하는 iloc라는 함수도 존재한다.

print(df.iloc[1])	//1번째 인덱스의 row를 가져온다.
print(df.iloc[0:5])	//슬라이싱도 가능하다

'Study/Machine Learning' 관련글