1. 데이터 선택
각 index마다의 데이터를 선택해서 볼 수 있는 방법이 존재한다.
print(df['이름']) //'이름'이라는 키를 가진 index를 출력
print(df[df.columns[0]]) //column중에 0번째 index를 출력
print(df[df.columns[-1]]) //column중에 가장 마지막 index 출력
아래와 같이 출력되는 것을 확인할 수 있다.
기존 파이썬의 배열에서 사용하던 슬라이싱도 여기서 그대로 사용할 수 있다.
print(df['영어'][0:5]) //영어 index의 0번째 부터 4번째 까지의 데이터 출력
print(df[['이름','키']][:3]) //이름과 키 데이터의 2번째 데이터 까지 출력
column별로 출력을 해줄 수 있지만 row 별로도 출력이 가능하다.
print(df.loc[1]) //1의 인덱스를 가진 row를 출력한다
print(df.loc[0:2]) //0부터 2까지의 인덱스를 가진 row를 출력한다
row를 출력하면 위와 같이 나오게 된다. loc는 인덱스의 값을 정확하게 알아야지만 해당 row를 가져올 수 있다. 하지만, 해당 Index를 정확히 모를 수도 있기 때문에 배열과 같이 index번호로 출력하게 하는 iloc라는 함수도 존재한다.
print(df.iloc[1]) //1번째 인덱스의 row를 가져온다.
print(df.iloc[0:5]) //슬라이싱도 가능하다
'Study > Machine Learning' 카테고리의 다른 글
Pandas #1 (0) | 2022.03.09 |
---|---|
Machine Learning #3 (0) | 2022.02.03 |
Machine Learning #2 (0) | 2022.01.30 |
Machine Learning #1 (0) | 2022.01.20 |