데이터 분석/Python - pandas

[실습] 데이터 불러오기, 데이터 인덱싱 : LOL 아이템

toraa 2025. 1. 9. 13:40

1. data 폴더의 lol_item.csv 파일을 0번 열을 인덱스로 지정하여 데이터프레임으로 변수에 할당

import pandas as pd

df_lol = pd.read_csv('data/lol_item.csv',
                    index_col=0)



2. 읽어온 데이터프레임의 모든 컬럼을 출력하기

df_lol.columns

Index(['name', 'upper_item', 'explain', 'buy_price', 'sell_price', 'tag', '이름',
       '설명', '태그'],
      dtype='object')

▶ columns에 ()안붙이면 self변수

3. 읽어온 데이터프레임의 모든 인덱스 출력하기

df_lol.index

Index([1001, 1004, 1006, 1011, 1018, 1026, 1027, 1028, 1029, 1031,
       ...
       3801, 3802, 3812, 3814, 3850, 3851, 3853, 3859, 3860, 3916],
      dtype='int64', name='item_id', length=156)



4. '이름', '설명', '태그' 세 변수만 선택하여 데이터프레임으로 출력하기

df_lol[['이름', '설명', '태그']]


5. 인덱스(Person ID)가 1001,3001,3110 인 관측치에서 '이름', '태그' 변수를 선택하여 데이터프레임을 출력하기

df_lol.loc[[1001,3001,3110],['이름', '태그']]


6. 1 ~ 20 순서에 해당하는 관측치에서 0 ~ 4 순서에 해당하는 컬럼 선택하기

df_lol.iloc[1:21, 0:5]

 
▶ 슬라이싱할때 20이 아닌 21로, 4가 아닌 5로 설정해야 하는 것 잊지 말기!