데이터 분석/Python - pandas

[실습] 데이터 집계 : 2024 LCK

toraa 2025. 1. 9. 21:39

1. lck_2024.csv 파일에서 0번 열을 인덱스로 하여 데이터프레임으로 로드

import pandas as pd
df_gm = pd.read_csv('data/lck_2024.csv',
                    encoding='cp949',
                   index_col=0)
df_gm

 

 

2. '리그KDA' 컬럼과 '서머KDA' 컬럼을 더해 2로 나눈 값을 '평균KDA' 컬럼으로 추가

df_gm['평균KDA']=(df_gm['리그KDA']+df_gm['서머KDA'])/2
df_gm

 

 

3. 팀 컬럼으로 그룹화 하여 그룹별 데뷔년의 평균을 산출

group_tm = df_gm.groupby(by='팀', as_index=False)['데뷔년도'].mean()
group_tm

 

 

4. 포지션 컬럼으로 그룹화 하여 그룹별 월즈우승, lck우승, 나이 평균을 산출

group_tm = df_gm.groupby(by='포지션', as_index=False)[['월즈우승','lck우승','나이']].mean()
group_tm

 

 

5. '팀'컬럼과 '포지션'컬럼으로 그룹화 하여 리그승률의 평균을 피벗 테이블로 표현

 - 피벗 결과 '팀'이 인덱스, ' 포지션'  컬럼으로 설정 되어야 함

pivot1 = pd.pivot_table(df_gm,
                       index='팀',
                       columns='포지션',
                       values='리그승률',
                       aggfunc='mean')
pivot1

 

 

6. '나이', 'lck우승', '리그경기수', '리그승률', '서머승률' 의 관계를 피어슨 상관계수 표로 표현

df_gm[['나이', 'lck우승', '리그경기수', '리그승률', '서머승률' ]].corr()