[실습] 데이터 집계 : 2024 LCK

데이터 분석/Python - pandas

[실습] 데이터 집계 : 2024 LCK

toraa 2025. 1. 9. 21:39

1. lck_2024.csv 파일에서 0번 열을 인덱스로 하여 데이터프레임으로 로드

import pandas as pd
df_gm = pd.read_csv('data/lck_2024.csv',
                    encoding='cp949',
                   index_col=0)
df_gm

2. '리그KDA' 컬럼과 '서머KDA' 컬럼을 더해 2로 나눈 값을 '평균KDA' 컬럼으로 추가

df_gm['평균KDA']=(df_gm['리그KDA']+df_gm['서머KDA'])/2
df_gm

3. 팀 컬럼으로 그룹화 하여 그룹별 데뷔년의 평균을 산출

group_tm = df_gm.groupby(by='팀', as_index=False)['데뷔년도'].mean()
group_tm

4. 포지션 컬럼으로 그룹화 하여 그룹별 월즈우승, lck우승, 나이 평균을 산출

group_tm = df_gm.groupby(by='포지션', as_index=False)[['월즈우승','lck우승','나이']].mean()
group_tm

5. '팀'컬럼과 '포지션'컬럼으로 그룹화 하여 리그승률의 평균을 피벗 테이블로 표현

- 피벗 결과 '팀'이 인덱스, ' 포지션' 컬럼으로 설정 되어야 함

pivot1 = pd.pivot_table(df_gm,
                       index='팀',
                       columns='포지션',
                       values='리그승률',
                       aggfunc='mean')
pivot1

6. '나이', 'lck우승', '리그경기수', '리그승률', '서머승률' 의 관계를 피어슨 상관계수 표로 표현

df_gm[['나이', 'lck우승', '리그경기수', '리그승률', '서머승률' ]].corr()

저작자표시 (새창열림)

'데이터 분석 > Python - pandas' 카테고리의 다른 글

[실습] 정보의 처리 : 2024 LCK (4)	2025.01.10
[이론] 정보의 처리 (전처리 함수들) (2)	2025.01.10
[이론] 데이터 집계 (그룹화) (2)	2025.01.09
[이론] 데이터타입 변환, 연산 처리 (2)	2025.01.09
[실습] 조건 활용 인덱싱 (필터링) : LOL 아이템 (2)	2025.01.09

현재글[실습] 데이터 집계 : 2024 LCK

기록 저장소

[실습] 데이터 집계 : 2024 LCK

'데이터 분석 > Python - pandas' 카테고리의 다른 글

'데이터 분석/Python - pandas'의 다른글

티스토리툴바

[실습] 데이터 집계 : 2024 LCK

'데이터 분석 > Python - pandas' 카테고리의 다른 글

'데이터 분석/Python - pandas'의 다른글

관련글

티스토리툴바