1. lck_2024.csv 파일에서 0번 열을 인덱스로 하여 데이터프레임으로 로드
import pandas as pd
df_gm = pd.read_csv('data/lck_2024.csv',
encoding='cp949',
index_col=0)
df_gm
2. '리그KDA' 컬럼과 '서머KDA' 컬럼을 더해 2로 나눈 값을 '평균KDA' 컬럼으로 추가
df_gm['평균KDA']=(df_gm['리그KDA']+df_gm['서머KDA'])/2
df_gm
3. 팀 컬럼으로 그룹화 하여 그룹별 데뷔년의 평균을 산출
group_tm = df_gm.groupby(by='팀', as_index=False)['데뷔년도'].mean()
group_tm
4. 포지션 컬럼으로 그룹화 하여 그룹별 월즈우승, lck우승, 나이 평균을 산출
group_tm = df_gm.groupby(by='포지션', as_index=False)[['월즈우승','lck우승','나이']].mean()
group_tm
5. '팀'컬럼과 '포지션'컬럼으로 그룹화 하여 리그승률의 평균을 피벗 테이블로 표현
- 피벗 결과 '팀'이 인덱스, ' 포지션' 컬럼으로 설정 되어야 함
pivot1 = pd.pivot_table(df_gm,
index='팀',
columns='포지션',
values='리그승률',
aggfunc='mean')
pivot1
6. '나이', 'lck우승', '리그경기수', '리그승률', '서머승률' 의 관계를 피어슨 상관계수 표로 표현
df_gm[['나이', 'lck우승', '리그경기수', '리그승률', '서머승률' ]].corr()
'데이터 분석 > Python - pandas' 카테고리의 다른 글
[실습] 정보의 처리 : 2024 LCK (4) | 2025.01.10 |
---|---|
[이론] 정보의 처리 (전처리 함수들) (2) | 2025.01.10 |
[이론] 데이터 집계 (그룹화) (2) | 2025.01.09 |
[이론] 데이터타입 변환, 연산 처리 (2) | 2025.01.09 |
[실습] 조건 활용 인덱싱 (필터링) : LOL 아이템 (2) | 2025.01.09 |