[이론] 머신러닝 (Scikit-learn)
머신러닝 : 간단히 말하면, 기계가 학습을 통해 공식을 만들어냄
머신러닝의 학습방식 3가지
지도 학습(Supervised Learning)
출력, 즉 정답(라벨)을 사용자가 알려줌
사용자가 일일이 라벨링을 하는 작업이 필요해서 자원이 들어감
비지도 학습(Unsupervised Learning)
정답(라벨)이 없는 데이터에서 패턴을 찾아내는 방식
주로 군집화에서 많이 사용 (데이터 특성에 따라 군집을 나누는 것)
강화 학습(Reinforcement Learning)
보상(Reward) 체계로 기계가 행동을 하게 만듦
기계가 보상을 받는 방향으로 행동하도록 함
주로 자율주행, 로봇 분야에서 많이 활용
사이킷런(Scikit-learn)
https://scikit-learn.org/stable/
scikit-learn: machine learning in Python — scikit-learn 1.6.1 documentation
Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parameter tuning. Algorithms: Grid search, cross validation, metrics, and more...
scikit-learn.org
파이썬 기반 머신러닝 라이브러리
전통적으로 많이 사용된 머신러닝 방법
1. 회귀(Regression)
연속적인 값들을 통해 특정한 값을 예측할때
2. 분류(Classification)
특정값이 아니라, 특정한 분류로 데이터를 분류할때
데이터를 어떤 분류에 속하는지 예측 (특정 분류에 들어갈 확률)
분류들을 class라고 함 (분류가 여러개일 수 있음)
3. 군집화(Clustering)
지도학습으로 주로 진행되는 회귀,분류와 달리
데이터들의 특징을 보고 유사한 특징끼리 군집을 시키는 비지도 학습 기법