일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 수치형자료
- 절삭평균
- 표본평균
- 이항분포
- 이변량자료
- 행사다리꼴
- pmf
- 피어슨상관계수
- 이산확률질량함수
- 통계학입문
- 조건부확률
- 확률밀도함수
- 베르누이분포
- jupyter notebook
- 모평균
- 균일분포
- 기댓값과 분산
- 기본행연산
- 모수
- 표본공간
- 연속확률변수
- 누적분포함수
- 수학적확률
- 이산형
- 포아송분포
- 통계학개론
- 첨가행렬
- 사조사
- 범주형자료
- Anaconda
- Today
- Total
Syeonny의 블로그
[autoML] 간단한 정리 본문
Automated Machine Learning: 자동화된 머신러닝
모델 생성에서, 데이터셋의 특징에 따라 주어진 데이터셋에서는 어떤 기법이 최적인지 선택하는 것이 중요
--> 따라서 최적의 머신 러닝 알고리즘, 하이퍼파라미터 튜닝 등등 자동화가 필요
이때, autoML을 사용하여 비용과 시간을 줄이고, 모델의 정확도를 높일 수 있는 장점이 존재
사용은 둘로 나뉘는데
CASH ( Combined Algorithm Selection and Hyperparameter optimization)
최적화
NAS ( Neural Architecture Search )
신경망 탐색
autoML의 다양한 프레임워크가 존재: pycaret, H2O, TPOT, LightAutoML, autogluon •••
- pycaret
pycaret.classification.setup() 데이터를 자동으로 전처리하고 모델 학습에 적합하게 변환
data, target 변수 지정
normalize 스케일링 •••
pycaret.classification.compare_models() 모델 적용 비교
include, exclude 모델 유형 선택
fold 교차 검증
sort 정렬 기준 선정
n_select 선택할 상위 모델의 수 지정
pycaret.classification.tune_model() 하이퍼파라미터 최적화
- H2O
training_frame 모델을 훈련시킬 데이터 프레임을 지정
X, Y 변수 지정
max_runtime_secs_per_model 탐색 최대 시간
exclude_algos 제외할 알고리즘
leaderboard_frame AutoML이 훈련한 여러 모델의 성능 지표를 비교하고 순위 산정
'머신러닝' 카테고리의 다른 글
머신러닝 기초 (2) (0) | 2024.09.27 |
---|---|
머신러닝 기초 (0) | 2024.09.27 |
[ml] 간단한 정리 (3) (0) | 2024.07.10 |
[ml] 간단한 정리 (2) (0) | 2024.07.10 |
[ml] 간단한 정리 (1) (0) | 2024.07.10 |