summ의 블로그

[autoML] 간단한 정리 본문

머신러닝

[autoML] 간단한 정리

summ._ 2024. 5. 4. 00:13

Automated Machine Learning: 자동화된 머신러닝

 

모델 생성에서, 데이터셋의 특징에 따라 주어진 데이터셋에서는 어떤 기법이 최적인지 선택하는 것이 중요

   --> 따라서 최적의 머신 러닝 알고리즘, 하이퍼파라미터 튜닝 등등 자동화가 필요

 

이때, autoML을 사용하여 비용과 시간을 줄이고, 모델의 정확도를 높일 수 있는 장점이 존재

 

 

사용은 둘로 나뉘는데

 

CASH ( Combined Algorithm Selection and Hyperparameter optimization)

  최적화 

NAS ( Neural Architecture Search )

  신경망 탐색 

 

 

 

autoML의 다양한 프레임워크가 존재: pycaret, H2O, TPOTLightAutoML, autogluon •••

 

- pycaret

 

pycaret.classification.setup() 데이터를 자동으로 전처리하고 모델 학습에 적합하게 변환

     data, target 변수 지정

     normalize 스케일링 •••

pycaret.classification.compare_models() 모델 적용 비교

    include, exclude 모델 유형 선택

    fold 교차 검증

    sort 정렬 기준 선정

    n_select  선택할 상위 모델의 수 지정

pycaret.classification.tune_model() 하이퍼파라미터 최적화

 

- H2O

 

training_frame 모델을 훈련시킬 데이터 프레임을 지정

     X, Y 변수 지정  

max_runtime_secs_per_model 탐색 최대 시간

exclude_algos 제외할 알고리즘 

leaderboard_frame AutoML이 훈련한 여러 모델의 성능 지표를 비교하고 순위 산정

'머신러닝' 카테고리의 다른 글

[ml] 간단한 정리 (3)  (0) 2024.07.10
[ml] 간단한 정리 (2)  (0) 2024.07.10
[ml] 간단한 정리 (1)  (0) 2024.07.10