summ의 블로그

[dl] 데이터 학습 과정 정리 본문

딥러닝

[dl] 데이터 학습 과정 정리

summ._ 2023. 10. 26. 12:32

* 개인 공부용 목적으로 정리한 것

 

데이터 학습 과정은 크게 6가지 단계로 나뉜다. 

 

1. data 확인 

- 독립변수 feature 종속변수 output

- 관계 

 

 

2. data cleansing  

- 노이즈 처리 

   - 누락값, 이상치 

- scaling 

   - 정규화

 

 

3. data split 

- 훈련 train 70 ~ 80%

- 검증 validation 10 ~ 15%

- 시험 test 5 ~ 20%

 

 

4. 모델 선택 및 설계 

- 신경망 레이어 노드 수 

- 손실함수 최적화 

- 활성화함수 

 

 

5. 모델 학습 

- train data 모델 학습 

 

 

6. 모델 검증 평가

- validation data 사용해서 모델 성능 평가, hyper parameter 조정 

 

 

 

====> hyper parameter 

- weight 가중치 

- bias 절편 

- batch size -- mini batch 배치 사이즈 

- epoch 학습 횟수 epoch = 1 이면 전체 데이터 학습 1번 한 것

- learning rate 학습률 일반적으로 0.01 

- loss function 

- activation