딥러닝
[dl] 데이터 학습 과정 정리
syeonny
2023. 10. 26. 12:32
* 개인 공부용 목적으로 정리한 것
데이터 학습 과정은 크게 6가지 단계로 나뉜다.
1. data 확인
- 독립변수 feature 종속변수 output
- 관계
2. data cleansing
- 노이즈 처리
- 누락값, 이상치
- scaling
- 정규화
3. data split
- 훈련 train 70 ~ 80%
- 검증 validation 10 ~ 15%
- 시험 test 5 ~ 20%
4. 모델 선택 및 설계
- 신경망 레이어 노드 수
- 손실함수 최적화
- 활성화함수
5. 모델 학습
- train data 모델 학습
6. 모델 검증 평가
- validation data 사용해서 모델 성능 평가, hyper parameter 조정
====> hyper parameter
- weight 가중치
- bias 절편
- batch size -- mini batch 배치 사이즈
- epoch 학습 횟수 epoch = 1 이면 전체 데이터 학습 1번 한 것
- learning rate 학습률 일반적으로 0.01
- loss function
- activation