Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- 확률밀도함수
- 모수
- 첨가행렬
- 행사다리꼴
- 수치형자료
- jupyter notebook
- 조건부확률
- 피어슨상관계수
- 절삭평균
- 표본공간
- 이항분포
- 모평균
- pmf
- 베르누이분포
- 기댓값과 분산
- 이산형
- Anaconda
- 누적분포함수
- 수학적확률
- 범주형자료
- 이산확률질량함수
- 사조사
- 통계학입문
- 균일분포
- 표본평균
- 통계학개론
- 이변량자료
- 포아송분포
- 기본행연산
- 연속확률변수
Archives
- Today
- Total
summ의 블로그
[dl] 데이터 학습 과정 정리 본문
* 개인 공부용 목적으로 정리한 것
데이터 학습 과정은 크게 6가지 단계로 나뉜다.
1. data 확인
- 독립변수 feature 종속변수 output
- 관계
2. data cleansing
- 노이즈 처리
- 누락값, 이상치
- scaling
- 정규화
3. data split
- 훈련 train 70 ~ 80%
- 검증 validation 10 ~ 15%
- 시험 test 5 ~ 20%
4. 모델 선택 및 설계
- 신경망 레이어 노드 수
- 손실함수 최적화
- 활성화함수
5. 모델 학습
- train data 모델 학습
6. 모델 검증 평가
- validation data 사용해서 모델 성능 평가, hyper parameter 조정
====> hyper parameter
- weight 가중치
- bias 절편
- batch size -- mini batch 배치 사이즈
- epoch 학습 횟수 epoch = 1 이면 전체 데이터 학습 1번 한 것
- learning rate 학습률 일반적으로 0.01
- loss function
- activation