일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- pmf
- 누적분포함수
- 통계학개론
- 기댓값과 분산
- 행사다리꼴
- 수학적확률
- 이변량자료
- 베르누이분포
- Anaconda
- 수치형자료
- 확률밀도함수
- jupyter notebook
- 이항분포
- 조건부확률
- 범주형자료
- 표본공간
- 연속확률변수
- 기본행연산
- 통계학입문
- 모수
- 이산형
- 모평균
- 표본평균
- 첨가행렬
- 포아송분포
- 균일분포
- 절삭평균
- 사조사
- 피어슨상관계수
- 이산확률질량함수
- Today
- Total
목록2024/09/27 (2)
summ의 블로그
240927회귀모델 / 분류모델 성능 평가 회귀모델 + 통계적 지식 회귀분석: 둘 이상의 변수 간 관계를 보여주는 통계적인 방법. ' 관계식을 만들어서 실제 값을 예측 ' 단순 선형 회귀 모형 - 표본 회귀 y hat = B0 hat + B1 hat * X 회귀모델에서 우리가 하고자 하는 건: 회귀계수 B0, B1 추정하는 것임 ==> 적합값 yi hat = b0+b1*xi( 표본회귀직선의 추정값 ) y 실제 값y hat 예측값 (보통 우리가 구하고자 하는 모든 예측(추정 값)은 hat이 붙음)y bar 평균값 error 가 무조건 존재하는데, 이 error = 오차 를 줄여야 함. (오차란? 예측 값과 실제 값의 차이 : yhat-y) 예측값이 실제 값과 가까우면 == 당연히 오차는 작은 값은 ..
240926 머신러닝 기초 - 지도학습 데이터 불러오기 → 전처리 → 모델링 → 시각화 df = pd.read_csv(path) df EDA데이터 확인 - shape, info(), describe(), corr()불필요한 열 제거 nan null 값 처리 필수 확인 방법: isna().sum() isnull().sum() 제거 혹은 채우기 - 평균으로 채우기 fillna(df[''].mean, inplace=True)- 최빈값으로 채우기 fillna(df[''].mode()[0], inplace=True)- 바로 앞/뒤 값으로 채우기 fillna(method='ffill' 'bfill')- 보간법으로 채우기 : 선형, 다중 interpolate(method='linear' 'polynomial')필요..