일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 베르누이분포
- jupyter notebook
- 표본공간
- 행사다리꼴
- 이산형
- 통계학개론
- 연속확률변수
- 범주형자료
- 기댓값과 분산
- 기본행연산
- 이변량자료
- Anaconda
- 모평균
- 첨가행렬
- 수학적확률
- 포아송분포
- 누적분포함수
- 표본평균
- pmf
- 통계학입문
- 이산확률질량함수
- 피어슨상관계수
- 사조사
- 절삭평균
- 균일분포
- 수치형자료
- 모수
- 확률밀도함수
- 이항분포
- 조건부확률
- Today
- Total
목록아카이빙 (97)
summ의 블로그
넘파이 numpy 기초 2 배열 인덱싱 배열 슬라이싱이 가능하다. 배열의 슬라이스로 만든 배열은 본래의 배열과 공유하고 있기 때문에, 수정하면 본래의 배열도 같이 수정된다. a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]]) a b = a[:2, 1:3] print(b) 정수 인덱싱과 슬라이스 인덱싱 정수 인덱싱과 슬라이스 인덱싱을 동시에 실행 가능하다. 그러나 이때 주의할 점이 있는데, 배열의 차원이 감소한다는 것이다. a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]]) print(a, a.shape) row1 = a[1, :] print(row1, row1.shape) 기본 연산 연산자와 함수를 사용한 배열 연산이 가능하다..
네 번째 책 추천 포스팅 애쓰지 않아도 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 애쓰지 않아도 최은영 나무옆의자 출판 책은 짧은 글 여러 개로 구성되어 있기에 책을 많이 읽어보지 않은 사람들도 금방금방 읽을 수 있을 것이다. 이 책의 제목인 "애쓰지 않아도" 의 내용은 소설 속 인물 '유나'를 선망하던 중학생 '나'에 관한 이야기이다. 나는 이제 애쓰지 않아도 유나를 별다른 감정 없이 기억할 수 있다. 아마 영원히 그 애를 이해할 수는 없겠지만. 그런데도 나는 여전히 알고 싶다. 유나는 나를 어떻게 기억하고 있을까. 그 애는 지금의 나를 어떻게 생각할까.
seaborn 을 이용해서 간단한 그래프를 그리는 방법 우선 seaborn 먼저 작성해 준다. import pandas as pd import seaborn as sns 그래프 그릴 때 사용할 데이터는 titanic 데이터이다. df = sns.load_dataset('titanic') titanic 데이터의 변수 목록은 위와 같다. sns.histplot(df['age'], bins = 20) bins = 지정하여 구간의 갯수를 설정한다. sns.histplot(df['age'], bins = 30, kde = True) kde 를 이용해서 확률밀도함수를 그릴 수 있다. sns.countplot(x = 'pclass', hue = "who", data = df) hue 는 색상을 지정할 열의 이름이나 ..
* 저는 통계학과 복수전공 중이며, 통계프로그램 SAS SPSS 배우기 싫어서 수업 안 하는 전공 강의만 골라 들었습니다. 사회조사분석사 2급 응시하기 전에 자신이 시험 3개 다 공부 잘 할 자신 있다면.. 접수하시길 바랍니다. 다른 자격증에 비해 자격증 하나 취득하려고 시험 3번 보는 건 비효율적이라고 생각이 듭니다. 만약 떨어졌다? 그러면 다신 안봤을 거 같네요 ㅎㅎ ( 그래서 한 번만에 붙어서 다행이라고 생각해요 그러니까 무조건 !!! 갓성비 공부법을 통해 자격증을 취득하셨으면 해요 *필기 우선 필기같은 경우는 CBT 돌리면 금방 합격선은 넘을 것이라고 생각합니다. 인터넷에 돌아다니는 개념 요약집으로 간단하게 훑은 다음에 양치기로 문제 푸시면 됩니다. 저 같은 경우는 암기를 잘 못해서 통계 부분 말..
R studio 를 활용하여 그래프 그리는 방법 그래프를 그리기 앞서 변수를 할당한다. x, y 를 원하는 값으로 지정해 준다. x = seq(-2, 2, by = 0.1) y = exp(-x) + x^2 이 때 그래프를 그리는 방법은 plot() 함수를 사용하면 된다. plot(x, y, type='l') points(x[1], y[1], col = "1", pch = 20) plot(x, y, type = "" ) 이 외에 col, pch, lty 등등을 사용하여 나타낼 수 있다. type 는 그래프를 p (plot) 산점도 형식, l (line) 선, b 는 점과 선을 함께 표시하는 것이다. col 은 색상을 나타내는데 여기서 1은 검정을 뜻한다. 내장된 값으로 검정 --> 빨강 --> 초록 -->..
넘파이 넘파이는 전체 데이터 배열에 대해 빠른 연산을 제공해 주는 것이 특징이다. 또한, 선형대수, 난수 발생, 푸리에 변환 등이 가능하다. numpy 를 시작하기 앞서 import numpy as np 먼저 실행시켜 준다. ( 없다면 pip install numpy 부터 다차원 배열 numpy의 기본 자료형은 ndarray 으로 같은 종류의 데이터를 담을 수 있는 다차원 배열이다. a = [1, 2, 3, 4, 5, 6] print(a) b = [[1, 2, 3], [4, 5, 6]] print(b) c = [1, 'a', 3.5] print(c) np.array()로 생성 가능하다. a = np.array([[1,2,3],[4,5,6]]) 구조 확인은 shape 이나 ndim 으로 가능하다. a.sh..
세 번째 책 추천 포스팅 불편한 편의점 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 불편한 편의점 김호연 나무옆의자 출판 나 역시 편의점 알바를 해 본 적이 있기에 책 제목에 끌렸지만, 편의점 아르바이트했던 기억이 떠올라 어느 내용인지 지레짐작하고 남들이 추천할 때 꿋꿋하게 읽지 않고 있었다. 그러나 친구가 이 책을 선물해 주어 읽게 되었다. 주 스토리는 편의점 always 점장님과 ”독고“라는 노숙자를 중심으로 전개된다. 책을 읽어나가면서 “독고”의 캐릭터가 무척이나 흥미롭게 느껴졌다. 독자가 독고의 노숙자 이전에 어떠한 삶을 살았는지 궁금하게, 계속해서 읽고 싶어졌다. 마지막 장의 내용이 참 좋다.
* 개인 공부용 목적으로 정리한 것 데이터 학습 과정은 크게 6가지 단계로 나뉜다. 1. data 확인 - 독립변수 feature 종속변수 output- 관계 2. data cleansing - 노이즈 처리 - 누락값, 이상치 - scaling - 정규화 3. data split - 훈련 train 70 ~ 80%- 검증 validation 10 ~ 15%- 시험 test 5 ~ 20% 4. 모델 선택 및 설계 - 신경망 레이어 노드 수 - 손실함수 최적화 - 활성화함수 5. 모델 학습 - train data 모델 학습 6. 모델 검증 평가- validation data 사용해서 모델 성능 평가, hyper parameter 조정 ====> hyper parameter ..
정기기사 3회 실기가 시작됐다 10/7일에 필답형 시험을 보고 왔다 공부할 시간이 적어서 진짜 기출 1번밖에 못 돌리고 가서 걱정이 엄청 됐다 그치만 걱정이 또 안 됨 진짜 내 마음은 몰까.. 차라리 전공 공부가 훨씬 낫다는 생각이 들었고 조사방법론 암기가 너무 싫었다 시대고시 실기 책 한권으로 공부했다. 다들 질문지 작성을 버리니 뭐니의 블로그 내용이 많았는데 책에 있는 예제 한번씩만 보고 가면 아예 똑같이 나오는 듯..? 그래서 아 더 자세히 볼 걸 이라는 생각이 들었다 그냥 대충냄 다음에 또 볼 생각으로.. 역시 학기 중에는 전공 관련 자격증이 아닌 이상 못하겠다 ㅎㅎ 통계프로그램은 공부할 날이 진짜 2일밖에 안돼서 얼마나 할 수 있을지는 모르겠다 [[[인과관계 눈덩이 척도 조사오류 질문지 표본추출..
최소제곱법 점이 존재하고, 내가 고려하는 함수가 존재할 때 함수와 점의 실제 차이를 구하는 방법에 관해 알아보자. 최소제곱직선과 최소제곱법 최소제곱직선은 y값(점)과 함숫값의 차이의 제곱합을 계산해서 후보 함수 중 최소가 되는 최적의 직선을 선택하는 것이다. 최소 제곱 직선은 최소 제곱법을 이용하여 찾을 수 있다. 최소제곱법 ordinary least squares 은? 어떤 계의 해방정식을 근사적으로 구하는 방법으로, 근사적으로 구하려는 해와 실제 해의 오차의 제곱의 합 이 최소가 되는 해를 구하는 방법으로 줄여서 OLS 라고 불린다. S(a0, a1) 안의 함수가 최소가 되게 해주는 a값들이 argmin이다. 우선 Sxx Syy를 가정하자. 이를 통해 argmin 구하는 과정을 살펴보면 다음과 같다...