일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 베르누이분포
- 균일분포
- Anaconda
- 확률밀도함수
- 첨가행렬
- jupyter notebook
- 이항분포
- 이변량자료
- 누적분포함수
- 기댓값과 분산
- 기본행연산
- 행사다리꼴
- 이산확률질량함수
- 사조사
- 통계학개론
- 표본공간
- 연속확률변수
- 범주형자료
- 수치형자료
- 이산형
- 절삭평균
- pmf
- 모수
- 포아송분포
- 표본평균
- 모평균
- 피어슨상관계수
- 수학적확률
- 통계학입문
- 조건부확률
- Today
- Total
목록아카이빙 (97)
summ의 블로그
recursive 재귀함수 나무위키에 따르면 재귀함수 (recursion) 는 정의 단계에서 자신을 재참조하는 함수를 뜻한다. 어떤 사건이 자신을 포함하고 다시 자기 자신을 사용하여 정의될 때 재귀적(recursive)이라고 한다. 일단 무언가를 설명할 때 자기를 포함한 것이라고 이해하면 편하다. 즉, 재귀함수는 함수 내에서 자기 자신을 다시 호출하여 복사본을 만든 후 복사본을 실행하는 함수이다. void recursive(void) { printf("recursive call"); recursive(); } 재귀함수를 사용할 때 탈출조건을 정립하지 않으면 계속해서 재귀함수가 실행된다. 따라서 함수가 실행을 멈추게 되는 탈출 조건의 정립이 필요하다. 재귀함수의 활용으로 팩토리얼 계산, 피보나치 수열, ..
공분산 / 상관계수 이전 게시글에서 두 확률변수의 결합분포에 관해 알아보았다. 이번 게시글에서는 두 확률변수에 관한 공분산과 상관계수를 정의해보려고 한다. 두 확률변수 함수의 기댓값 두 확률변수가 이산형일 때, 결합확률질량함수 p(x, y) 를 가진다. 임의의 함수 g에 관해 기댓값은 다음과 같이 정의할 수 있다. 두 확률변수가 연속형일 때, 결합확률밀도함수 f(x, y) 를 가진다. 기댓값은 다음과 같다. 따라서 임의의 실수 a,b 함수 g,h 에 대해 E(a * g(X, Y) + b * h(X, Y)) = a * E(g(X, Y)) + b * E(h(X, Y)) 임을 정의할 수 있다. 공분산 공분산 (covariance) 은 두 확률변수 X, Y 의 선형관계를 나타내는 양이라고 정의한다. 각각의 확률..
자격증 Adsp는 Advanced Data Analytics Semi-Professional의 약자로 데이터분석준전문가이다. 데이터 분석에 관한 내용이 주를 이루고 있으며, 내용이 그렇게 어렵지 않기 때문에 비전공자들도 많이 따는 추세이다. 일정 데이터분석 전문가는 데이터분석준전문가를 따거나 실무에서의 경험이 있을 때 응시 가능하다. 2023년 기준 연 4회이나 2024년부터는 연 2회로 응시기회가 줄어든다. 데이터분석 준전문가는 응시자격에 제한이 없으며, 연 4회 시행되고 있다. 과목 준전문가는 1/2/3 과목이 존재하며, 각각 10/10/30 문제이다. 여느 자격증과 비슷하게 과락 (40%) 기준과 평균 60점 이상이어야 획득할 수 있다. 준비물 규정 신분증 / 검정 볼펜 / 컴퓨터용 사인펜 / (수..
결합확률질량함수 / 결합확률밀도함수 / 주변확률분포 지금까지 여러 가지 확률변수와 확률분포에 관해 배웠다. 이러한 확률분포의 결합인 결합확률질량함수, 결합확률밀도함수에 대해 알아보자. 결합확률질량함수 하나의 표본공간에 두 개 이상의 이산확률변수를 할당할 수 있다. 예를 들어, 이산확률분포에서 동전 던지기 실험을 생각해 보자. 동전 던지기 실험에서 X를 앞면의 수로 나타낸 확률분포는 다음과 같다. x 0 1 2 합 P(X=x) 1/4 2/4 1/4 1 Y를 첫번째 결과가 앞면일 때 == 1 와 그렇지 않을 때 == 0 라고 정의하자. 동전을 두 번 던진다고 가정하면 Y의 확률분포는 다음과 같다. y 0 1 합 P(Y=y) 1/2 1/2 1 확률변수 X, Y를 합쳐 결합확률분포를 나타낼 수 있다. x 합 0..
감마분포 Gamma distribution 감마분포 감마분포는 두 모수가 양수이며, 감마함수를 이용하여 나타내는 확률분포이다. 지수분포와 비슷하게 a번째 사건이 일어나기까지의 시간을 알고 싶을 때 사용하는 확률분포이다. 확률분포는 다음과 같고, 기호는 X ~ Gamma (a, 1/λ) 로 표현한다. 감마분포의 기댓값은 a/λ 분산은 a/λ**2 이다. 여기에서 감마함수 Γ(a) 의 정의는 다음과 같다. 감마함수의 특징을 정리해 보면, Γ(1) = 1 Γ(a) = (a-1) Γ(a-1) Γ(n) = n-1! Γ(1/2) = √π 부분적분을 적용하고, a=n을 반복하여 계산해 보면 다음과 같은 성질이 정의되는 것을 알 수 있다. 앞서 말했듯이 감마분포는 지수분포와 연관이 있다. 지수분포를 일반화하여 감마분포..
지수분포 exponential distribution 지수분포 앞서 이산확률분포의 포아송 분포를 기억해 보자. 포아송 분포는 일정한 구간에서의 특정 사건의 수에 관한 확률분포이다. 그렇다면 첫번째 사건이 발생할 때까지의 시간에 관한 확률분포에 대해서는 어떻게 구할 수 있을까? 이때 지수분포를 이용할 수 있다. 지수분포는 일정한 구간에서 첫 번째 사건이 발생하기까지의 대기 평균 시간에 관한 확률분포이다. 시간이기에 당연히 양수값을 가지는 연속확률변수이며, 시간을 X라고 했을 때 누적분포함수는 다음과 같다. 따라서 확률밀도함수는 다음과 같고, 기호는 X ~ exp(1/λ) 로 나타낸다. 지수함수의 비기억성 지수함수는 '비기억성' 성질을 지니고 있다. 쉽게 말해서 과거와 상관없다, 이전일을 기억하지 못한다라고..
이진 탐색 알고리즘을 수행하기 전 한 가지 조건은 "배열에 저장된 데이터는 정렬이 되어있어야 한다." 이다. 이진 탐색 알고리즘은 배열을 반으로 줄여나가면서 내가 찾고자 하는 값의 위치를 알아내기 때문이다. 단계별로 소개해보면, 1. 배열 인덱스의 시작과 끝을 더한다. 2. 1의 결과값을 2로 나눈다. 3. 2의 결과값이 인덱스가 되며, 저장된 값이 내가 원하는 값인지 확인한다. 4-1. 맞음 4-2. 아니라면 3에서의 저장된 인덱스 값과 내가 원하는 값의 대소를 비교한다. 5. 인덱스를 기준으로 4의 결과에 의해 탐색의 범위를 제한할 수 있다. 6. 다시 1으로 돌아가 제한된 인덱스의 시작과 끝을 더한다. 7. 결과값을 2로 나눈다. (정수부분만 취함 8. 인덱스에 저장된 값이 내가 원하는 값인지 확인..
탐색 알고리즘에서 가장 먼저 접하게 되는 알고리즘이다. 이름에서부터 알 수 있듯이 내가 찾고자 하는 값을 차례대로 찾아 나서는 것이다. 코드로 보자면 다음과 같다. 앞서 말한대로 좋은 알고리즘을 위해서는 시간이 단축되어야 하며, 순차 탐색 알고리즘의 시간 단축을 위해서는 위의 코드에서 볼 수 있듯이 == 비교 연산자의 횟수가 적어야 한다. 이 알고리즘은 배열의 길이가 길면 연산 횟수가 많아져 시간이 오래 걸리는 단점이 있다.
자료구조를 배워야 하는 이유 위키백과에서 보면, 자료구조(資料構造, data structure)는 컴퓨터 과학에서 효율적인 접근 및 수정을 가능케 하는 자료의 조직, 관리, 저장을 의미한다. 더 정확히 말해, 자료 구조는 데이터 값의 모임, 또 데이터 간의 관계, 그리고 데이터에 적용할 수 있는 함수나 명령을 의미한다. 신중히 선택한 자료구조는 보다 효율적인 알고리즘을 사용할 수 있게 한다. 데이터의 표현 및 저장방법을 뜻하는 자료구조를 파악하고 있다면 효율적인 알고리즘을 사용이 가능하다. 이는 적은 메모리의 사용과 처리 속도의 향상으로 이어진다. 자료구조의 구분 크게 4가지 구조 선형구조, 비선형구조, 파일구조, 단순구조로 나뉜다. 선형구조 | 리스트 / 스택 / 큐 비선형구조 | 트리 / 그래프 파일..
정규분포 normal distribution 연속확률분포의 간판인 정규분포에 관해 알아보자. 정규분포 앞서 나온 확률분포들에서 볼 수 있듯이 충분한 표본 개수를 갖고 있다면 이들의 근사확률분포는 정규분포 형태를 지닌다. 확률밀도함수는 종모양을 나타내며 중심인 평균을 주위로 하고 있다. 좌우대칭인 것이 특징이며 중심으로부터 멀리 떨어진 값들이 많이 존재할수록 종 모양도 넓어진다. => 평균(중심)과 분산(폭)에 영향을 받는다. 확률밀도함수는 다음과 같고, 기호는 X ~ N(μ,σ^2) 로 나타낸다. 정규분포의 성질 정규분포를 따르는 확률변수가 존재한다면, 이 확률변수들의 선형 결합도 정규분포를 따른다는 것을 의미한다. 표준정규분포 정규분포 중 평균은 0 분산은 1인 정규분포를 표준정규분포라고 칭한다. 표준..