일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 기댓값과 분산
- 피어슨상관계수
- 베르누이분포
- 이변량자료
- 모수
- 사조사
- 수학적확률
- 이산형
- 이항분포
- Anaconda
- 절삭평균
- 표본평균
- pmf
- 수치형자료
- 통계학개론
- 연속확률변수
- 확률밀도함수
- 기본행연산
- 통계학입문
- 행사다리꼴
- 조건부확률
- 포아송분포
- 범주형자료
- 이산확률질량함수
- 누적분포함수
- jupyter notebook
- 첨가행렬
- 균일분포
- 모평균
- 표본공간
- Today
- Total
목록2024/09 (26)
summ의 블로그
retrieval augmented generation 거대언어 hallucination 환각 문제 발생거대언어의 문제점: 최신 정보의 부재-> 극복방안: 분야의 제한 없이 광범위한 주제의 질문을 받고 답변하는 질의응답 시스템을 응용해서 RAG거대언어 이전: Q&A쌍을 만들어 둠쿼리 들어오면 제일 유사한 쿼리를 찾아냄. ex) 코사인 유사도이용 후 tf-idf를 이용한 벡터형으로 변환하여 저장 RAG : 검색된 정보를 바탕으로 언어 모델이 텍스트를 생성하는 방식으로 작동수집한 데이터를 일정 단위(문서 혹은 그보다 작은 단위)로 임베딩(Document Indexing)쿼리가 들어오면 임베딩하고 수집된 데이터 임베딩과 유사도를 비교해 가장 유사한 데이터 검색(Retriever)쿼리 + 데이터(문서)로 프롬프..
이표본 위치문제 맨 휘트니 U 검정 모든 자료에 대해 (Yj>Xi) 를 만족하는 쌍 자료의 개수를 이용함 검정통계량 맨 휘트니 U 검정통계량 혹은 가설설정 --> 검정통계량 구하기 --> 유의확률 유의수준 비교 --> 가설 선정 * 대표본근사 표본이 30보다 큰 경우에 사용하며 중심극한정리에 의해 R t.test(y, x, paried=FALSE, var.equal=FALSE, alternative="")wilcox.test(y, x, mu=0, alternative=c(), paried=FALSE)
이표본 위치문제윌콕슨 순위합 검정 두 집단 간 차이를 비교하는 문제 X와 Y의 혼합 표본을 구성함. rj를 구함. * 이 때 데이터 중 더 작은 데이터 값을 가진 데이터가 y가 됨 wilcoxon 검정 통계량: Ybar 표본에 부여된 순위의 합 이 값을 이용하여 검정 실행 * 유의확률 예시 윌콕슨 부호순위 검정과 다른 점 부호와 순위를 고려한 검정이나, 윌콕슨 순위합 검정은 순위들의 합을 고려. 윌콕슨 부호순위 검정은 부호와 순위로 고려. R wilcox.test(y,x, ~~) 반드시 데이터 수가 적은 처리그룹 먼저 넣음
agent agent?우리의 대리인이라 생각하면 됨사용자가 명령을 주면, (tool) 알아서 검토하고 작업 결과물을 전달함chain of thought 에 행동을 부여 agent를 사용하기 위한 세가지 기본 LLM tool control the interaction agent agent 작동 방식 input 할당 (사용자가) agent가 생각 action/action input 사용할 도구 tool 결정, 도구의 input 결정 도구의 출력 결과 관찰 observation 관찰 결과가 작업이 완료 됐다고 판단될 때까지 과정을 반복함. ex. 계산기 llmmathchain을 사용하여 계산하는 함수를 만들어서 사용할거임 = 초기화함 tool 생성함, 이 tool엔 llm_math.run 가 실행하도록 저장되..
일표본 위치문제대응비교 2 윌콕슨 부호순위 검정 부호와 순위 rank 를 고려한 검정 검정 절차 윌콕슨 부호순위 검정 절차 1. 가설 설정2. zi 구하기. zi = xi-theta03. 부호순위 통계량표 작성 후 W+ 값 설정4. 유의확률 p 선정 5. 유의확률 p값과 유의수준 a 비교하여 가설 선정. 대표본근사 표준화된 W+ 통계량 동점처리 |Zi| 에 0이 아닌 동점이 있다면 평균순위 theta0과 같은 값은 갖는다면 제외함. R wilcox.test(x, alternative = c("two.sided", "less", "greater"), mu = 0, paried = FALSE)
Containers 컨테이너 두 개 이상의 값을 저장함.리스트 딕셔너리 집합 튜플 컨테이너는 보통 iterable Iterator 이터레이터 여러 개를 반환, 반복 next()를 이용하여 순차적으로 반환함. 컨테이너는 iter()를 이용하여 이터레이터로 변환 가능함 Generater 제너레이터 yield 문으로 한번에 하나의 결과 반환.yield가 호출될 때마다 함수의 실행이 멈추고, 이후 다시 호출되면 멈춘 지점부터 다시 실행이미 만든 함수를 사용하는 것은 제너레이터에 해당함. 제너레이터는 [] 대신 () 사용을 함리스트 컴프리헨션을 사용하는 것보다 메모리 사용이 적기에 제너레이터를 사용함 리스트 컴프리헨션 모든 값에 대해 조건을 적용하고 결과를 다시 리스트로 표현[조건 for i in list_n..