일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |
- 균일분포
- 조건부확률
- 확률밀도함수
- 표본평균
- 범주형자료
- pmf
- 수학적확률
- 연속확률변수
- 기댓값과 분산
- 절삭평균
- 모평균
- 이항분포
- 베르누이분포
- 누적분포함수
- 이산형
- 표본공간
- 행사다리꼴
- 통계학개론
- 모수
- 이변량자료
- 첨가행렬
- Anaconda
- 사조사
- 이산확률질량함수
- 포아송분포
- jupyter notebook
- 피어슨상관계수
- 통계학입문
- 기본행연산
- 수치형자료
- Today
- Total
목록2024/07 (8)
summ의 블로그
chain chain ? 단계의 출력이 다음 단계의 입력이 되는 프로세스. 한 task의 출력이 다음 task의 input이 됨 만약, prompt에 수식을 계산해 달라고 하면?계산을 실제로 하는게 아니라 '계산하는' 패턴을 학습하는 것임.여러 계산 수식을 하는 원리가 학습되어 있음.lstm으로 계산을 예측플러그인 > 수식을 생성 > 플러그인 사용 > 답 > llm으로 답변을 생성하여 보여줌chain의 종류 3가지 utility chain generic chaincombine document chain1. LLMMathChain: 수학 계산을 위한 Utility Chain from langchain_openai import ChatOpenAIfrom langchain.chains import LLMM..
프롬프트 프롬프트?사용자의 대화 주제나 방향을 설정하는 데 도움이 되거나시나리오에서 모델이 어떻게 반응하는지 평가하고 개선하는 데 사용이 됨. 구성 요소로 지시, 질문, 문맥, 입력, 예제, 답변 등이 들어감 주어진 context만 이용하여 대답하도록 설정함. prompt = """ Answer the ~~~. Context: ~~~. Question: ~~~. Answer: """ 1) langchain에 PromptTemplate 사용 from langchain import PromptTemplate 위에 만든 prompt를 이용하여 사용 prompt_template = PromptTemplate( inp..
Langchain이란 ?LLM 개발을 중점으로 둔 프레임워크 사용 전 pip install langchain코랩사용시 (!붙여서) langchian 구성 시 프롬프트 설정 필요 프롬프트란? 요구사항, 작업을 정의하기 위해 만들어짐. PromptTemplate을 가져와서 {변수}를 할당하며 초기화, 생성 prompt 생성됨. question이 prompt에 들어가 llm을 거쳐 답변을 사용자에게 알려줌. from langchain import PromptTemplatetemplate = """Question: {question}Answer: """prompt = PromptTemplate( template=template, input_variables=['question'])quest..
의사결정 나무 의사결정 나무는 회귀, 분류 문제에 모두 사용이 가능하다. 최상 root node 하단의 terminal node 존재.직관적이며, greedy로 학습이 진행됨. 나무가 깊어질수록 과적합 문제가 발생함. >>겹치지 않는 구역으로 데이터를 나눔. ==> 어떻게? - 회귀: 해당 구역에 있는 데이터의 실제 값과 예측값의 오차제곱합을 최소화함. SSR - 분류: 불순도 impurity를 최소화하도록 나눔. * 불순도란? 다른 데이터가 섞여 있는 정도를 뜻함. 불순도 측정 방법: 지니계수 이용. 지니계수: 구역 안에서 특정 클래스에 속하는 data 비율을 모두 제외한 값으로 다양성을 계산하는 방법임. = 1- (yes 의 확률)**2 - (no 의 확률)**2지니계..
머신러닝 머신러닝은지도학습 / 비지도학습 / 강화학습 으로 나뉜다. 비지도학습은Clustering / 차원축소 가 있다. y 라벨(정답)이 주어지지 않은 것이다. Clustering 클러스터링은 유사한 특성을 가진 개체끼리 군집화하는 것이다. 군집 간 유사성은 최소화 군집 내 유사성은 최대화 - hard: x 집단에 포함되는지 여부를 나타냄. k-means clustering 이 포함됨. k-means clustering: 제공된 데이터를 k개로 군집화.랜덤하게 각 군집의 중심을 정함. 이렇게 정한 중심을 기점으로 군집에 각 데이터를 할당. 원하는 결과가 나오지 않았을 땐 여러번 실행하면 됨. EM알고리즘을 기반으로 함. 대용량 데이터에 적합하며 시간과 비용이 적게 들음.- soft: ..
머신러닝 : 기계학습 지도학습 / 비지도학습 / 강화학습 으로 나뉜다. 지도학습은 회귀 / 분류 문제로 나뉜다. 회귀 회귀분석이란? 회귀식의 계수 beta0, beta1을 구하는 것. 각 데이터의 실제값과 예측값의 차이인 loss를 최소화하는게 목표이다. 선형회귀 / 다중회귀 / 다항회귀가 존재하며, 다항회귀는 차수가 높은것으로 데이터가 선형이 아니더라도 사용 가능하다. 과적합 방지 방법으로는 1. cross validation - k fold : 데이터 k번 나눠서 학습.2. 페널티 부여 - L1 L2 Elasticnet 방법이 존재한다. 회귀 평가지표도 존재한다. 1. SSR, MSE, MAE 평균제곱오차, 평균절대값오차2. R**2 결정계수 분류 분류란? 주어진 데이터 입력값 x ..
OpenAI api key 발급받기 우선, 모듈 설치부터 해준다. pip install openai 설치를 다 했으면, 주어진 링크로 이동하면 된다. https://platform.openai.com/playground/chat?models=gpt-4o OpenAI 플랫폼 링크로 여기에서 API KEY를 발급받을 수 있다. 로그인 후 아래 캡쳐에서 보이는 톱니바퀴 (Settings) 를 클릭한다. 그 후, 왼쪽칸에 보이는 Billing에 들어가 결제수단을 등록해준다. 이제 거의 다 되었다. 그 후 create new secret key 로 들어가 나만의 키를 생성하면 된다. 생성된 'sk-'로 시작되는 나만의 키를 환경변수에 저장하나 코랩의 경우에선 복사하여 사용하면 된다. 다른 사람이 보..
비모수란? 말 그대로 비 모수 --> 모수가 아니다 모집단의 성격이나 형태가 정해지지 않은 상태에서 검정을 시행하는 것이다. WHY? (모집단) 데이터의 수량이 적기 때문에 분포를 가정할 수 없음.--> 모집단에 대한 가정은 '연속' 이며 필요에 따라 '대칭성'을 추가로 가정할 수 있음. 비모수적 방법 1. 순수 비모수적 방법 모수 자체에 관심을 두지 않음. -> 분포형태에 관한 검정 2. 분포무관 방법귀무가설(H0)하에서 검정통계량의 분포가 모집단 분포와 무관한 검정. 분포무관 신뢰구간은 모집단의 분포함수에 영향을 받지 않음 특징 - 모수에 대한 가정이 필요 없다.- 모집단의 수가 적을수록 유용하다.- 검정통계량의 분포는 모집단 분포와 무관하다. - 간단한 모형을 사용하므로 직관적으로 이..