일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 피어슨상관계수
- 포아송분포
- 범주형자료
- 조건부확률
- 표본공간
- 모평균
- 사조사
- jupyter notebook
- 균일분포
- 이산형
- 이항분포
- 절삭평균
- 수치형자료
- 첨가행렬
- Anaconda
- 수학적확률
- 베르누이분포
- 이산확률질량함수
- 기본행연산
- 이변량자료
- pmf
- 통계학입문
- 행사다리꼴
- 모수
- 누적분포함수
- 통계학개론
- 표본평균
- 확률밀도함수
- 기댓값과 분산
- 연속확률변수
- Today
- Total
목록전체 글 (97)
summ의 블로그
240910Python 왕기초 (4) 시각화 라이브러리 기본 차트 그리기plt.plot(x, y, color = '', marker = 'o')*축약해서 'r-' red solid line 도 가능plt.plot(df['x열'], df['행']) x축 y축 이름 지정 x.label('이름')제목 지정 plt.title('제목')범례 표시 legend 그래프 크기 지정 plt.figure(figsize = (숫자, 숫자))그래프 나눠 그리기 subplot(row, column, index) 산점도 plt.scatter(x,y)히스토그램plt.hist(x, bins=구간, density = True/False, facecolor='내부색', alpha=투명도 조절)sns.histplot(x='변수', d..
MultiQueryRetriever 초기화 logging 설정¶디버깅이나 모니터링을 위하여 소프트웨어 동작 상태 정보를 기록해서 볼 수 있음로그(log)를 생성하도록 시스템을 작성하는 활동문제가 발생하는 경우 로그가 중요한 정보를 제공하기에 문제 진단, 해결가능INFO: 상태 변경과 같은 정보성 로그를 표시retriever.get_relevant_documents 질의와 관련된 문서를 검색하고 반환쿼리와 관련하여 검색기가 찾은 문서 수: 5개Adding the Generation in RAG지금까진 쿼리로 구동되는 rag를 구축템플릿 생성 추가, 체인 생성Chaining Everything with a SequentialChain여러 개의 체인을 연결d.page_content: 텍스트 콘텐츠 추출, 검색..
240909 Python 시계열 분석 기초 날짜 추출 날짜 타입으로 변환df = pd.to_datetime(df, format = '입력되는 날짜 형식') format 형식 '%d/%m/%Y' 이나 '%d-%m-%Y' 상관없음. 내가 원하는 대로 적으면 된다. 연도 df.dt.year월df.dt.month일df.dt.day요일 df.dt.weekday요일 이름 df.dt.day_name() 시간에 따른 흐름 추가 shift 데이터나 인덱스를 원하는 기간만큼 민다. 데이터를 행 기준 하나씩 민다고 생각. df.shift(periods=1, freq=None, axis=0, fill_value=NoDefault.no_default) period 기간 default 1freq=infer 이면 추론..
240909Python 왕기초 (3) 데이터프레임 - 열 열 이름 변경 renamedf.rename(columns={본래 이름:변경할 이름}, inplace=True)열 삭제 dropdf.drop('삭제할 열', axis = 1, inplace=True)map map( 안에 lambda식 가능 )df['변경할 열'] = df['변경할 열'].map({변경할 것 : 변경 값, 변경할 것: 변경 값})비닝 pd.cut(df['열'], bins = [구간1,구간2] , labels = ['이름1','이름2']) 수치형 구간화하는 것이기에 pd.cut 데이터프레임 - 병합 concat pd.concat([df1, df2], axis = 0, join = 'inner' 'outer')그대로 행/열에 결합ax..
이표본척도 앤서리 브래들리 검정 *이표본척도: 중심이 아닌 분산의 동질성에 대해 검정 앤서리 브래들리 검정 서로 독립인 두 모집단 간 척도모수 동일성에 대한 검정 *척도모수: 이미 위치모수(평균)가 같음 전제 1. 표본 X Y 혼합 표본을 오름차순으로 정렬2. 최소와 최대값을 갖는 표본에 1순위를 주며 ~~ 반복. 대칭 순위 부여3. Xi에 주어진 순위를 Ri라 할 때 앤서리 브래들리 통계량 앤서리 브래들리 통계량 ansari.test(x,y, alternative="two.sided" "less" "greater")
240906Python 왕기초 (2) numpy 넘파이 설치 및 불러오기pip install numpyimport numpy as np 1차원 리스트2차원 행렬3차원 벡터 축 2차원 axis 0 행 axis 1 열 np.arraynp.array()로 array 만들기array1 = np.array([1,2,3,4,5])array2 = np.array([[1,2,3],[4,5,6]])array3 = np.array([[[1,2,3],[4,5,6]]])print(array1.shape)print(array2.shape)print(array3.shape) 3차원 차원 / 행 / 열 차원 확인 방법 이름.ndim이름.shape이름.dtype 차원 변경 이름.reshape(n,n) n은 여기서 만들고자 하는 차..
Streaming의 이유빠른 답변적응형 상호작용효율성 1. Stdout 사용streaming=TrueStreamingStdOutCallbackHandler와 같이 토큰이 생성될 때 그대로 출력 import osfrom langchain.chat_models import ChatOpenAIfrom langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandlerimport osOPENAI_API_KEY = os.environ.get('OPENAI_API_KEY')llm = ChatOpenAI( openai_api_key=OPENAI_API_KEY, temperature=0.0, model_name="gpt-3.5-turbo..
대응비교 표본이 서로 독립이 아닐 때 대응 비교를 사용함ex) 처리 전 후 차이 --> 대응비교 시 부호검정 통계량, 부호순위검정 통계량을 사용함 절차 가설 설정 --> 검정통계량 값 구하고 --> 통계량 표를 이용하여 유의확률 구하여 유의수준과 비교 --> 가설 선택 R 대응비교 **paired = TRUE** 필수t.test(y, x, paried=TRUE, alternative="")wilcox.test(y-x, alternative="")
240905 Python 왕기초 (1) range range(시작, 끝, 증가)시작값 생략 시 default: 0항상 끝 값 -1까지 보여줌. 끝값 포함 안됨 증가값 생략 시 default: 1 리스트 리스트 생성: [] 리스트 조회인덱스 이용: 리스트[인덱스 번호]인덱스 슬라이싱: 리스트[시작:끝] 끝에서 -1까지 보여줌. 끝값 포함 안됨양수 인덱스: 0 1 2 3 4 5 음수 인덱스: -6 -5 -4 -3 -2 -1리스트 추가: 리스트.append(추가할 값)리스트 수정: 리스트[수정할 인덱스] = 수정할 것 리스트 삭제del 리스트[인덱스]리스트.remove(값)리스트 추가: list.pop(인덱스) 딕셔너리 키:값 상태로 저장딕셔너리 생성: {키:값, 키:값, ...}딕셔너리 조회키만 조회:..