일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 직장인자기계발
- 방콕여행
- Python
- 패스트캠퍼스
- Ai
- 리뷰
- 패캠챌린지
- 클라우드
- ChatGPT
- 빅데이터
- 상관분석
- 딥러닝
- 패스트캠퍼스후기
- 자동매매프로그램
- 직장인인강
- 머신러닝
- 파이썬을활용한시계열데이터분석A-Z올인원패키지
- API
- nlp
- airflow
- 챗지피티
- It
- DAGs
- 데이터
- 태국여행
- 독서리뷰
- 데이터분석
- 분석
- 파이썬
- 활성화함수
- Today
- Total
목록통계/검정 (6)
데이터를 기반으로

저번 글에 이어서 2번째 통계적 검정법인 'Kolmogorov-smirnov test'에 대해서 정리를 하고자 한다. (줄여서 KS-Test라고 부르기도 한다.) 먼저, 해당 검정법은 정규분포와 해당 변수의 분포를 비교해서 얼마나 차이가 많이 나는지 비교하는 방법으로 진행된다. 좀 더 자세하게 말하면 정규분의 누적분포와 검정하고자 하는 변수의 누적분포를 서로 비교하는 방법이다. 해당 검정을 진행하기 위한 조건 및 권장 사항에 대해서 확인하면 다음과 같다. 1. N은 50개 이상인 경우에 권장한다. 2. 비모수 검정이기에 분포에 대한 가정이 필요없다. 3. 연속형 변수에 적합하다. 해당 검정법의 원래 목적은 2변수에 대한 누적분포를 서로 비교하는 것인데, 현시대에 많은 통계 패키지 및 Tool 들이 옵션값..

이전 글에 이어 2번째 통계적 검정에 대해 알아보고자 한다. https://ds92.tistory.com/127 정규성 검정(Normality Test)(1) - 시각적 검정 통계학에서는 정규 분포를 굉장히 좋아하고 모든 분포가 정규 분포를 따르면 얼마나 좋을까? 라는 생각을 가끔 할 때도 있다. 이러한 이유는 모수적 통계 방법들을 적용하고 싶은 마음에서 나온 ds92.tistory.com [ 통계적 검정 ] 1. 샤피로-윌크 검정(Shapiro-Wilk test) → 정규성 검정에서 가장 많이 쓰이는 방법 중 하나이며 생각보다 위키피디아에 정리가 잘 되어 있었다. 해당 검정법은 가장 많이 쓰이는 검정법이며 작은 표본에서도 잘 작동하며, 정확한 검정을 제공하고 큰 표본에서는 검정 결과가 민감할 수 있다...

통계학에서는 정규 분포를 굉장히 좋아하고 모든 분포가 정규 분포를 따르면 얼마나 좋을까? 라는 생각을 가끔 할 때도 있다. 이러한 이유는 모수적 통계 방법들을 적용하고 싶은 마음에서 나온 것 같다. 자, 그럼 우리가 가지고있는 이 데이터가 정규분포여서 모수적 통계 방법들을 사용할 수 있기를 바라며 해당 데이터의 정규성 검정하는 방식에 대해서 설명을 하고자 한다. 정규성 검정에 대한 판단을 할 수 있는 것은 크게 2가지가 있다. - 시각적 검정 - 통계적 검정 먼저, 시각적 검정을 살펴보면 그래프를 직접 그려서 정규 분포를 확인하는 방법이다. 시각적 검정 방법에는 다양한 시각화 그래프가 이용된다. 우리는 그 중에서 히스토그램, Q-Q플랏, 박스 플랏을 확인해보고자 한다. [ 시각적 검정 ] 1. 히스토그램..

- 두 변수의 독립성을 검정하기 위해 카이제곱 독립성 검정 진행 - 모든 변수들 끼리 종속성이 존재하다고 나와서 크래머 v계수를 추출하여 해당 건 설명 사용 분석 기법 두 변수 간 독립성 검정(카이제곱) (검정 Process) - 가설 설립 (예시) H0(귀무가설) : A 변수와 B 변수간에 관련이 없다(독립이다) H1(대립가설) : A 변수와 B 변수간에 관련이 있다(독립이 아니다 = 종속성이 존재한다) - Chi-square indepence test를 이용한 가설 검정 p-value 값의 맞춰 가설 채택 (참고 링크 : https://en.wikipedia.org/wiki/Chi-squared_test ) Chi-squared test - Wikipedia From Wikipedia, the fre..
안녕하세요~~ 어제에 이어서 집단을 나눈 후!! 결과 분석에 대해서 글을 작성하고자 합니다!! 그렇게 집단을 나눈 후 집단이 얼만큼으로 나누어졌는지 확인을 해보니 A그룹과 B그룹을 각각 95명씩 할당이 되었습니다. 층별 인원도 각각 동일하게 추출되었습니다. 자, 이제!! 앞 글에서 말씀드렸지만 다시한번 정리해드리자면!! ----------------------------------------------------------------------------------------------------------------------------------------------A그룹(통제집단)은 일반적으로 기존에 저희가 보냈던 문구로 보내고B그룹(실험집단)은 할인율을 강조하는 문구로 문자를 보내고자 했습니다. ..
안녕하세요! 오늘은 과거에 진행했던 A/B테스트에 대해서 정리를 해볼까 합니다!! 사실 아직 유명하지 않은 쇼핑몰이고 고객이 적은 부분을 감안하여 본 글을 읽어주셨으면 합니다 :) 저희 회사에서 운영하는 쇼핑몰이 있어 고객들에게 할인 문자를 보내는 프로모션을 진행하고자 했습니다. 그 중 프로모션 관련 문자에 대한 A/B 테스트를 진행했습니다. A그룹(통제집단)은 일반적으로 기존에 저희가 보냈던 문구로 보내고 B그룹(실험집단)은 할인율을 강조하는 문구로 문자를 보내고자 했습니다. 우선 그룹을 구성하기 전 저는 모집단에서 표본을 추출할 때 층화표본추출법을 이용하고자 하였습니다.※ 모집단(쇼핑몰 고객 중 구매 이력이 1회 이상인 고객) 우선 층화추출법에 대한 위키백과에 나온 설명입니다~~ 다들 한번에 이해가실..