가설 생성과 검증
- 데이터 탐색 과정에서 발견한 특징을 바탕으로 가설을 세운다.
- 통계적 검정(예: t-test, 카이제곱 검정 등)으로 가설을 검증한다.
- 가설이 수용/기각되는지 판단하고, 추가 분석 방향을 설정한다.
예시:
- "남성과 여성의 평균 소득에 차이가 있을까?"
scipy.stats.ttest_ind(df[df['gender']=='M']['income'], df[df['gender']=='F']['income'])
예시:
- "남성과 여성의 평균 소득에 차이가 있을까?"
scipy.stats.ttest_ind(df[df['gender']=='M']['income'], df[df['gender']=='F']['income'])