01-020. 데이터 분석으로 하는 일
데이터 분석으로 하는 일
데이터 분석으로 하는 일과 분석 후에 나오는 결과물에 대해 알아보자.
현황 파악하기
지금 상황이 어떤지 숫자로 정리해서 알려준다. 매출이 얼마인지, 고객이 몇 명인지, 어떤 상품이 잘 팔리는지 같은 것들을 정리한다. 보통 대시보드를 만들거나 리포트를 작성해서 한눈에 볼 수 있게 해준다.
문제 원인 찾기
무엇인가 잘못되었을 때 왜 그런지 데이터를 뒤져서 원인을 찾는다. 회사의 매출이 떨어졌다면 언제부터 떨어졌는지, 어떤 상품 때문인지, 어떤 지역에서 문제가 생겼는지 파악한다.
미래 예측하기
과거 데이터를 보고 앞으로 어떻게 될지 예상해본다. 지금까지의 매출 패턴을 볼 때 다음 달 매출이 얼마나 될지, 재고를 얼마나 준비해야 할지 같은 것들을 예측한다.
패턴과 트렌드 발견하기
데이터에서 반복되는 패턴이나 변화하는 경향을 찾아낸다. 계절별로 어떤 상품이 잘 팔리는지, 고객들의 구매 습관이 어떻게 바뀌고 있는지 알아낸다.
이와 갈은 데이터 분석 결과물로 보고서나 검정 결과, 발표 슬라이드를 만들며 요청한 사람에게 설명한다.
데이터 분석 보고서 - Data analysis report
데이터 분석의 결과물 중 가장 중요한 것이 결국 보고서다. 데이터 분석의 결과는 결국 보고서로 표현된다. 아무리 좋은 분석을 했더라도 보고서를 잘 작성하지 못하면 그 가치가 전달되지 않는다. 보고서는 의사결정권자나 이해관계자들이 쉽게 이해할 수 있도록 작성해야 한다.
데이터 분석 보고서의 구성
데이터 분석 보고서는 정해진 양식은 없지만 많이 쓰는 형식이 있으며 넣어야 할 항목들이 있다. 분석 보고서의 형식은 AI챗봇을 이용하면 확인할 수 있다.
💻참고 프롬프트: 데이터 분석 보고서에 있어야 해는 항목에 대해서 알려주세요.
1. 요약(Executive Summary)
- 분석의 핵심 결과와 주요 인사이트를 한 페이지로 요약
- 바쁜 의사결정권자들이 빠르게 파악할 수 있도록 작성
2. 분석 목적 및 배경
- 왜 이 분석을 하게 되었는지 배경 설명
- 해결하고자 하는 문제나 답하고자 하는 질문 명시
3. 데이터 설명
- 사용한 데이터의 출처, 기간, 규모 설명
- 데이터의 한계점이나 주의사항 언급
4. 분석 방법
- 어떤 분석 기법을 사용했는지 간단히 설명
- 전문가가 아닌 사람도 이해할 수 있는 수준으로 작성
5. 분석 결과
- 시각화 자료(그래프, 차트)를 활용하여 결과 제시
- 숫자보다는 의미와 해석에 중점을 둔 설명
6. 결론 및 제언
- 분석을 통해 얻은 인사이트 정리
- 구체적이고 실행 가능한 제언 제시
샘플 데이터 분석 보고서
분석 보고서의 샘플이다. 데이터 분석 보고서에는 표준 같은 것은 없으므로 어떤 흐름으로 어떤 항목을 작성하는지만 알아두어도 된다. 데이터 프로세싱 후에 결과물을 AI에게 주고 초안을 작성하게 하고 그 후에 사람이 수정할 수 있다.
온라인 쇼핑몰 매출 분석 보고서
1. 요약
2024년 3분기 온라인 쇼핑몰 매출 분석 결과, 전년 동기 대비 15% 증가한 12억원을 기록했다. 모바일 매출이 전체의 70%를 차지하며, 20-30대 고객층이 주요 구매층으로 나타났다. 의류 카테고리가 가장 높은 매출을 보였으나, 전자제품 카테고리의 성장률이 가장 높았다.
주요 제언:
- 모바일 사용자 경험 개선에 집중 투자
- 전자제품 카테고리 상품 확대
- 40대 이상 고객층 타겟 마케팅 강화
2. 분석 목적
3분기 매출 실적을 분석하여 4분기 마케팅 전략 수립과 내년도 사업 계획에 활용하기 위함이다.
3. 데이터 개요
- 분석 기간: 2024년 7월 1일 ~ 9월 30일 (3개월)
- 데이터 규모: 주문 데이터 총 45,000건
- 데이터 출처: 쇼핑몰 주문 관리 시스템
- 주요 변수: 주문일시, 고객 연령, 성별, 상품 카테고리, 주문 금액, 접속 기기
4. 주요 분석 결과
4-1. 전체 매출 현황
- 3분기 총 매출: 12억원 (전년 동기 대비 +15%)
- 월평균 매출: 4억원
- 일평균 주문 건수: 489건
4-2. 기기별 매출 분석
- 모바일: 8.4억원 (70%)
- PC: 3.6억원 (30%)
- 모바일 매출 비중이 전년 대비 5%p 증가
4-3. 연령대별 구매 패턴
- 20대: 35% (4.2억원)
- 30대: 28% (3.4억원)
- 40대: 22% (2.6억원)
- 50대 이상: 15% (1.8억원)
4-4. 상품 카테고리별 매출
- 의류: 4.8억원 (40%)
- 전자제품: 2.4억원 (20%, 전년 대비 +25%)
- 생활용품: 2.2억원 (18%)
- 화장품: 1.8억원 (15%)
- 기타: 0.8억원 (7%)
5. 주요 인사이트
5-1. 모바일 중심의 쇼핑 트렌드 가속화
모바일을 통한 매출이 전체의 70%를 차지함, 이는 전년 대비 5%p 증가한 수치. 특히 20-30대 고객층에서 모바일 구매 비중이 80% 이상으로 나타남.
5-2. 전자제품 카테고리의 급성장
전자제품 카테고리가 전년 대비 25% 성장하며 가장 높은 성장률을 보였음. 스마트폰 액세서리와 웨어러블 기기의 인기가 주요 성장 동력으로 분석됨.
5-3. 40대 이상 고객층의 성장 잠재력
40대 이상 고객층의 매출 비중은 37%이지만, 1인당 평균 구매 금액이 20-30대보다 30% 높아 중요한 고객층으로 분석됨.
6. 제언사항
6-1. 모바일 최적화 강화 (우선순위: 높음)
- 모바일 앱 사용성 개선 및 결제 프로세스 간소화
- 모바일 전용 프로모션 및 혜택 확대
- 예상 효과: 모바일 매출 10% 추가 증가
6-2. 전자제품 카테고리 확대 (우선순위: 높음)
- 인기 브랜드 및 신제품 입점 확대
- 전자제품 전문 큐레이션 서비스 도입
- 예상 효과: 전자제품 매출 20% 추가 증가
6-3. 시니어 고객층 타겟 마케팅 (우선순위: 중간)
- 40-50대 선호 상품군 확대
- 시니어 친화적 UI/UX 개선
- 오프라인 연계 서비스 검토
- 예상 효과: 시니어층 매출 15% 증가
7. 다음 단계
- 4분기 마케팅 예산의 60%를 모바일 채널에 집중 배정
- 전자제품 카테고리 담당자와 상품 확대 계획 수립
- 시니어 고객층 대상 설문조사 실시하여 니즈 파악
이런 형식의 데이터 분석 보고서가 의사결정자들이 쉽게 이해하고 실행할 수 있는 인사이트를 제공한다. 보고서는 읽는 사람의 선호에 맞춰 긴 문서, 슬라이드, 간단한 문서 등을 선택해서 작성한다. 중요한 것은 숫자만 나열하는 것이 아니라, 그 숫자가 의미하는 바와 앞으로 취해야 할 행동을 설명과 함께 제시하는 것이다.
ℹ️알아두기: 분석보고서는 파일 포맷은 여러가지 중에 하나를 쓸 수 있다. 상항에 따라 적절한 포맷을 선택해서 작성한다. 뉴스레터 형식이라면 PDF문서포맷으로 만들고 발표용으로 쓴다면 슬라이드로 만든다. 분석 결과를 설명해야 하는 일이 많기 때문에 슬라이드 포맷으로 가장 많이 만든다.
가설 검정 - Hypothesis Test
가설 검정은 통계학에서 나온 개념으로, 우리의 생각이나 예상이 실제 데이터와 맞는지 확인하는 방법이다. 단순히 더 많은 이익이 나오는 것을 고르는 것이 아니라, 데이터를 바탕으로 더 객관적으로 판단할 수 있게 도와주는 방법이다. 가설 검정은 데이터 분석에서 아주 중요한 과정이며, 확실하지 않은 상황에서도 믿을 수 있는 결론을 내리는 데 필요한 것이다.
이 책에서는 가설 검정에 대해서 깊이 다루지는 않을 것이다. 데이터 분석을 배우다 보면 통계학이 계속해서 언급될 것이므로 어떤 것인지 대략 알아두고 넘어가도록 한다.
ℹ️알아두기: 가설 검정은 통계학에서 매우 중요한 것이지만 어려운 용어가 나오며 초기 학습 장벽이 매우 높다. 그래서 많은 사람들이 가설 검정을 보면서 데이터 분석 배우기를 포기한다. 하지만 가설 검정이 데이터 분석의 전부는 아니며 처음에는 이해하지 못해도 데이터 분석을 할 수 있다. 그리고 천천히 배워나가도 된다.
가설 검정의 기본 개념
귀무가설, 대립가서, 검정 통계량, p-값, 유의수준은 추론 통계에서 흔히 볼 수 있는 전문 통계용어다.
-
귀무가설(H₀)과 대립가설(H₁):
- 귀무가설: 일반적으로 "차이가 없다" 또는 "관계가 없다"는 주장
- 대립가설: 연구자가 증명하고자 하는 주장으로, 보통 "차이가 있다" 또는 "관계가 있다"는 내용
-
검정 통계량과 p-값:
- 검정 통계량: 표본 데이터로부터 계산된 값으로, 가설 검증의 기준이 됨
- p-값: 귀무가설이 참일 때, 관측된 결과나 더 극단적인 결과가 나올 확률
-
유의수준(α):
- 일반적으로 0.05(5%) 또는 0.01(1%)을 사용
- p-값이 유의수준보다 작으면 귀무가설을 기각하고 대립가설을 채택
이해가 가지 않은다면 간단하게 알고 넘어가야 하며 시간을 많이 할애할 필요는 없다.
간단히 설명하면 추론 통계에서는 확인하고 싶은 사실을 “대립가설”이라고 부르고 원래 있던 것을 “귀무가설”이라고 부른다. 추론 통계에서는 “대립가서”이 “귀무가설”보다 확실하기 나은지 항상 계산해서 판단한다.
예를 들어 어떤 이키머스 웹사이트의 로고색을 녹색에서 빨간색으로 바꿔서 사람들이 사이트내에서 구매를 더 많이 하게 하려고 한다면,
귀무가설: 녹색 로고가 더 낫다 대립가설: 빨간색 로고”가 더 낫다
귀무가설은 더 낫다고 주장하는 사실이 확실하게 좋다는 근거가 없다면 없었던 것으로 하고 원래대로 돌아가겠다는 의미다. 대립가설은 원래 있던 가설인 귀무가설에 대립하기 때문에 대립가설이라고 부른다. 검정통계량과 p-값, 유의수준언 확률계산을 통해서 어떤 것이 더 나은지 판단하는데 사용하는 계산해서 나온는 기술적인 숫자이다. 가설 검정을 하기 위해서 어떤 숫자를 가지고 어떤 계산을 어떻게 해야 하는지는 상황에 따라 매번 다르다. 어떤 방법으로 해야 하는 것을 선택하는 것을 전문 데이터 분석가가 했지만 이제는 AI챗봇 서비스에 물어보면 된다.
비즈니스에서의 가설 검증 사례
- 마케팅: "새로운 광고 캠페인이 기존 캠페인보다 전환율이 높을 것이다"
- 제품 개발: "새로운 기능이 사용자 만족도를 향상시킬 것이다"
- 가격 정책: "가격 인상이 총 매출에 부정적 영향을 미치지 않을 것이다"
가설 검정의 주요 방법
- t-검정: 두 집단 간의 평균 차이를 검증
- 카이제곱 검정: 범주형 변수 간의 관계나 분포를 검증
- ANOVA: 세 개 이상 집단 간의 평균 차이를 검증
- 회귀 분석: 변수 간의 관계와 영향력을 검증
가설 검정은 단순한 직관이나 경험에 의존하지 않고, 객관적인 데이터를 기반으로 의사결정을 내릴 수 있게 해주는 중요한 도구다. 특히 A/B 테스트와 같은 실험 설계에서 핵심적인 역할을 한다.
ℹ️알아두기: “가설 검정”을 “가설 검증”이라고 부르지 않는다. "검증"은 완전한 증명의 의미하는데 가설 검정은 확률적으로 판단하는 것이기 때문에 완전한 학인은 아니다. 그래서 "검정"이라는 용어를 사용한다.
비즈니스 인사이트 발견 - Business insight discovery
비즈니스 인사이트는 데이터 분석을 통해 발견하는 비즈니스에 도움이 되는 새로운 깨달음이나 통찰을 말한다. 단순히 숫자를 정리하는 것이 아니라, 그 숫자 뒤에 숨어있는 비즈니스적 의미를 찾아내는 것이다. 데이터를 분석한 뒤에 차트를 그리는 것은 비즈니스에 큰 도움이 되지 않는다.
인사이트와 단순한 정보의 차이
- 단순한 정보: "이번 달 매출이 1억원이다"
- 인사이트: "이번 달 매출이 1억원인데, 이는 신제품 출시 후 20-30대 고객층의 구매가 40% 증가했기 때문이다. 따라서 이 연령대를 타겟으로 한 마케팅을 확대하면 매출을 더 늘릴 수 있다"
좋은 비즈니스 인사이트의 특징
- 실행 가능성(Actionable): 구체적인 행동으로 이어질 수 있어야 함
- 새로움(Novel): 이전에 알지 못했던 새로운 발견이어야 함
- 중요성(Significant): 비즈니스에 의미있는 영향을 줄 수 있어야 함
- 신뢰성(Reliable): 충분한 데이터를 바탕으로 한 믿을 수 있는 결론이어야 함
인사이트 발견 과정
인사이트를 잘 찾는 방법은 데이터 탐색을 반복하고 다각적인 생각을 여러 번 하는 노력뿐이다.
패턴 찾기
데이터에서 반복되는 패턴이나 예상과 다른 결과를 찾는다. 예를 들어 특정 요일에 매출이 높다거나, 특정 지역에서 특정 상품이 잘 팔린다는 패턴을 발견한다.
원인 분석
패턴이 왜 나타나는지 원인을 분석한다. 단순히 상관관계만 보는 것이 아니라 인과관계를 파악하려고 노력한다.
비즈니스 맥락 연결
발견한 패턴과 원인을 실제 비즈니스 상황과 연결해서 해석한다. 시장 상황, 경쟁사 동향, 고객 행동 변화 등을 종합적으로 고려한다.
실행 방안 도출
인사이트를 바탕으로 구체적이고 실행 가능한 방안을 제시한다.
비즈니스 인사이트 발견 사례
사례 1: 온라인 쇼핑몰의 장바구니 이탈 분석
- 발견한 패턴: 결제 페이지에서 60%의 고객이 이탈
- 원인 분석: 배송비가 결제 단계에서 처음 공개됨
- 비즈니스 맥락: 고객들이 예상보다 높은 총 금액에 놀라서 구매를 포기
- 실행 방안: 상품 페이지에서 배송비를 미리 표시하고, 무료배송 기준 금액을 명확히 안내
사례 2: 카페 체인의 매출 분석
- 발견한 패턴: 오후 3-4시 매출이 급격히 감소
- 원인 분석: 점심시간 이후 고객 방문이 줄어들고, 저녁 시간대 고객들은 주로 테이크아웃 선호
- 비즈니스 맥락: 오후 시간대는 카페에서 머물며 작업하는 고객들의 니즈가 높음
- 실행 방안: 오후 시간대 할인 메뉴 출시, Wi-Fi 환경 개선, 조용한 작업 공간 확대
인사이트 발견을 위한 질문들
데이터를 볼 때 다음과 같은 질문들을 던져보면 인사이트를 찾는 데 도움이 된다.
- "왜 이런 결과가 나왔을까?"
- "예상과 다른 부분은 무엇인가?"
- "이 패턴이 계속될까?"
- "다른 요인들과 어떤 관계가 있을까?"
- "이 정보로 무엇을 할 수 있을까?"
- "고객 입장에서 보면 어떨까?"
- "경쟁사와 비교하면 어떨까?"
인사이트 전달 방법
좋은 인사이트를 발견했다면 효과적으로 전달하는 것도 중요하다:
- 스토리텔링: 데이터를 이야기 형태로 구성해서 전달
- 시각화: 그래프나 차트를 활용해서 직관적으로 이해할 수 있게 함
- 구체적 수치: 추상적인 표현보다는 구체적인 숫자로 설명
- 실행 방안: 인사이트와 함께 구체적인 다음 단계 제시
비즈니스 인사이트 발견은 데이터 분석의 궁극적인 목표라고 할 수 있다. 단순히 데이터를 정리하고 시각화하는 것을 넘어서, 비즈니스 성장에 실질적으로 도움이 되는 통찰을 제공하는 것이 진정한 데이터 분석의 가치다.
ℹ️알아두기: 인사이트는 하루아침에 나오지 않는다. 데이터를 여러 각도에서 보고, 다양한 질문을 던지며, 비즈니스 맥락을 깊이 이해해야 좋은 인사이트를 발견할 수 있다. 또한 틀린 인사이트를 내놓을 수도 있으므로 지속적인 검증과 개선이 필요하다.