본문 바로가기
[패스트캠퍼스] 데이터분석 부트캠프

[7주차 학습일지] 패스트캠퍼스 파이썬 프로젝트 중간점검2

by 클로버심 2025. 8. 7.

상품 관점 맞춤 마케팅 (What : 제안 상품 중심)

고객에게 어떤 제품 또는 조합을 제시할지에 집중

세부 전략

  1. 묶음 상품 기획 (Cross-sell & Up-sell)
    • 장바구니 동시 구매율 높은 상품쌍 기반 번들링
    • 예 : 바나나 + 우유, 시리얼 + 우유
  2. 구독형 상품 제안
    • 주기가 일정하고 재구매율 높은 상품 → 구독 서비스
    • 예 : “휴지를 매월 자동 배송받고 10% 할인받으세요”
  3. 프리미엄/Organic 집중
    • reorder_score 상위의 Organic 제품군 → 건강/친환경 이미지 강조
  4. 진열 구역(aisle/department) 기반
    • 판매량 대비 재구매율 낮은 구역 → 번들/할인으로 보완

핵심 포인트 : 고객에게 "무엇"을 추천해야 가장 효과적일지 정의

 

1. 묶음 상품 기획 (Cross-sell)

장바구니 동시 구매율 높은 상품쌍 기반 번들링

 

  1. 초기 시도 : 상품쌍 조합 Top 20을 뽑았으나 바나나 + 딸기, 바나나 + 아보카도 등 과일 위주의 신선식품(Produce) 쏠림 현상 발생
    • 문별 상품 리스트 생성 → 상품쌍 조합 추출 → 가장 자주 함께 담긴 상품쌍 Top 20
  2. 문제의식 : 너무 유사한 조합이 반복되어 의미 있는 마케팅 인사이트나 번들 전략 다양성 부족 
  3. 전략 전환 : 부서쌍(Department Pair)을 기준으로 먼저 유의미한 조합을 추출한 후, 해당 조합에 한정하여 대표 상품쌍을 도출 → Cross-sell & Up-sell 전략 수립
  4. 가설 : 상위 부서쌍에서 추출한 상품쌍은 단일 부서 내 조합보다 마케팅 번들 구성이나 교차 판매 전략에 더 효과적이다
  5. 목표 : 유의미한 상품쌍 추천 구조 재정립 및 부서 간 교차 판매 가능성 분석하여 마케팅 활용도 높은 추천 리스트 추천
    • 상품쌍 조합으로는 produce안에서만 번들 가능하여 부서별 상품쌍 조합 추출 예정
    • Top 부서쌍 5개 추출해서 전략 수립
    • Heatmap을 top10 부서 기준으로 슬라이싱 후 시각화
    • produce 부서 기준으로 연결 강한 조합 분석 가능 (cross-sell)
    • 부서쌍별 대표 상품쌍 보여주기

결론

  • 기존 상품쌍 추천은 거의 모두 produce 제품들로 대부분 바나나 + 다른 과일 형태로 마케팅 전략 다양성 부족 (스무디/과일세트 외 조합이 거의 없음)
  • 부서쌍 기반 접근 효과 : dairy eggs, beverages, snacks 등 다양한 부서 등장
  • 활용 시나리오, 마케팅 포인트, 번들링 방식이 훨씬 다양해짐
  • 마케팅 전략
    전략명 설명
    부서쌍 기반 자동 번들링 상위 부서쌍 + 상위 상품쌍 조합으로 매주 자동 추천
    (상위 부서쌍 내 사용자의 관심 부서 상위 상품쌍 추천)
    이종 카테고리 조합 강화 동일 부서 내 추천 → 부서쌍 조합으로 전환(세트 상품 및 할인 프로모션 진행)
    아침 루틴 세트 바나나 + 우유 + 그래놀라 등으로 아침 루틴 콘텐츠
    디톡스/수분 보충 세트 과일 + 탄산수 조합으로 여름 한정 기획 가능
    유아 간식 패키지 유제품 + 스낵류 조합으로 부모 타깃 패키지 기획

 

2. 구독형 상품 제안

주기가 일정하고 재구매율 높은 상품 → 구독 서비스
  1. 주기가 일정하고 재구매율 높은 상품 → 구독 서비스
    • 가설 : 특정 상품은 소비자들이 규칙적인 간격으로 반복 구매하는 경향이 있다. 이러한 상품은 정기 구독, 재고 리마인더, 맞춤형 프로모션 타겟으로 활용 가능하다.
    • 목표 : 주기성과 재구매율을 기준으로 상품을 선별하여, 마케팅 전략(구독, 리마인더, 프로모션 등)을 수립한다.

product_order_gap feature 생성

  • 지표
    • 상품별 주문 간격 : avg_order_interval
    • 주문 간격 등급 : interval_level
    • 재주문 점수 : reorder_score
  • 상품별 평균 주문 간격, 평균 주문 간격 분포 Q25미만, Q25~Q75, Q75이상 기준 주문간격 Low, Mid, High 상품별 라벨링
  • 주기별 Top10 상품표 (총 주문 수, 재구매율)
  • 마케팅 전략
    주문 주기 구간 주요 제품 특성 추천 마케팅 방식 마케팅 문구
    8일 이하
    (High Frequency)
    유제품, 음료, 과일 등 생필품소비 주기 짧고 반복성 매우 높음(고빈도 생필품) 정기 배송(Weekly Plan)+ 소량/단가 기반 구독+ 리마인드 쿠폰(매주 가장 많이 사는 3종 묶음) 1. “매주 정기배송” → 신선도 유지를 이유로 구독 유도
    2. 첫 구독 시 20% 할인 + 매 4회마다 1개 무료
    3. "이번 주 우유 다 떨어졌죠?" 자동 알림
    9일 이상 ~15일 이하
    (Mid Frequency)
    과일, 채소, 가공식품 등
    다양성 높은 식재료
    격주 배송 구독제+ 번들
    레시피 제안+ 기호 맞춤형 옵션 제공
    (테마형 묶음 구독)
    1. “격주 건강 간식 박스”로 구성
    2. 레시피 카드 + SNS 공유 시 1회 무료 제공
    3. 소비 주기를 기반으로 "다 떨어질 시기예요" 자동 메시지
    15일 초과
    (Low Frequency)
    샐러드 재료, 식음료, 가공품 등건강 중심 식단 재료
    ( 비정기적/
    건강식 위주)
    재구매 리마인드+리워드+ 자동 장바구니 제안+ 잊지 마세요 알림 1. 마지막 구매 2주 후 “다음 구매 적기입니다!” 알림
    2. 2회 연속 구매 시 포인트 적립 or 샘플 제공
    3. 최근 이런 제품과 함께 많이 구매했어요” 추천

3. Organic 집중

reorder_score 상위의 Organic 제품군 → 건강/친환경 이미지 강조

 

  1. 가설 : 유기농 제품군은 일반 제품군보다 평균적으로 재구매 점수가 높다. 따라서, 유기농 제품군은 선호도 기반 추천의 핵심 타겟이 될 수 있다
  2. 목표 : 고충성 유기농 제품을 기반으로, 재구매율이 낮거나 아직 유기농 제품을 구매하지 않은 고객(잠재 고객)을 타겟으로 추천 → 재구매 유도 → 고충성 고객군 확대
  3. 지표
    • organic 여부 : product_stats[’is_organic’]
    • 재구매율 : product_stats[’ireorder_rate’]
  4. KDE(커널 밀도 추정)를 통한 유기농 vs 일반 제품 재구매율 밀도 분석 요약
    • 평균 재구매율 기준으로, 유기농 제품군은 일반 제품군보다 약 4%p 높은 재구매율(40.2% vs 36.2%)을 보여 가설(“유기농 제품이 더 높은 재구매율을 가진다”)은 통계적으로 지지됨
    • 독립표본 t-test 결과 p-value < 0.05로 나타나, 유기농과 일반 제품군 간 재구매율 평균 차이는 통계적으로 유의함
    • 다만 밀도 분포 분석(KDE)에 따르면, 유기농 제품은 재구매율이 0%인 극저충성 제품의 비중이 높게 나타남
    • 중앙값 > 평균이라는 구조 역시 이를 뒷받침:
      • 유기농 제품: 평균 40.2% < 중앙값 42.0%
      • 일반 제품: 평균 36.2% < 중앙값 37.4%
      • 이는 극저충성 제품의 존재가 평균을 다소 낮추고 있음을 시사함
    • 따라서 유기농 제품을 무분별하게 추천하기보다는, 재구매율 기반 상위 제품군(고충성 제품)에 한정하여 정밀 추천 전략을 수립해야 실제 효과적인 마케팅 타겟팅이 가능
  5. organic_reorder_rate = organic_reorders / total_organic_orders를 기준으로 0.4보다 작으면 저충성, 0.4에서 0.6사이는 중충성, 0.6보다 크거나 같으면 고충성 고객으로 등급 구분했을 때 저충성(45.8%) > 중충성(31.7%) > 고충성(22.5%) 분포를 확인할 수 있음 → 이를 바탕으로 중충성 고객에게는 기존과 유사한 제품군의 상위 제품 추천하고, 저충성 고객에게는 재구매율 높은 대표 제품 중심 집중 추천하여 고충성 고객으로 전환하고자 함
    • user 전체 206209명중 유기농 제품을 구매한 경험이 있는 189125명을 대상으로 organic_reorder_rate를 분석했을 때 25% 0.208333, 50% 0.428571, 75% 0.615385

      고객 충성도 주요 특징 추천 전략
      고충성 고객 유기농 제품에 익숙하고 반복 구매 신제품 + 유사 제품 크로스셀링 추천
      중충성 고객 잠재적 로열티 고객 고충성 고객 대비 order수와 reorder_rate가 상대적으로 낮은 제품 추천
      저충성 고객 유기농 관심은 있지만 반복 경험 적음 대표 고충성 제품군 중심 집중 추천으로 전환 유도
  6. 저충성 고객 타겟
    • 유기농 제품 전체 중에서 각 department의 평균 reorder_score 계산하여 Top 5 부서 선정 → 각 상위 부서에서 reorder_score가 높은 유기농 제품을 3개씩 추출

      전략 요소 설명
      정밀 추천 배너 저충성 고객에게 고충성 유기농 제품 중 소비 부서 다양성을 반영한 대표 제품군 노출 
      추천 번들 묶음 같은 부서 내 대표 고충성 제품을 조합한 “건강 아침 세트”, “오가닉 런치박스 세트” 등 구성
      제품 후기 강조 재구매율이 높은 제품이니 고객 리뷰/후기 강조 (“이 제품은 고객의 83%가 재구매한 제품입니다”)
      충성도 전환 목표 저충성 고객에게 고충성 제품 3회 이상 재구매 유도 캠페인 운영 (예: 3회 구매 시 적립금 등)
  7. 중충성 고객 타겟 
    • 고충성 고객은 재구매율 높은데, 중충성 고객은 낮은 → 격차 큰 제품 Top 10
      • gap = 고충성 고객 reorder_rate - 중충성 고객 reorder_rate → gap이 크다는 것은 고충성 고객에게는 잘 팔리는 제품인데 중충성 고객은 아직 소비를 잘 안 한 제품이라는 뜻
      • 고충성 고객 유기농 구매 이력과 중충성 고객 유기농 구매 이력을 각각 추출하여 각 제품별 재구매율 계산
      • gap이 일정 수준(gap 분포 상위 20% 격차 수준인 0.288%) 보다 큰 제품들 중 total_orders가 큰 10개 제품 선별 → 단순히 gap만 클 경우 total_orders가 너무 적으면 마케팅 타겟으로 부적합하여 전체 제품 중 상위 20% 격차 기준 구매량이 큰 제품 10종 선택

        전략명 대상 제품 예시 주요 메시지 목적
        고충성 신뢰 기반 추천 Bartlett Pear, Quick Oats “재구매율 79% 이상! 신뢰받는 유기농” 경험 자극
        유사 카테고리 확장 Oats → Oats, Baby Food 확장 “이미 좋아하는 맛, 더 좋은 제품으로” 확장 유도
        재구매 격차 프로모션 Rolled Oats, Red Grapes “반복 구매의 이유가 있습니다” 반복성 유도
        정기배송/묶음 할인 Cashew, Oats “편하게 먹고 혜택도 챙기세요” 충성도 전환

4. 진열 구역(aisle/department) 기반판매량

판매량 대비 재구매율 낮은 구역 → 번들/할인으로 보완

 

  1. 가설 : 재구매율이 예측 대비 낮은 판매 상위 구역이 존재한다
  2. 목표 : 재무개 점수가 기대보다 낮은 판매 상위 부서를 식별한 후, 해당 구역의 대표 제품을 번들/할인 구성하여 재구매 유도 및 충성도 개선 전략을 수립한다.
  3. 지표
    • 판매량 : 부서별 총 판매량
    • avg_reorder_score : 부서별 평균 reorder_score ( reorder_rate * np.log1p(total_orders)
  4. scatter 분석을 통해 판매량은 높은데 재구매가 적은 부서(우측 하단) 파악

    • 우측 상단 = 인기 + 고충성(상대적 약자 그룹을 뽑아 마케팅 타겟으로 설정 가능)
    • 좌측 하단 = 비인기 + 저충성
    • 좌측 상단 = 비인기 + 고충성
    • 우측 하단 = 인기 있는데 재구매율 낮음 → 타겟
    • 판매량은 많지만 재구매율 낮은 부서 거의 없음
      • 후속 조치 1 : 좌측 상단(=덜 팔리는데 충성도 높은 부서)를 확장 잠재력이 있는 충성 부서로 타겟팅 변경
      • 후속 조치 2 : 가설 검증 수단으로 scatter(정량적 기준 없이 분포를 파악하는 주관적인 방법) 시각화는 타겟 선별 실패 → 잔차(Residual) 분석으로 정량적이고 객관적으로 회귀 모델을 통해 예상된 재구매율을 정하고, 그보다 낮은 부서 추출
  5. 후속 조치 1 결과 : 구매한 소수의 고객들이 꾸준히 재구매하는 경향이 있는 부서 top 5 : breakfast, bulk, meat seafood, babies, pets 내에서 재구매 점수가 높은 3가지 상품 추천(재구매율만 반영할 경우 판매량이 200건 정도로 너무 저조해 타겟으로는 부적절하여 부서 기준 Low-Volume but High Loyality를 구했으니 상품은 재구매 점수 기준으로 선별)

    부서 추천 번들 적용 마케팅
    breakfast 그래놀라 + 시리얼 조합 리뷰 기반 강조 배너
    meat seafood 닭가슴살 조합 건강식단 타겟 큐레이션
    babies 이유식 + 요거트 세트 정기배송 구독 제안
    pets 곡물프리 사료 묶음 정기배송+리뷰 강조
    bulk 말린망고 + 귀리 스낵/건강식 번들 제안
    •  
  6. 후속 조치 2 결과 :

    • 잔차(Residual) 분석으로 정량적 통계적으로 기대 대비 성과가 저조한 부서 재탐색
    • 회귀선보다 위에 있는 점: 기대보다 재구매율이 높은 부서
    • 회귀선보다 아래에 있는 점: 기대보다 성과가 저조한 부서 (타겟 후보)
    • residual < 0(기대 대비 재구매율이 낮음)이면서 magnitude(판매량이 많음)가 큰 부서
    • log1p(total_orders) >= 중간값 이면서 residual < 0인 top 5 부서 : pantry, household, canned goods, dry goods pasta, frozen

      부서 추천 번들(Kit / Set) 적용 마케팅
      dry goods pasta Marinara Sauce + Organic Tomato Basil Pasta Sauce + Spaghetti→ 레시피 카드 동봉 파스타&소스 번들 셰프 추천 레시피 번들 구성홈쿡족/자취생 대상 큐레이션 콘텐츠
      pantry / frozen / canned goods 한 달치 장기보관 식재료 세트 → '쟁여두기 패키지' 구성 소비 주기 기반 자동 리마인드 ‘잊지 말고 재구매’ 캠페인
      household 종이 타월 + 화장지 + 호일 제품 묶음 →
      일상용품 필수 세트
      자동 리마인드 + 리워드2회 이상
      재구매 시 포인트 적립
더보기

<<4Ls 회고법>>

1. Liked 좋았던 것 : 모든 생각해낸 것들을 실험해볼 수 있었던 것. 챗지피티와 파이썬이라면 무엇이든 시각화 가능하고 결과가 도출 가능했다는 것
2. Lacked 아쉬웠던 것 : 분석 자체는 할 수 있었으나 스토리를 만들어내는 것이 많이 부족했던 것
3. Learned 배운 것 : 분석을 시작하기 전에 방향을 설정하고 스토리를 구상하는 것이 정말 중요하다는 것
4. Longed for 앞으로 바라는 것 : 프로젝트 한 것 제대로 정리해놓고 포트폴리오에 어떻게 구성할지 생각하기