-
홈 배너는 고객의 첫 화면에서 가장 먼저 보이는 핵심 영역으로, 초개인화 추천 시스템을 통해 클릭률(CTR)과 사용자 경험을 극대화함
- 기존 MAB(멀티 암드 밴딧) 기반의 단순 클릭률 최적화 방식에서 벗어나, DeepFM·Two-Tower·HGNN 등 최신 알고리듬과 그래프 기반 임베딩으로 배너·사용자 특성을 정교하게 반영함
-
배너 생명주기 단축, 노이즈 많은 클릭 피드백, 데이터 불균형 등 도메인 특유의 문제를 Continual Learning, 개별 모델·통합 모델 혼합 운영 등으로 해결함
- 최종적으로 CTR 16% 이상 향상, 신규 배너·콜드 유저 대응, 실시간·비즈니스 정책 연동 등 체계적인 추천 파이프라인을 구축함
- 앞으로는 실시간 서빙, Multi-Task Learning, 임베딩 품질 고도화, 다각적 성과 지표 도입 등 지속적 진화 예정
고객 맞춤 빅배너로 더 나은 경험 만들기
- 고객 취향과 노출 콘텐츠 다양성이 증가하면서, 일괄적인 배너 노출로는 만족스러운 경험 제공에 한계가 있었음
-
CTR 극대화를 목표로, 각 스토어 홈 상단 빅배너에 개인화 노출 로직을 도입하는 프로젝트를 진행함
홈 배너의 중요성 및 특징
- 홈 배너는 무신사 서비스에서 고객이 처음 마주치는 화면 맨 위 슬라이드형 배너(총 35장)로, 앱에서는 한 장, 웹에서는 세 장이 노출됨
- 무신사 전체 트래픽의 약 97% 가 메인 화면 진입 시 홈 배너를 접함
- 홈 배너 클릭이 전체 클릭 수의 35% , 클릭 발생 세션의 37%를 차지할 만큼 비중이 큼
- 높은 노출 빈도로 비즈니스 전환 효과가 매우 큰 영역임
기존 추천 방식의 한계
- 기존에는 MAB(Multi-Armed Bandit) 알고리듬을 활용해 CTR 중심의 추천을 수행함
-
탐험(Exploration) 과 활용(Exploitation) 균형 조절
-
세 가지 한계:
-
단일 클릭률 지표 의존으로 다양한 고객 취향·배너 특성 반영 미흡
-
배너 연관성 반영 어려움 (독립적 처리)
-
콜드 스타트 (신규 배너 클릭 데이터 부족 시 성능 저하)
- 이 한계를 극복하기 위해 새로운 추천 시스템을 설계함
추천 시스템 파이프라인
- 시스템은 다단계 파이프라인으로 구성됨
-
배너 Representation 강화: 배너 관련 텍스트·이미지·연관 상품 기반 임베딩(HGNN, GraphSAGE 활용) 추출
-
클릭 예측 모델 학습: DeepFM(피처 상호작용)과 Two-Tower(유저/배너 분리 임베딩) 모델 동시 적용
-
배너 스코어링 및 적용: 유저별 CTR 예측 스코어를 배치/실시간으로 산출
- 데이터가 충분한 유저에는 정교한 개인화
- 신규·콜드 유저에는 세그먼트 기반 추천
-
비즈니스 정책 반영: 시스템 배점 외에 회사 정책 및 전략, 캠페인 배너, 긴급 변경 등도 실시간 반영
-
최종 배너 노출: 스코어가 높은 Top-N 배너를 최종 추천 및 노출
추천 핵심 모델 소개
-
DeepFM: FM(2차 상호작용)+DNN(고차원 상호작용) 병렬 구조로 희소 데이터·복잡 상호작용 모두 효과적으로 학습, CTR 예측에 탁월함
-
Two-Tower: 사용자·배너 각각 독립 신경망에서 임베딩 추출, 대규모 데이터와 실시간 서빙에 강점, 유사도 기반 추천
DeepFM
-
FM 레이어(2차 피처 상호작용) + DNN 레이어(고차원 비선형 피처 통합) 결합
- 희소 데이터에 강하고, End-to-End 학습 구조로 일관된 성능 최적화
- 사용자 정보, 배너 메타, 임베딩(64차원) 정보를 피처로 사용
- 임베딩 벡터를 하나의 단일 블록으로 처리해 학습 효율/안정성 확보
-
CTR 예측 결과로 배너 순위 산출
Two-Tower
-
유저와 배너를 별도 신경망(타워)에서 임베딩, 유사도 산출 방식
- 대규모 데이터에 용이한 확장성과, 미리 벡터화된 빠른 응답(** 낮은 지연**) 가능
- 각 타워에 인구통계, 행동로그, 텍스트/이미지 등 다양한 입력정보 활용
- 학습 분리/병렬 처리 구조로 빠르고 유연하게 대형 추천 문제에 대응
현업 적용 시 마주치는 주요 어려움
- 홈 배너는 생명주기가 매우 짧아(2~3일, 몇 시간 단위도 있음) 실시간 반영이 필요함
- 피드백 신호가 주로 클릭에 의존해 사용자의 진성 선호를 판별하기 어려움
- 배너는 상품·브랜드와 달리 정형화된 메타 데이터가 부족, 이미지·텍스트 등 맥락 파악이 난해함
-
스토어별 데이터 불균형(전문관별 트래픽·활성도 차이)으로 인해 전체 성능 저하 가능성
- 문제 극복 위해 표현력 강화, 최신성 유지, 불균형 완화라는 세 가지 기술 축을 중심으로 시스템 재설계
실질적 개선 방안
배너 특성 강화
- PinSAGE 임베딩 평균 사용의 한계(복합 배너 표현 한계, 신규 배너 추천 불가) 극복 위해 HGNN 도입
- 사용자의 행동 패턴을 기반으로, 그래프 구조에서 배너-상품 관계를 GraphSAGE로 임베딩
- 텍스트·이미지 정보는 LLM 임베딩 조합 사용
- 실시간 사용자 임베딩 갱신 및 Continual Learning 도입, 최신 유저 관심사 반영
- CTR 8.3% 상승
Continual Learning
- 전체 데이터 일괄학습에서 벗어나, 지속적 업데이트 도입(1시간 단위, 최근 3시간 로그)
- 활동량에 따라 동적으로 학습률 조정(주간 최대 5배, 야간 2배)
-
빠른 적응과 모델 노후화 방지, 성능 저하 없는 신속한 추천 반영 실현
-
CTR 24% 상승
전략적 모델 선택
- 스토어별 최적 모델링 전략을 확정
- 메인스토어는 DeepFM+Continual, 전문관은 Two-Tower 개별 모델, CTR 19% 향상
최종 성과
- 기존 MAB 대비 Two-Tower 11.2%, DeepFM 16.1% CTR 향상
- 무신사 홈은 DeepFM+Continual Learning, 전문관은 Two-Tower 모델을 실전 적용
앞으로의 방향
-
실시간 서빙 아키텍처 전환, Multi-Task Learning 도입(CTR+GGMV), 임베딩 품질·그래프 구조 개선, 성과지표 다각화 등 고도화 추진
- 단일 CTR에서 벗어나 다양한 비즈니스 목표 달성·질적 경험까지 평가하는 모델로 진화시킬 계획