트위터가 자연언어 쿼리로 데이터 인사이트 도출하는 법
(blog.twitter.com/engineering)- 내부 비즈니스 담당자들이 다양한 데이터를 자연어로 쿼리할 수 있는 Qurious라는 차세대 시스템을 구성
→ "하루에 트윗이 몇 개 정도 나오나요?" - 아키텍처
- 슬랙/웹앱에서 질문 가능
- 질문은 구글 클라우드 로드밸런서/NgRoutes 통해서 GKE에 있는 Qurious앱으로 전송
- 질문은 구글의 Data QnA API로 보내짐
- Data QnA는 사용자 질문을 해석하여 SQL 쿼리로 리턴
- 만들어진 SQL은 BigQuery로 보내서 실행
- Egress Proxy가 Slack 앱으로, LB가 WebApp 으로 실행 결과를 전달
- 질문과 답변은 GCS/CloudSQL 에 저장