27P by GN⁺ | ★ favorite | 댓글과 토론
  • Machine Learning 박사 학위 후 Research Scientist 직무를 구하는 전체 과정을 정리한 실전 경험 모음
  • DeepMind, Isomorphic Labs, Cohere, Meta 및 스텔스 스타트업 등 인터뷰를 완료한 모든 회사에서 오퍼를 받은 사례 기반
  • 인터뷰 확보 기준, 기술·감정·로지스틱 준비법, 스타트업 vs 빅테크 비교, 연봉 협상까지 단계별 정리
  • RSU와 stock option의 세금·구조 차이, transformer·attention 직접 구현 등 구체적 준비 항목 포함
  • 인터뷰는 본질적으로 확률적(stochastic) 이며, 결과가 연구자로서의 가치를 결정하지 않는다는 메시지 강조

전체 인터뷰 결과와 배경

  • ML 박사 후 Research Scientist 구직 과정을 직접 경험하고 정리, 시작 시점에 참고할 자료가 거의 없었음
  • 인터뷰를 완료한 모든 회사에서 오퍼 획득 — DeepMind(수락), Isomorphic Labs, Cohere, Meta, 스텔스 스타트업 포함
    • Anthropic, Mistral, TeslaAI는 연락이 늦어 프로세스 미완료
    • ReflectionAI는 RS 직무에서 유일한 거절, 대신 Engineering 트랙으로 전환 제안
  • SpaceXAI, Waymo, Wayve는 인터뷰 초청 없음
    • Waymo에는 박사 과정 내내 6개월마다 지원했으나 한 번도 응답 없었음

인터뷰 확보 방법

  • 인터뷰 확보의 핵심 레버는 더 많은 논문, 트렌디한 주제, 더 좋은 인턴십
    • 박사 과정 중 ICLR / NeurIPS / ICML에 게재한 1저자(또는 공동 1저자) 논문 4편 보유 (LLM, RL, Meta-Learning, Evolution Strategies)
    • Apple 인턴십 및 Meta 소프트웨어 엔지니어 경력 보유
  • 대략적 기준: 1저자 논문 3편 이상 + 인턴십 또는 산업 경력 1회 이상이면 상위 랩에서 꾸준히 콜백 확보 가능
  • 이미 인터뷰를 받고 있다면 추가 논문은 도움 안 됨 → 연구가 아닌 인터뷰 준비에 집중 필요, 준비된 느낌은 오지 않으므로 지금 시작해야 함

커버레터, 추천, 콜드 이메일, LinkedIn/X

  • LinkedIn / X: 많은 회사가 채용 공고를 올리며, 인턴십은 이곳이 유일한 지원 경로인 경우 있음
    • 공고에 연결된 Google form을 작성해야 실제 지원으로 인정됨
  • Referrals(추천): 있으면 좋지만 필수 아님
    • DeepMind에서는 추천 있던 직무와 없던 직무 모두 인터뷰 초청받음
  • Cold emails(콜드 이메일): 채용 담당자나 팀원에게 직접 메일 보내는 것은 종종 환영받음
    • CV 반복이 아니라 해당 팀에 적합한 이유와 흥미를 느끼는 지점을 설명해야 함
  • Cover letters(커버레터): 드물게 요구되나 요구 시 제대로 작성
    • Claude / Gemini / ChatGPT에 통째로 작성을 맡기지 말 것, 직접 쓴 뒤 다듬는 용도로만 활용

스타트업 vs 빅테크

  • 스타트업은 찾기가 더 어려움, 중앙화된 탐색처 없음 → 동료·친구·전 동료를 통한 입소문이 최선이며, 그만큼 경쟁도 덜 치열함
  • 스타트업은 인터뷰 프로세스 편차가 큼, 빅테크는 비교적 예측 가능한 구조
    • 프로세스가 너무 쉽게 느껴지면 실제 업무 복잡도에 대한 신호일 수 있음
  • 업무 성격은 양방향 — 적합한 스타트업에서는 더 흥미롭고 임팩트 큰 연구 가능, 반대로 더 많은 압박·인프라 작업·잦은 연구 방향 변경 동반 가능
    • 인터뷰에서 연구 우선순위 결정자, 수익화 경로, 경쟁사 등을 질문할 것
  • 성장 기회: 스타트업은 빠른 성장과 책임 확대, 업무 방향 형성 기회 제공, 빅테크에서는 다수 중 하나
  • CV 인지도: OpenAI나 Anthropic은 즉시 인식되나, 무명 스텔스 스타트업은 설명 필요
  • 고용 안정성: 빅테크도 대규모 정리해고를 반복해왔으며, 어느 쪽도 100% 안전하지 않음

보상: RSU vs Stock Option (영국 기준)

  • RSU(빅테크 일반적): 베스팅 일정에 따라 실제 주식 수령, 베스팅 시 약 절반은 소득세 충당 위해 즉시 매도 — RSU는 소득으로 과세됨
  • Stock option(스타트업 일반적): 주식이 아니라 고정 가격 X에 매수할 수 있는 권리 획득
    • 시장가 Y > X이면 X에 사서 Y에 팔아 차익 확보, Y < X이면 옵션은 무가치
  • Stock option은 보통 퇴사 90일 후 만료, 회사가 비상장이면 매수 후에도 매도 불가
    • 영국에서는 옵션 행사 순간, 한 푼도 받지 못한 상태에서 Y−X 차익에 대해 소득세 부과
    • 비상장 회사에서 2년 근무 후 퇴사·행사 시 (X × 옵션 수) 매수 비용 + (Y−X) × 옵션 수 × 세율의 소득세를 수익 발생 전에 부담
  • 대부분 cashless exercise 옵션 제공, 다수가 자사주 매입(liquidity event) 진행
    • 단 매 펀딩 라운드마다 지분 희석, 추가 이익에는 약 20% 양도소득세 부과, liquidity event 가치는 공식 기업 가치보다 낮게 책정됨
  • 요약: 리크루터가 스타트업 지분 포함 총 보상 수치를 제시하면 정중히 웃되 상당 폭 할인해 받아들일 것

인터뷰 구조

  • 대부분 회사가 비슷한 구조를 따르되 단계별 비중은 상이함
  • Recruiter screen: 보통 부담 적은 대화, 보유 역량의 직무 적합성과 본인 논문에 대한 설명 능력 확인 기회
  • Technical interviews: 프로세스의 대부분, 준비가 가장 중요, 회사에 따라 3~8회
    • Coding: LeetCode 스타일, 보통 Medium 또는 Hard
    • ML coding/debugging: attention 구현, backward pass 작성, 학습 루프 버그 탐지
    • ML knowledge: 기초, 이론, 응용 ML, 시스템 디자인
  • Behavioural interviews: 고전적 행동 질문과 연구형 질문(관심 주제, 분야 전망)으로 구분, 기술 인터뷰보다 캐주얼하나 과소평가 금지

기술 준비

  • 가장 핵심 파트, 건너뛰지 말 것 — 뛰어난 연구자도 준비 부족으로 탈락한 사례 있음, 매일 ML을 다루는 것과 attention을 처음부터 구현하는 것은 다름, 최소 한 달 규칙적 학습 배정 필요
  • 메타 전략: 일반 준비는 최소화하고 다음 특정 인터뷰·회사에 맞춰 타깃 준비, 자료가 머릿속에 신선하게 유지됨
  • RS / Engineer 인터뷰는 overfitting 같은 기초부터 LeetCode, transformer 구현, Griffin·TransformerXL·S4 같은 현대 아키텍처까지 거의 무엇이든 출제 가능

Flashcards

  • ML 기초, 응용 ML, 연구 토론용으로 활용, Anki보다 물리 플래시카드가 더 효과적이었음
  • 카드를 직접 작성하는 것이 학습의 절반, 남의 덱을 다운로드하지 말 것
  • 복습 시 스스로 질문하며 깊이 이해, 학습 중 던진 질문이 실제 인터뷰에 다수 출제됨

LLM 모의 인터뷰 (Claude / Gemini)

  • 각 인터뷰 전 직무·인터뷰·회사 설명을 LLM(주로 Claude)에 붙여 넣고 인터뷰 요청, 연습 질문과 실제 질문의 중복 빈번
  • 난이도가 맞지 않으면 새 채팅에서 본인 수준·배경을 더 명시
  • 학습에는 Claude가 가장 우수했고 피드백도 공정했던 반면, Gemini는 다소 과도하게 칭찬하는 경향

LeetCode / NeetCode

  • 최소 Blind 75, 선택적으로 NeetCode 150 수행, Medium 중심
    • 각 문제의 최적 해를 목표 (TwoSum의 O(N²) 해는 인정 안 됨), Hard에는 시간 투자 자제
  • DFS, BFS, Graphs, Backtracking, DP, Binary Search 등 기본 패턴을 빠르게 구현, Medium당 20분 이하 목표
    • 15분 이상 막히면 해답 확인 후 표시하고 넘어갈 것
  • 깊이보다 넓이가 중요, 총 Medium 약 150문제 풀이

Books

  • Designing Machine Learning Systems (Chip Huyen): 기초 및 응용 ML 질문 다수 커버
  • The JAX Scaling Book: 인터뷰 후 발견했으나 우수, 사전에 알았다면 적극 활용했을 자료
  • Reinforcement Learning (Sutton & Barto): RL 입문자만 권장, 이미 해당 분야 종사자에겐 과함

Courses

  • 선형대수: Gilbert Strang의 YouTube 강의, 2배속으로 하루 안에 완주 가능
  • Diffusion / Flow Matching: MIT, Stanford 강의 모두 우수하나 수학 비중 높음, 미연구자라면 diffusion SDE·flow matching ODE 등 기본 직관과 핵심만 암기

ML coding 및 debugging

  • 좋은 자료가 가장 적고 실제 경험이 가장 중요한 영역, 디버깅 인터뷰는 LLM이 그럴듯한 버그 코드를 안정적으로 생성하지 못해 연습이 어려웠음
  • 목표 베이스라인
    • transformer를 end-to-end로 구현
    • causal, cross, self attention 구현
    • flash attention 구현
    • attention backward pass 구현
    • MLP forward / backward pass 구현
    • PyTorch 또는 JAX로 SGD 학습 루프 구현
  • 위 항목을 시간 압박 속에서 직접 구현할 수 있으면 양호한 상태

감정 준비

  • 정서적으로 괜찮다면 이 섹션은 건너뛸 것, 불필요한 불안을 심지 않기 위함
  • 가장 큰 문제는 수면 — 인터뷰 전날 잠을 못 자고, 주당 10회 인터뷰 시 심각한 문제가 됨, 식사도 어려워 메스꺼움 발생
    • 규칙적 운동, 일관된 저녁 루틴, 사회적 고립 회피 권장
    • 인터뷰 전 달리기가 긴장 에너지 해소와 머리 리셋에 도움
  • 인터뷰 전 루틴 유지에서 큰 안정감 확보 — 배경에 생화 두기, 화장이나 스킨케어, 동일한 위안 영상 시청
  • 어느 시점부터 불안이 준비보다 더 발목을 잡았고 인터뷰 중 머릿속이 백지가 되기도 함
    • 자신의 트리거, 실패와의 관계, 자존감의 근거를 시작 전에 성찰하는 편이 유리
  • 핵심 메시지: 인간으로서의 가치는 이 인터뷰들로 결정되지 않음, 프로세스는 본질적으로 확률적이며 잘 아는 것도 실수할 수 있고 그래도 괜찮음
  • 도움된 책: The Now Habit, The Gifts of Imperfection, Mindset, The Tyranny of Merit

로지스틱 준비

  • 하루에 한개의 인터뷰만: 인터뷰는 소모적이라 하루 세 번째에는 자연히 성과 저하, 오전 인터뷰 후 나머지 시간은 다음 준비에 활용
  • 관심 낮은 회사부터 시작: 소규모 스타트업이나 비선호 지역 등으로 프로세스 감각·자신감·연봉 수준을 사전 보정
  • 타이밍 고려: 회사마다 진행 속도 상이, 오퍼들이 비슷한 시기에 도착하도록 조정해 실질적 레버리지 확보
  • 모든 회사에 다른 프로세스 진행 사실 알리기: 타임라인이 명확해지고 진행이 빨라지며, 더 진지한 후보로 인식됨

협상

  • 경쟁 오퍼를 숨기라는 일반적 조언과 달리, 여러 회사가 인상 전 다른 오퍼의 증빙을 명시적으로 요구, 한 곳은 스크린샷의 진위까지 문의
  • 회사는 원하는 후보에게는 수치를 크게 움직일 수 있음, 항상 물어볼 가치 있음, 대부분 협상에 열려 있었음
  • 마감 기한은 1~2주에서 모호한 "합리적 기간"까지 다양, 연장에는 대체로 비유연
  • 리크루터는 후보의 선호를 잘 읽어냄, 회사 언급 빈도·말투 같은 작은 신호도 기록됨
  • 회사는 후보 선택에 대한 과거 데이터 보유 → 동급 경쟁사(OpenAI 등) 오퍼만 실질적 무게를 가지며, 비현실적 비교는 통하지 않음

의사결정 과정

  • 초기에는 불안해 일찍 받은 오퍼를 수락하고 싶은 유혹이 있었으나, 직감을 믿고 더 나은 선택지를 찾아냄
  • 오퍼 선택 기준은 위치, 보상, 명성, 업무 유형 등 개인마다 상이, 팀·문화·보상을 알아가며 선호 순위 변동
  • 양쪽 회사의 거의 모든 사람과 대화했으나 각자 자기 회사를 택하겠다고 답해 큰 도움 안 됨 → 결국 자신을 잘 아는 사람과의 논의가 가장 유용

다시 한다면 바꿀 점

  • 스프레드시트 유지: 머릿속 관리는 한계, 회사·진행 단계·마감·연락처를 정리했다면 관심 있던 곳 지원 누락을 방지했을 것
  • 기술뿐 아니라 감정도 준비: 인터뷰가 연구자로서의 능력과 박사 가치에 대한 최종 판결처럼 느껴지나 비합리적 프레이밍, 시작 전 성찰이나 상담이 도움 되었을 것
  • 무응답 회사에 더 적극적으로 대응: 지원서에만 의존하지 말고 직접 콜드 이메일로 관심을 표하고 레이더에 들 것

기술 주제 목록

  • 인터뷰 시작 전 작성한 학습 주제 리스트, 본인 배경상 LLM과 RL 질문이 많았고 거의 모든 학습 주제가 한 번 이상 출제됨
  • Reinforcement Learning: Q-Learning / TD Learning, Bellman Equations, PPO, GRPO, GAE, DPO, Policy Gradient Theorem, On/Off-Policy, MuZero, Dreamer, AlphaGo, Soft Actor-Critic, MDP 등
  • LLMs: Flash Attention, LoRA, TransformerXL, Griffin, Perceiver, Scaling Laws, Mixture of Experts, RoPE, S4, Tokenisation, RLHF, Causal/Cross Attention 등
  • Generative Modelling: GANs, VAE 및 ELBO, Score Function, Diffusion Forward/Reverse Process(DDIM/DDPM), Diffusion SDE, Flow Matching ODE, Classifier Free Guidance
  • Applied ML: Tensor Parallelism, FSDP, DDP, Pipeline Parallelism, Mixed precision training, Gradient checkpointing/accumulation/clipping, JAX·PyTorch·TensorFlow 등
  • General ML: Curse of dimensionality, CNN, RNN/LSTM, MLE vs MAP, Bias-Variance Tradeoff, Backprop, BatchNorm/LayerNorm/RMSNorm, Adam/AdamW, KL Divergence, Precision/Recall/F1/AUC-ROC 등
  • Linear Algebra: Positive Semi-Definite, Jacobian, Eigenvectors/Eigenvalues, Hessian, Null/Image space, Rank/Span, Determinant 등

댓글과 토론