# 머신러닝 취업 면접 - 완벽 가이드

> Clean Markdown view of GeekNews topic #30587. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=30587](https://news.hada.io/topic?id=30587)
- GeekNews Markdown: [https://news.hada.io/topic/30587.md](https://news.hada.io/topic/30587.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2026-06-18T09:28:02+09:00
- Updated: 2026-06-18T09:28:02+09:00
- Original source: [silviasapora.github.io](https://silviasapora.github.io/blog/ml-interviews.html)
- Points: 11
- Comments: 0

## Topic Body

- Machine Learning 박사 학위 후 **Research Scientist** 직무를 구하는 전체 과정을 정리한 실전 경험 모음  
- DeepMind, Isomorphic Labs, Cohere, Meta 및 스텔스 스타트업 등 **인터뷰를 완료한 모든 회사에서 오퍼를 받은 사례** 기반  
- 인터뷰 확보 기준, **기술·감정·로지스틱 준비법**, 스타트업 vs 빅테크 비교, 연봉 협상까지 단계별 정리  
- RSU와 stock option의 세금·구조 차이, **transformer·attention 직접 구현** 등 구체적 준비 항목 포함  
- 인터뷰는 본질적으로 **확률적(stochastic)** 이며, 결과가 연구자로서의 가치를 결정하지 않는다는 메시지 강조  
  
---  
  
### 전체 인터뷰 결과와 배경  
  
- ML 박사 후 Research Scientist 구직 과정을 직접 경험하고 정리, 시작 시점에 참고할 자료가 거의 없었음  
- **인터뷰를 완료한 모든 회사에서 오퍼 획득** — DeepMind(수락), Isomorphic Labs, Cohere, Meta, 스텔스 스타트업 포함  
  - Anthropic, Mistral, TeslaAI는 연락이 늦어 프로세스 미완료  
  - ReflectionAI는 RS 직무에서 유일한 거절, 대신 Engineering 트랙으로 전환 제안  
- SpaceXAI, Waymo, Wayve는 인터뷰 초청 없음  
  - Waymo에는 박사 과정 내내 6개월마다 지원했으나 한 번도 응답 없었음  
  
### 인터뷰 확보 방법  
  
- 인터뷰 확보의 핵심 레버는 **더 많은 논문, 트렌디한 주제, 더 좋은 인턴십**  
  - 박사 과정 중 ICLR / NeurIPS / ICML에 게재한 **1저자(또는 공동 1저자) 논문 4편** 보유 (LLM, RL, Meta-Learning, Evolution Strategies)  
  - Apple 인턴십 및 Meta 소프트웨어 엔지니어 경력 보유  
- 대략적 기준: **1저자 논문 3편 이상 + 인턴십 또는 산업 경력 1회 이상**이면 상위 랩에서 꾸준히 콜백 확보 가능  
- 이미 인터뷰를 받고 있다면 추가 논문은 도움 안 됨 → **연구가 아닌 인터뷰 준비에 집중** 필요, 준비된 느낌은 오지 않으므로 지금 시작해야 함  
  
#### 커버레터, 추천, 콜드 이메일, LinkedIn/X  
  
- **LinkedIn / X**: 많은 회사가 채용 공고를 올리며, 인턴십은 이곳이 유일한 지원 경로인 경우 있음  
  - 공고에 연결된 Google form을 작성해야 실제 지원으로 인정됨  
- **Referrals(추천)**: 있으면 좋지만 필수 아님  
  - DeepMind에서는 추천 있던 직무와 없던 직무 모두 인터뷰 초청받음  
- **Cold emails(콜드 이메일)**: 채용 담당자나 팀원에게 직접 메일 보내는 것은 종종 환영받음  
  - CV 반복이 아니라 해당 팀에 적합한 이유와 흥미를 느끼는 지점을 설명해야 함  
- **Cover letters(커버레터)**: 드물게 요구되나 요구 시 제대로 작성  
  - **Claude / Gemini / ChatGPT에 통째로 작성을 맡기지 말 것**, 직접 쓴 뒤 다듬는 용도로만 활용  
  
### 스타트업 vs 빅테크  
  
- **스타트업은 찾기가 더 어려움**, 중앙화된 탐색처 없음 → 동료·친구·전 동료를 통한 입소문이 최선이며, 그만큼 경쟁도 덜 치열함  
- **스타트업은 인터뷰 프로세스 편차가 큼**, 빅테크는 비교적 예측 가능한 구조  
  - 프로세스가 너무 쉽게 느껴지면 실제 업무 복잡도에 대한 신호일 수 있음  
- **업무 성격은 양방향** — 적합한 스타트업에서는 더 흥미롭고 임팩트 큰 연구 가능, 반대로 더 많은 압박·인프라 작업·잦은 연구 방향 변경 동반 가능  
  - 인터뷰에서 연구 우선순위 결정자, 수익화 경로, 경쟁사 등을 질문할 것  
- **성장 기회**: 스타트업은 빠른 성장과 책임 확대, 업무 방향 형성 기회 제공, 빅테크에서는 다수 중 하나  
- **CV 인지도**: OpenAI나 Anthropic은 즉시 인식되나, 무명 스텔스 스타트업은 설명 필요  
- **고용 안정성**: 빅테크도 대규모 정리해고를 반복해왔으며, 어느 쪽도 100% 안전하지 않음  
  
#### 보상: RSU vs Stock Option (영국 기준)  
  
- **RSU**(빅테크 일반적): 베스팅 일정에 따라 실제 주식 수령, 베스팅 시 약 절반은 소득세 충당 위해 즉시 매도 — RSU는 소득으로 과세됨  
- **Stock option**(스타트업 일반적): 주식이 아니라 고정 가격 X에 매수할 수 있는 권리 획득  
  - 시장가 Y > X이면 X에 사서 Y에 팔아 차익 확보, Y < X이면 옵션은 무가치  
- Stock option은 보통 **퇴사 90일 후 만료**, 회사가 비상장이면 매수 후에도 매도 불가  
  - 영국에서는 옵션 행사 순간, 한 푼도 받지 못한 상태에서 Y−X 차익에 대해 소득세 부과  
  - 비상장 회사에서 2년 근무 후 퇴사·행사 시 (X × 옵션 수) 매수 비용 + (Y−X) × 옵션 수 × 세율의 소득세를 수익 발생 전에 부담  
- 대부분 cashless exercise 옵션 제공, 다수가 자사주 매입(liquidity event) 진행  
  - 단 매 펀딩 라운드마다 지분 희석, 추가 이익에는 약 20% 양도소득세 부과, liquidity event 가치는 공식 기업 가치보다 낮게 책정됨  
- **요약**: 리크루터가 스타트업 지분 포함 총 보상 수치를 제시하면 정중히 웃되 상당 폭 할인해 받아들일 것  
  
### 인터뷰 구조  
  
- 대부분 회사가 비슷한 구조를 따르되 단계별 비중은 상이함  
- **Recruiter screen**: 보통 부담 적은 대화, 보유 역량의 직무 적합성과 본인 논문에 대한 설명 능력 확인 기회  
- **Technical interviews**: 프로세스의 대부분, 준비가 가장 중요, 회사에 따라 3~8회  
  - Coding: LeetCode 스타일, 보통 Medium 또는 Hard  
  - ML coding/debugging: attention 구현, backward pass 작성, 학습 루프 버그 탐지  
  - ML knowledge: 기초, 이론, 응용 ML, 시스템 디자인  
- **Behavioural interviews**: 고전적 행동 질문과 연구형 질문(관심 주제, 분야 전망)으로 구분, 기술 인터뷰보다 캐주얼하나 과소평가 금지  
  
### 기술 준비  
  
- **가장 핵심 파트, 건너뛰지 말 것** — 뛰어난 연구자도 준비 부족으로 탈락한 사례 있음, 매일 ML을 다루는 것과 attention을 처음부터 구현하는 것은 다름, **최소 한 달** 규칙적 학습 배정 필요  
- 메타 전략: 일반 준비는 최소화하고 **다음 특정 인터뷰·회사에 맞춰 타깃 준비**, 자료가 머릿속에 신선하게 유지됨  
- RS / Engineer 인터뷰는 overfitting 같은 기초부터 LeetCode, transformer 구현, Griffin·TransformerXL·S4 같은 현대 아키텍처까지 거의 무엇이든 출제 가능  
  
#### Flashcards  
  
- ML 기초, 응용 ML, 연구 토론용으로 활용, Anki보다 물리 플래시카드가 더 효과적이었음  
- **카드를 직접 작성하는 것이 학습의 절반**, 남의 덱을 다운로드하지 말 것  
- 복습 시 스스로 질문하며 깊이 이해, 학습 중 던진 질문이 실제 인터뷰에 다수 출제됨  
  
#### LLM 모의 인터뷰 (Claude / Gemini)  
  
- 각 인터뷰 전 직무·인터뷰·회사 설명을 LLM(주로 Claude)에 붙여 넣고 인터뷰 요청, 연습 질문과 실제 질문의 중복 빈번  
- 난이도가 맞지 않으면 새 채팅에서 본인 수준·배경을 더 명시  
- 학습에는 Claude가 가장 우수했고 피드백도 공정했던 반면, Gemini는 다소 과도하게 칭찬하는 경향  
  
#### LeetCode / NeetCode  
  
- 최소 **Blind 75**, 선택적으로 NeetCode 150 수행, Medium 중심  
  - 각 문제의 최적 해를 목표 (TwoSum의 O(N²) 해는 인정 안 됨), Hard에는 시간 투자 자제  
- DFS, BFS, Graphs, Backtracking, DP, Binary Search 등 기본 패턴을 빠르게 구현, Medium당 20분 이하 목표  
  - 15분 이상 막히면 해답 확인 후 표시하고 넘어갈 것  
- **깊이보다 넓이가 중요**, 총 Medium 약 150문제 풀이  
  
#### Books  
  
- *Designing Machine Learning Systems* (Chip Huyen): 기초 및 응용 ML 질문 다수 커버  
- *[The JAX Scaling Book](https://jax-ml.github.io/scaling-book/)*: 인터뷰 후 발견했으나 우수, 사전에 알았다면 적극 활용했을 자료  
- *Reinforcement Learning* (Sutton & Barto): RL 입문자만 권장, 이미 해당 분야 종사자에겐 과함  
  
#### Courses  
  
- **선형대수**: [Gilbert Strang의 YouTube 강의](https://www.youtube.com/watch?v=7UJ4CFRGd-U&list=PLE7DDD91010BC51F8), 2배속으로 하루 안에 완주 가능  
- **Diffusion / Flow Matching**: [MIT](https://www.youtube.com/watch?v=9eJQQVrUUoI&list=PL57nT7tSGAAXwjhDYcxEycx5W7YoSrZyt), [Stanford](https://www.youtube.com/watch?v=tr-CUpw--ck&list=PLoROMvodv4rNdy8rt2rZ4T2xM0OjADnfu) 강의 모두 우수하나 수학 비중 높음, 미연구자라면 diffusion SDE·flow matching ODE 등 기본 직관과 핵심만 암기  
  
#### ML coding 및 debugging  
  
- 좋은 자료가 가장 적고 실제 경험이 가장 중요한 영역, 디버깅 인터뷰는 LLM이 그럴듯한 버그 코드를 안정적으로 생성하지 못해 연습이 어려웠음  
  - 본인 또는 동료의 코드베이스 리뷰가 최선, [DeepML](https://www.deep-ml.com/problems)과 [Tensor Puzzles](https://github.com/srush/Tensor-Puzzles)도 도움  
- 목표 베이스라인  
  - transformer를 end-to-end로 구현  
  - causal, cross, self attention 구현  
  - flash attention 구현  
  - attention backward pass 구현  
  - MLP forward / backward pass 구현  
  - PyTorch 또는 JAX로 SGD 학습 루프 구현  
- 위 항목을 시간 압박 속에서 직접 구현할 수 있으면 양호한 상태  
  
### 감정 준비  
  
- 정서적으로 괜찮다면 이 섹션은 건너뛸 것, 불필요한 불안을 심지 않기 위함  
- 가장 큰 문제는 수면 — 인터뷰 전날 잠을 못 자고, 주당 10회 인터뷰 시 심각한 문제가 됨, 식사도 어려워 메스꺼움 발생  
  - 규칙적 운동, 일관된 저녁 루틴, 사회적 고립 회피 권장  
  - 인터뷰 전 달리기가 긴장 에너지 해소와 머리 리셋에 도움  
- **인터뷰 전 루틴** 유지에서 큰 안정감 확보 — 배경에 생화 두기, 화장이나 스킨케어, 동일한 위안 영상 시청  
- 어느 시점부터 불안이 준비보다 더 발목을 잡았고 인터뷰 중 머릿속이 백지가 되기도 함  
  - 자신의 트리거, 실패와의 관계, 자존감의 근거를 **시작 전에** 성찰하는 편이 유리  
- 핵심 메시지: **인간으로서의 가치는 이 인터뷰들로 결정되지 않음**, 프로세스는 본질적으로 확률적이며 잘 아는 것도 실수할 수 있고 그래도 괜찮음  
- 도움된 책: *The Now Habit*, *The Gifts of Imperfection*, *Mindset*, *The Tyranny of Merit*  
  
### 로지스틱 준비  
  
- **하루에 한개의 인터뷰만**: 인터뷰는 소모적이라 하루 세 번째에는 자연히 성과 저하, 오전 인터뷰 후 나머지 시간은 다음 준비에 활용  
- **관심 낮은 회사부터 시작**: 소규모 스타트업이나 비선호 지역 등으로 프로세스 감각·자신감·연봉 수준을 사전 보정  
- **타이밍 고려**: 회사마다 진행 속도 상이, 오퍼들이 비슷한 시기에 도착하도록 조정해 실질적 레버리지 확보  
- **모든 회사에 다른 프로세스 진행 사실 알리기**: 타임라인이 명확해지고 진행이 빨라지며, 더 진지한 후보로 인식됨  
  
### 협상  
  
- 경쟁 오퍼를 숨기라는 일반적 조언과 달리, 여러 회사가 인상 전 **다른 오퍼의 증빙을 명시적으로 요구**, 한 곳은 스크린샷의 진위까지 문의  
- **회사는 원하는 후보에게는 수치를 크게 움직일 수 있음**, 항상 물어볼 가치 있음, 대부분 협상에 열려 있었음  
- **마감 기한**은 1~2주에서 모호한 "합리적 기간"까지 다양, 연장에는 대체로 비유연  
- 리크루터는 후보의 선호를 잘 읽어냄, 회사 언급 빈도·말투 같은 작은 신호도 기록됨  
- 회사는 **후보 선택에 대한 과거 데이터** 보유 → 동급 경쟁사(OpenAI 등) 오퍼만 실질적 무게를 가지며, 비현실적 비교는 통하지 않음  
  
### 의사결정 과정  
  
- 초기에는 불안해 일찍 받은 오퍼를 수락하고 싶은 유혹이 있었으나, 직감을 믿고 더 나은 선택지를 찾아냄  
- 오퍼 선택 기준은 위치, 보상, 명성, 업무 유형 등 개인마다 상이, 팀·문화·보상을 알아가며 선호 순위 변동  
- 양쪽 회사의 거의 모든 사람과 대화했으나 각자 자기 회사를 택하겠다고 답해 큰 도움 안 됨 → 결국 **자신을 잘 아는 사람과의 논의**가 가장 유용  
  
### 다시 한다면 바꿀 점  
  
- **스프레드시트 유지**: 머릿속 관리는 한계, 회사·진행 단계·마감·연락처를 정리했다면 관심 있던 곳 지원 누락을 방지했을 것  
- **기술뿐 아니라 감정도 준비**: 인터뷰가 연구자로서의 능력과 박사 가치에 대한 최종 판결처럼 느껴지나 비합리적 프레이밍, 시작 전 성찰이나 상담이 도움 되었을 것  
- **무응답 회사에 더 적극적으로 대응**: 지원서에만 의존하지 말고 직접 콜드 이메일로 관심을 표하고 레이더에 들 것  
  
### 기술 주제 목록  
  
- 인터뷰 시작 전 작성한 학습 주제 리스트, 본인 배경상 **LLM과 RL** 질문이 많았고 거의 모든 학습 주제가 한 번 이상 출제됨  
- **Reinforcement Learning**: Q-Learning / TD Learning, Bellman Equations, PPO, GRPO, GAE, DPO, Policy Gradient Theorem, On/Off-Policy, MuZero, Dreamer, AlphaGo, Soft Actor-Critic, MDP 등  
- **LLMs**: Flash Attention, LoRA, TransformerXL, Griffin, Perceiver, Scaling Laws, Mixture of Experts, RoPE, S4, Tokenisation, RLHF, Causal/Cross Attention 등  
- **Generative Modelling**: GANs, VAE 및 ELBO, Score Function, Diffusion Forward/Reverse Process(DDIM/DDPM), Diffusion SDE, Flow Matching ODE, Classifier Free Guidance  
- **Applied ML**: Tensor Parallelism, FSDP, DDP, Pipeline Parallelism, Mixed precision training, Gradient checkpointing/accumulation/clipping, JAX·PyTorch·TensorFlow 등  
- **General ML**: Curse of dimensionality, CNN, RNN/LSTM, MLE vs MAP, Bias-Variance Tradeoff, Backprop, BatchNorm/LayerNorm/RMSNorm, Adam/AdamW, KL Divergence, Precision/Recall/F1/AUC-ROC 등  
- **Linear Algebra**: Positive Semi-Definite, Jacobian, Eigenvectors/Eigenvalues, Hessian, Null/Image space, Rank/Span, Determinant 등

## Comments


_No public comments on this page._