qmd 써볼까 싶어서 AI에게 조사시켰더니 임베딩 쪽은 괜찮은데 BM25 와 쿼리확장 쪽은 한국어 지원이 안좋아서 비추천하네요...

거의 대부분 BM25에서도 그렇습니다.
따라서 형태소 분석기를 함께 쓰는게 좋아요.
https://github.com/bab2min/Kiwi

이거 팩트체크 해보니까 정확한 증거는 없는거 같은데. 혹시 다른 분들의 경험은 혹시 있으실까요?

BM25가 단어 위주의 검색이니 galadbran님의 의견은 make sense한 것 같습니다.