제목이 "Search Results Gone Wrong"이라길래, 이 기회에 Kagi의 “More results” 기능 버그를 다시 언급하고 싶음
이 기능은 추가 결과를 보여줘야 하는데, 실제로는 같은 결과를 반복해서 보여줌
6개월 전에 버그로 보고했고, 곧 수정될 거라 했지만 아직 그대로임
최근 다시 확인했더니 “중복 제거가 생각보다 어렵다”는 답변을 받았음
캐싱 구조와 상위 소스 처리 방식 때문에 dedupe가 복잡하다고 함
하지만 URL 리스트 중복 제거가 그렇게 어려운 일이라고는 믿기 힘듦
검색 엔진의 핵심 기능인데 왜 이렇게 오래 걸리는지 모르겠음 버그 리포트 링크
FAQ를 보면 Kagi가 결과를 적게 주는 이유가 랭킹 품질이 너무 좋아서라고 설명함
(FAQ 링크)
하지만 이건 약간 자만심처럼 느껴짐. 혹은 다른 이유가 있을지도 모름
예전에 읽은 search-timeline 아카이브 글이 떠오름.
여러 검색 엔진이 왜 결과 페이지를 제한하는지 의문을 제기하는 글이었음
Reddit에서도 비슷한 문제를 겪고 있음
스크롤을 내려 더 많은 글을 불러오면 이전 페이지의 글이 80% 이상 중복되어 나옴
아마 old.Reddit이나 RES 관련 버그일 듯하지만, 덕분에 Reddit을 덜 하게 됨
“순수한 숫자와 프랑스어는 양립 불가”라는 말이 있었는데, 정말 그렇다고 생각함
프랑스어 숫자 표현은 정말 기묘한 구조임
예를 들어 “60-10-8”, “4-20” 같은 식으로 표현함
1999년은 “천, 아홉백, 네 스무 개, 열, 아홉” 같은 식으로 읽음
프랑스어를 10년 넘게 배웠지만, 숫자 체계는 여전히 신기함
완전한 실수는 아니지만 흥미로운 경험이 있었음
Veterans Day에 Kagi에서 “veterans day 2025”를 검색했더니
답변이 “= today”라고 나와서 순간 놀랐음
첫 번째 blooper는 “시간 == 돈”이라는 사실을 잊은 듯함
잠깐 불평하자면, 이 글들 중 진짜 검색 결과는 하나도 없음
(물론 웃기긴 함)
그래도 사람들이 뭔가를 검색했고, 그게 결과로 나온 거니까
그걸 검색 결과라고 부를 수밖에 없음
“spaceweather”를 검색했더니 뉴햄프셔의 East Derry 날씨가 나왔음
우주와는 전혀 상관없는데, 아마 우주비행사 Alan Shepherd가 그 지역 출신이라 그런 듯함
Hacker News 의견
제목이 "Search Results Gone Wrong"이라길래, 이 기회에 Kagi의 “More results” 기능 버그를 다시 언급하고 싶음
이 기능은 추가 결과를 보여줘야 하는데, 실제로는 같은 결과를 반복해서 보여줌
6개월 전에 버그로 보고했고, 곧 수정될 거라 했지만 아직 그대로임
최근 다시 확인했더니 “중복 제거가 생각보다 어렵다”는 답변을 받았음
캐싱 구조와 상위 소스 처리 방식 때문에 dedupe가 복잡하다고 함
하지만 URL 리스트 중복 제거가 그렇게 어려운 일이라고는 믿기 힘듦
검색 엔진의 핵심 기능인데 왜 이렇게 오래 걸리는지 모르겠음
버그 리포트 링크
(FAQ 링크)
하지만 이건 약간 자만심처럼 느껴짐. 혹은 다른 이유가 있을지도 모름
예전에 읽은 search-timeline 아카이브 글이 떠오름.
여러 검색 엔진이 왜 결과 페이지를 제한하는지 의문을 제기하는 글이었음
스크롤을 내려 더 많은 글을 불러오면 이전 페이지의 글이 80% 이상 중복되어 나옴
아마 old.Reddit이나 RES 관련 버그일 듯하지만, 덕분에 Reddit을 덜 하게 됨
“순수한 숫자와 프랑스어는 양립 불가”라는 말이 있었는데, 정말 그렇다고 생각함
예를 들어 “60-10-8”, “4-20” 같은 식으로 표현함
1999년은 “천, 아홉백, 네 스무 개, 열, 아홉” 같은 식으로 읽음
프랑스어를 10년 넘게 배웠지만, 숫자 체계는 여전히 신기함
완전한 실수는 아니지만 흥미로운 경험이 있었음
Veterans Day에 Kagi에서 “veterans day 2025”를 검색했더니
답변이 “= today”라고 나와서 순간 놀랐음
첫 번째 blooper는 “시간 == 돈”이라는 사실을 잊은 듯함
잠깐 불평하자면, 이 글들 중 진짜 검색 결과는 하나도 없음
(물론 웃기긴 함)
그걸 검색 결과라고 부를 수밖에 없음
“spaceweather”를 검색했더니 뉴햄프셔의 East Derry 날씨가 나왔음
우주와는 전혀 상관없는데, 아마 우주비행사 Alan Shepherd가 그 지역 출신이라 그런 듯함
“Pop os”를 검색했더니 코코스 제도의 2004년 인구 추정치가 나왔음
관련 링크
Kagi가 유료로 쓸 가치가 있는지 궁금함
만약 Kagi가 사라진다면 뭘 써야 할지 모르겠음
관련 글
글을 많이 쓰고 출처를 자주 찾아야 해서, Google이나 DDG보다 스팸이 적고 깔끔함
1년 정도 써보고 계속 쓸지 결정할 예정임
LLM 시대에 Kagi가 여전히 가치가 있는지 궁금함
내 이해로는 여러 검색 제공자의 결과를 집계하는 구조임
예를 들어 Gemini로 식물학 질문을 했을 때, 문장 표현이 조금만 달라도
서로 모순된 답변을 내놓았음
블로그 스팸을 인용했기 때문인데, Kagi처럼 출처가 명확했다면 쉽게 걸러낼 수 있었을 것임
자체 검색 백엔드와 통합되어 있어서 더 풍부한 결과를 제공함
서로 다른 검색 엔진의 상대적 가치도 이해하기 어려울 것임