정확히 짚어주셨습니다. 현재 BM25 레이어 tokenize()는 공백+구두점 분리 후 한글/CJK 문자를 개별 문자 단위로 추가 분해합니다. '검색하다' → ['검','색','하','다'] + '검색하다' 전체 토큰 형태입니다. 부분 매칭은 되지만 형태소 의미 단위가 뭉개지는 건 맞습니다.
Kiwi/Lindera 연동은 다음 단계 후보로 보고 있습니다. CTX는 쿼리가 trigger 라우팅 전에 언어 감지를 하고 있어서 한국어 감지 → 형태소 분석기 분기가 상대적으로 깔끔하게 들어갈 것 같습니다.
seCall에서 Lindera ko-dic + Kiwi-rs 조합으로 해결하셨다니 흥미롭네요. 혹시 CJK 혼합 텍스트(한글+영문 코드 주석) 처리는 어떻게 하셨는지 공유 부탁드려도 될까요?
정확히 짚어주셨습니다. 현재 BM25 레이어 tokenize()는 공백+구두점 분리 후 한글/CJK 문자를 개별 문자 단위로 추가 분해합니다. '검색하다' → ['검','색','하','다'] + '검색하다' 전체 토큰 형태입니다. 부분 매칭은 되지만 형태소 의미 단위가 뭉개지는 건 맞습니다.
Kiwi/Lindera 연동은 다음 단계 후보로 보고 있습니다. CTX는 쿼리가 trigger 라우팅 전에 언어 감지를 하고 있어서 한국어 감지 → 형태소 분석기 분기가 상대적으로 깔끔하게 들어갈 것 같습니다.
seCall에서 Lindera ko-dic + Kiwi-rs 조합으로 해결하셨다니 흥미롭네요. 혹시 CJK 혼합 텍스트(한글+영문 코드 주석) 처리는 어떻게 하셨는지 공유 부탁드려도 될까요?
npx ccinv 로 사용해보실 수 있습니다.
일단 정말 저렴한건 좋은데 문제가 너무 느림....codex로 5분 걸릴거 얘는 20분 생각함. 그래서 구현으로 쓰기보다 코드리뷰용으로 쓰는중인데 코드리뷰는 꽤 잘해서 만족중
역시 최고의 프로그래밍 언어!
이거 죄없는 한국인들도 나중에 피해볼까봐 걱정되네요잉
언어를 바꿔타야겠다..
맞아요 아무리 찾아도 부담이..
저도 이 부분 읽고 있는데, 소름이 🥲
요즘 에이전트가 이용할 헤드리스 브라우저가 정말 많이 나와서, 이제 또 뭘 써야할지 비교해보고 선택해야 합니다.
위에 관련글에 2개 같이 있네요
Visa와 Mastercard는 점점 검열 시스템에 가까워지고 있어서 경쟁과 대체가 필요하다고 봅니다.
굉장히 시니컬한 글인데, 왜 이렇게 재밌게 읽힐까 싶네요. 코즈믹 호러를 좋아해서 그런지...
마소 ms office 여기저기 클립 모양 도우미 캐릭터 있었던 것 같은데요 ㅋㅋㅋ 다시 그 시절로 회귀하는 걸 보니 신기하네요.
최근 기사 보니까 2배 이벤트 하고, 피크 한도 없어졌네요.
앤트로픽이 클로드 코드 접근권을 없애는 방식으로 저가형 구독 요금제를 축소하는 대신, 구독자를 위해 클로드 코드 사용량을 2배로 늘리기로 했다. 이례적인 협력 관계 덕분에 가능했다.
샌프란시스코에서 열린 ‘클로드로 코딩하기’ 개발자 컨퍼런스 첫날, 앤트로픽은 스페이스X와의 제휴로 컴퓨팅 용량을 대폭 늘릴 수 있다고 발표했다.
이번 제휴로 앤트로픽은 클로드 프로, 맥스, 팀 및 기업용 요금제의 클로드 코드 5시간 사용 한도를 2배로 늘렸고, 클로드 오퍼스 모델의 토큰당 API 요금 한도도 상향한다. 주간 클로드 코드 한도에 대한 언급은 없었다. 앤트로픽에 더 자세한 답변을 요청한 상태다.
앤트로픽은 또한 3월 말 도입한 클로드 프로, 맥스 계정의 피크 시간 사용 한도를 해제하기로 했다.
펫 하면 저는 그 옛날 마소의 누렁이가 생각납니다.. ㅋㅋ 유행은 돌고 도는 것인가.
GPT-Realtime-Translate 이 한국어를 지원할까요?
인터뷰 기능이 좋네요.
코드나 설비를 다루는 것과 사람을 대하는 것에는 크나 큰 차이가 있으니까요...
네 화면이 크면 많이 효율적이긴 합니다.
그런데, vs-code나 antigravity 같은것들도 사실 우측에 채팅창 열어놓고 있는건 비슷하니 큰 문제는 아닐거라 생각했어요.
네 저도 claudian 이나 codexian을 활용해서 cli 모드를 써왔는데, 아무래도 터미널에 오리지날을 띄워서 하는게 여러모로 편하더라구여 ^^
오... diff > diff-so-fancy > delta 순으로 사용해왔는데 흥미롭네요.
좀 사용해보고 괜찮으면 git core.pager 도 바꿔봐야겠습니다.