엔비디아는 확실히 오픈 가중치 모델, 네모트론을 계속 출시할 유인이 있고, 파인튠 패키지를 역시 같이 무료로 풀려고 하고 있습니다. 그 외의 기업들은 기업 홍보 말고 유인이 있을 거 같지는 않네요. 뭐 인퍼런스만 하면 무조건 "디즈니 플러스를 구독하세요!" 같은 광고가 답변 마지막에 붙는 모델이라면 모를까.
정확히 짚어주셨습니다. 현재 BM25 레이어 tokenize()는 공백+구두점 분리 후 한글/CJK 문자를 개별 문자 단위로 추가 분해합니다. '검색하다' → ['검','색','하','다'] + '검색하다' 전체 토큰 형태입니다. 부분 매칭은 되지만 형태소 의미 단위가 뭉개지는 건 맞습니다.
Kiwi/Lindera 연동은 다음 단계 후보로 보고 있습니다. CTX는 쿼리가 trigger 라우팅 전에 언어 감지를 하고 있어서 한국어 감지 → 형태소 분석기 분기가 상대적으로 깔끔하게 들어갈 것 같습니다.
seCall에서 Lindera ko-dic + Kiwi-rs 조합으로 해결하셨다니 흥미롭네요. 혹시 CJK 혼합 텍스트(한글+영문 코드 주석) 처리는 어떻게 하셨는지 공유 부탁드려도 될까요?
결과와 상관 없이, 응원합니다.
https://github.com/meshcore-dev/meshcore
소스가 비공개라고 해서 찾아봤는데, 이게 아닌가요?
우리나라의 klsc는 언제 나올련지...
엔비디아는 확실히 오픈 가중치 모델, 네모트론을 계속 출시할 유인이 있고, 파인튠 패키지를 역시 같이 무료로 풀려고 하고 있습니다. 그 외의 기업들은 기업 홍보 말고 유인이 있을 거 같지는 않네요. 뭐 인퍼런스만 하면 무조건 "디즈니 플러스를 구독하세요!" 같은 광고가 답변 마지막에 붙는 모델이라면 모를까.
용도가 다른 것 같은데요. 간단한 메모나 답변은 markdown이 좋고 시각화가 필요하면 html이 낫고
v0.3.19 업데이트 — 세션 종료 시 자동 전송:
가장 크게 바뀌 점: 이제 ctx-install 후 아무 명령없이 정상 사용만 해도 세션 종료 시 통계가 자동으로 Turso에 전송됩니다.
스키마 v1.7 추가 필드:
옵아웃: ~/.claude/ctx-telemetry-revoke 파일 생성 시 전송 중지
매우 짧은 엠바고 vs 긴 엠바고 중에서 " 매우 짧은 엠바고"로 갈수 밖에 없으니, 보안담당 AI agent는 더 바빠지겠네요.
그 회사 저격인가.
v0.3.16 업데이트 및 라이브 데모 추가:
라이브 대시보드 (HF Space): https://be2jay-ctx-dashboard-demo.hf.space
주요 변경사항 (v0.3.16):
활용률 실측 (n=1054 세션):
정확히 짚어주셨습니다. 현재 BM25 레이어 tokenize()는 공백+구두점 분리 후 한글/CJK 문자를 개별 문자 단위로 추가 분해합니다. '검색하다' → ['검','색','하','다'] + '검색하다' 전체 토큰 형태입니다. 부분 매칭은 되지만 형태소 의미 단위가 뭉개지는 건 맞습니다.
Kiwi/Lindera 연동은 다음 단계 후보로 보고 있습니다. CTX는 쿼리가 trigger 라우팅 전에 언어 감지를 하고 있어서 한국어 감지 → 형태소 분석기 분기가 상대적으로 깔끔하게 들어갈 것 같습니다.
seCall에서 Lindera ko-dic + Kiwi-rs 조합으로 해결하셨다니 흥미롭네요. 혹시 CJK 혼합 텍스트(한글+영문 코드 주석) 처리는 어떻게 하셨는지 공유 부탁드려도 될까요?
npx ccinv 로 사용해보실 수 있습니다.
일단 정말 저렴한건 좋은데 문제가 너무 느림....codex로 5분 걸릴거 얘는 20분 생각함. 그래서 구현으로 쓰기보다 코드리뷰용으로 쓰는중인데 코드리뷰는 꽤 잘해서 만족중
역시 최고의 프로그래밍 언어!
이거 죄없는 한국인들도 나중에 피해볼까봐 걱정되네요잉
언어를 바꿔타야겠다..
맞아요 아무리 찾아도 부담이..
저도 이 부분 읽고 있는데, 소름이 🥲
요즘 에이전트가 이용할 헤드리스 브라우저가 정말 많이 나와서, 이제 또 뭘 써야할지 비교해보고 선택해야 합니다.
위에 관련글에 2개 같이 있네요
Visa와 Mastercard는 점점 검열 시스템에 가까워지고 있어서 경쟁과 대체가 필요하다고 봅니다.
굉장히 시니컬한 글인데, 왜 이렇게 재밌게 읽힐까 싶네요. 코즈믹 호러를 좋아해서 그런지...