여기서도 힌디어 문자가 보이네요. 최근들어 openai, claude, google 무관하게 한국어 output에 힌디어가 섞여나오는 경우가 꽤 자주 발생하는데 한국어 데이터셋 라벨링을 인도인들이 해준걸까요?
중국 모델은 한국어 응답에 중국어가 섞여나와서 불호였는데 최근에는 프론티어 모델들이 힌디어를 자꾸 섞으니까 오히려 중국 모델에 대한 거부감이 낮아졌어요
안녕하세요, 첫 피드백을 주셔서 정말로 감사합니다. 이 프로젝트는 아직 주말 이틀간에 걸쳐 만든 PoC 단계에 불과합니다. 때문에 저도 아직 그럴듯한 결과물을 내지는 못하였습니다.
말씀하진 것처럼 이미 PaperClip이나 gastown 같은 동류의 오픈소스들이 많음에도 굳이 새로운 프로젝트를 만들게 된 계기는 보다 세팅이 편리하고 가시적인 프레임워크를 만들어보고 싶어서 였습니다.
사용해보시면 알겠지만 무작정 토큰만 먹는다는 느낌을 없애기 위해 어떤 일들을 하는지, 어떤 결과물을 만들어내는지를 시각적으로 확인할 수 있습니다.
아직 부족하고 버그도 있지만 굳이 이 프로젝트를 공개한 이유는 검증하는 단계에서 다른 사람들에게 노출해서 부족한점들을 빠르게 개선하고자 함에 있습니다. 한번 써주시고 피드백 혹은 개선을 위한 PR을 부탁드립니다!
좋은 레퍼런스가 될 글이네요. 본문이 "들어오는 토큰"의 밸브를 잠그는 접근이라면,
저는 "등록된 것 자체"가 많아져서 문제인 케이스를 많이 겪어서
claude-slim이라는 도구를 만들어봤습니다.
스킬 60개 중 절반은 한 번도 안 쓴다든가, CLAUDE.md가 플러그인 때문에 비대해진다든가 하는
상황을 스캔·분류·정리해주는 CLI입니다. 토큰 카운팅은 js-tiktoken 기반,
제거하는 게 아니라 skills.disabled/로 이동해서 언제든 restore 가능.
동감. 항공우주,의료,정밀제어분야 등에서 고도화된 도메인의 핵심 데이터들은 철저하게 폐쇄된 내부망에 있고 접근하려면 핵심 내부자이거나, 외부라면 상당한 비용과 NDA 서명을 거쳐야 겨우 오픈됨. AI가 학습하는 데이터의 대부분은 인터넷에 공개된 것들이고 Python, JavaScript 기반 웹/앱 서비스라면 Full Automation이 어느 정도 가능.
고도화된 도메인에서 쓰이는 3D 그래픽스, CAD 기반 알고리즘들은 인터넷에 파편적으로 흩어져 있거나 아예 없기 때문에 AI 역시도 바이브 코딩으로는 피상적인 결과를 만들어 줄수 밖에 없다. 하나의 메인 에이전트를 두고, 도메인 맥락을 마이크로 매니징 수준으로 지속 주입하면서 Planning → Redirection → Review 사이클로 개발자가 직접 주도하는 풀 자동화가 아닌 지속적증폭의 방식으로 개발하는것이 안전하고 현실성 있는 접근이라고 생각
마우스 커서가 화면 가장자리에 있을때 나타난 핸들을 커서로 [마우스다운 > 드레그(당기기) > 마우스업] 하면서 전환되는 기능이면 좋겠다는 생각이 드네요.
여기서도 힌디어 문자가 보이네요. 최근들어 openai, claude, google 무관하게 한국어 output에 힌디어가 섞여나오는 경우가 꽤 자주 발생하는데 한국어 데이터셋 라벨링을 인도인들이 해준걸까요?
중국 모델은 한국어 응답에 중국어가 섞여나와서 불호였는데 최근에는 프론티어 모델들이 힌디어를 자꾸 섞으니까 오히려 중국 모델에 대한 거부감이 낮아졌어요
히히 이거로 뭐함?
오 공유 감사합니다!
안녕하세요, 첫 피드백을 주셔서 정말로 감사합니다. 이 프로젝트는 아직 주말 이틀간에 걸쳐 만든 PoC 단계에 불과합니다. 때문에 저도 아직 그럴듯한 결과물을 내지는 못하였습니다.
말씀하진 것처럼 이미 PaperClip이나 gastown 같은 동류의 오픈소스들이 많음에도 굳이 새로운 프로젝트를 만들게 된 계기는 보다 세팅이 편리하고 가시적인 프레임워크를 만들어보고 싶어서 였습니다.
사용해보시면 알겠지만 무작정 토큰만 먹는다는 느낌을 없애기 위해 어떤 일들을 하는지, 어떤 결과물을 만들어내는지를 시각적으로 확인할 수 있습니다.
아직 부족하고 버그도 있지만 굳이 이 프로젝트를 공개한 이유는 검증하는 단계에서 다른 사람들에게 노출해서 부족한점들을 빠르게 개선하고자 함에 있습니다. 한번 써주시고 피드백 혹은 개선을 위한 PR을 부탁드립니다!
좋은 레퍼런스가 될 글이네요. 본문이 "들어오는 토큰"의 밸브를 잠그는 접근이라면,
저는 "등록된 것 자체"가 많아져서 문제인 케이스를 많이 겪어서
claude-slim이라는 도구를 만들어봤습니다.
스킬 60개 중 절반은 한 번도 안 쓴다든가, CLAUDE.md가 플러그인 때문에 비대해진다든가 하는
상황을 스캔·분류·정리해주는 CLI입니다. 토큰 카운팅은 js-tiktoken 기반,
제거하는 게 아니라 skills.disabled/로 이동해서 언제든 restore 가능.
https://github.com/iops-leo/claude-slim
본문 설정들과 방향이 정확히 보완돼서 병행하면 좋을 것 같습니다
촘촘하게 맞물린 다이얼 덕분에 환승이 쾌적함 -> 희망편
스크린도어가 없어 출퇴근 시간에 뛰어들어 자살하는 사람이 종종 있고, 정전, 고장 등의 이유로 지연이 잦음 -> 절망편
일본에서 산 지 1년 되었는데 일본 철도가 좋다고 느끼는 순간이 53% 정도이고, 47% 정도는 짜증만 가득합니다. 특히 히비야선은 에어컨 곰팡이 냄새가 1년 내내 나는지라 마스크 안쓰고 타면 폐렴 걸릴 것 같아요.
써보니까 냅킨 스케치 인식률이 놀랍네요. 이젠 채팅도 필요없어졌습니다.
저는 오히려 AI Agent 쓰고나서 nvim으로 왔습니다.
소스를 보는게 nvim으로 보는게 훨씬 편해서..
동감. 항공우주,의료,정밀제어분야 등에서 고도화된 도메인의 핵심 데이터들은 철저하게 폐쇄된 내부망에 있고 접근하려면 핵심 내부자이거나, 외부라면 상당한 비용과 NDA 서명을 거쳐야 겨우 오픈됨. AI가 학습하는 데이터의 대부분은 인터넷에 공개된 것들이고 Python, JavaScript 기반 웹/앱 서비스라면 Full Automation이 어느 정도 가능.
고도화된 도메인에서 쓰이는 3D 그래픽스, CAD 기반 알고리즘들은 인터넷에 파편적으로 흩어져 있거나 아예 없기 때문에 AI 역시도 바이브 코딩으로는 피상적인 결과를 만들어 줄수 밖에 없다. 하나의 메인 에이전트를 두고, 도메인 맥락을 마이크로 매니징 수준으로 지속 주입하면서 Planning → Redirection → Review 사이클로 개발자가 직접 주도하는 풀 자동화가 아닌 지속적증폭의 방식으로 개발하는것이 안전하고 현실성 있는 접근이라고 생각
뇌빼고 바이브코딩하는 개발자들 보면 화딱지 터짐. 본인의 결과물 퀄리티가 엉망인데 AI가 짰어요라고 변명해봐라. 책임은 본인이 져야하는거다.
검정소랑 누렁소 중에서 누가 더 일을 잘하오?
욕먹는 소가 더 일을 잘하옵니다
항상 이거랑 비슷한 논리로 반격을 드는 것 같은데.. 계산기는 계산 안틀립니다. 자기역할은 제대로 해요.
감사합니다. 클로드 토큰 소모도 크고 일도 코덱스 대비 좀 불만족스러워서 저는 요즘 코덱스로 더 일을 많이 하고 있어요.
이런 류의 하네스들이 설명은 아주 달콤하지만 결과는 잘 동작하느냐,
그리고 잘 나온다면 실제로 이 구조의 개별 컴포넌트가 유의미한 컴포넌트인가
단순 토큰을 좀먹는 그럴듯해보이는 컴포넌트는 아닌가
이런 것들에 대한 증명을 먼저 탑재한 채로 릴리즈를 해야된다고 생각합니다
하루에도 몇 십개씩 나오다보니 하나하나 써보기에도 벅찬 심정입니다.
작성자 분은 이 하네스로 어떤걸 만들어보셨고 어떤 breakthrough들이 있었는지도 궁금합니다.
좋은 정보 공유 감사드립니다. 근본적으로 토큰 사용량 자체가 너무 적어진걸 체감하고있어서 클로드에서 늘려줬으면 좋겠네요 하네스가 돌다가 중간에끊기니...
안녕하세요.
openvsx 링크도 첨부드립니다.
https://open-vsx.org/extension/the0807/git-graph-plus
그래서 저는 객관이 필요한 질문에는 "긍정/비판/종합" 3파트로 대답하라고 프롬프트를 씁니다
와우......!
감사드립니다.
cursor 나 antigravity에서도 사용할 수 있게 openvsx ( https://open-vsx.org/ )에도 등록해주시면 좋을것 같아요