3줄 요약

  • 모델보다 시스템(하네스)이 성패를 결정함: AI의 성능은 GPT나 클로드 같은 모델 자체보다, 이를 둘러싼 프롬프트, 도구, 샌드박스, 피드백 루프 등 '하네스'라 불리는 작업 환경 설계에 의해 좌우됨
  • 실수를 규칙으로 굳히는 '래칫(Ratchet)' 원칙: AI의 실수를 단순 사고로 치부하지 않고 규칙 문서(AGENTS.md 같은거)나 훅에 즉각 반영하여, 시간이 흐를수록 시스템이 더 견고해지도록 관리해야함
  • 모델 탓이 아닌 설정(Skill)의 문제: AI가 일을 못 하는 것은 모델의 지능 부족보다 하네스 설계의 부실함 때문인 경우가 많으며, 원하는 결과물에서 역순으로 필요한 부품과 제약 조건을 설계하는 공학적 접근이 필수적임

예전에 테스트 해보고 캡스락을 항상 컨트롤로 쓰고 있습니다.
윈도우의 경우는 항상 설치 후 https://github.com/randyrants/sharpkeys 를 깔아서 썼구요.(registry 방식)
리눅스는 gui 는 배포판마다 다르지만 설정에서 거의 바로 되고 없으면 setxkbmap nocaps 관련 설정해서 씁니다.

참고하겠습니다. 감사합니다.

물론 실정상 쉬운건 아니겠지만... 연동 후 딸깍으로 1000원같은게 있어야 결과적으로 장벽이 낮춰지지 않을까 싶은 느낌이 언제나 듭니다.
서비스를 써 보고 괜찮으면 그냥 첫 사용 직후에 클릭 한번 하고 넘어가는 느낌으로요...
뭐 브라우저 표준 결제니 뭐니 해서 얘기는 종종 나오는 것 같았지만 이해관계가 많이 엮여있어서 그런지 뭔가 좀 확실하게 나오는건 없나봅니다
이런 건 결국 개발자랑 사용자 모두에게 널리 퍼져야 잘 자리잡을 것 같습니다. 파이팅입니다.

추가로, 돈 추가하는 버튼이 지불액 선택이랑 약간 헷갈리는 부분이 있어서 조금 바뀌면 좋을 것 같습니다.
크라우드펀딩이나 이런쪽이 익숙해서 그런지 무의식적으로 액수 선택하는거라는 생각으로 눌러버리네요.

옛날에 프롬프트로 A 해줘 라고 분명히 적어놨는데도 일정확률로 자꾸 안지켜서 mrkdwn bold로 강조해보기, 두번적어보기, 영어로 적어보기, 수미상관으로 적어보기, xml로 적어보기 별별짓을 해봤는데 자꾸 일정확률로 프롬프트를 무시하더라구요...

근데 프롬프트에 A해줘, B하지마 라고 했을때 진짜 잘 알아들으면 이런 접근이 유효할거같은데 AI 서버 상태에 따라 확률적으로 프롬프트를 이행하는 경우엔 이런 접근이 유효할까요?

잠수함 패치로 성능을 낮춰도 모를거라고 생각하는데, 사실 사람의 촉이라는것도 생각보다 날카로워서 내 촉 + 커뮤니티의 사람들의 이야기 종합해보면 바로 답 나옵니다.

"그래서 니가 뭘 할 수 있는데 ㅋㅋ" 라서 어쩔수없이 쓸 뿐이죠....

codex 전용 모델 5.3때는 진짜 말머리 없는데 코딩만 잘하는 부하직원과 대화하는 느낌이었다면
5.4부터 애가 말을 조금씩 하게 되더니 5.5부터는 반쯤은 정신 차린거 같아요.
아직도 API를 계약이라고 하질 않나, 가끔 영어랑 한국어를 미친듯이 섞어서 말을 내뱉어서 "이해하기 쉽게, 최대한 영어 빼고 이야기 해줘" 라고 적어야 하기도 하지만요.

그럼에도 불구하고 코드뽑는 성능은 체감상 5.4를 기점으로 opus를 넘었다고 생각합니다. opus 4.7 나왔지만 찍먹도 안했네요. 또 "Anthropic" 식의 마케팅일게 뻔해보여서요.

와우 좋네요 공유 감사합니다

cmux 다 좋은데 프로젝트 파일 보려면 다른 ide를 써야해서 고민하고 있었는데ㅎㅎ 잘 써보겠습니다. 감사합니다~!

업데이트: Codex 주간 한도 값이 간헐적으로 이전 reset window로 되돌아가는 케이스를 확인해서 v0.3.11 패치 릴리스를 올렸습니다.

여러 Codex session JSONL이 서로 다른 reset window를 기록할 때, 더 최신 reset window를 우선 선택하도록 수정했습니다.

https://github.com/bemaru/trafficmonitor-ai-usage-plugin/…

근데 하네스 지난주까지만해도 엄청 팔아먹더니 이번주부터는 잠잠하네요.. 엔트로픽의 삽질과 코덱스 5.5가 뛰어나서 그런지........

'오잉? 예전에 봤던거 같은데...' 싶었는데 함께 보면 좋은 글에 바로 링크를 달아주는 군요ㅎㅎ

음, 대부분의 문제는 일렉트론이나 타우리 차이에서 생긴 문제보다 WebView 엔진 + OS/드라이버 이슈가 더 많은 것 같아요.

몇 년째 쓰고 있는데, 에이전트 기반으로 넘어가면서 점점 힘을 잃네요 ㅎㅎ
그래도 개인 문서 작성이나 손으로 코딩하는 경우가 많아서 은근 도움이 많이 되는데.

쿼터 증량 없이 27배율 되면 에이전틱 코딩은 사용하지 못할 수준이 아닌지?

관심 감사합니다! 써보시고 불편하신점 있으시면 피드백 부탁드립니다 :)

마침 필요해서 duckbar(맥용) 포팅해서 하나 만들어 볼까했는데 유용하게 잘 써보겠습니다.