거대 언어 모델은 자기 자신의 출력물을 과신, 긍정 평가하는 편향이 있습니다. 할루시네이션을 차치하더라도 다중 모델 크로스체킹, 도큐멘테이션 없는 적대적 리뷰 등을 활용하여 검증을 마친 결과만 공개적으로 공유할 것을 권장드립니다. 계속 이러시면 앞으로 유의미한 성과가 있어도 양치기 소년으로밖에 보이지 않을 겁니다.
서너개 프로젝트를 동시에 작업하다가 즉흥적으로 떠오른 문제점이나 개선사항을 에이전트에게 구현 시켜놓다보면 어느새 내가 뭘 시켰는지 조차 기억 안날때가 있죠. 아님 시켜놓고 어떤 이유로 인해 몇 시간 뒤에 돌아와서 보면 컨텍스트가 기억이 안나서 다시 에이전트와의 대화를 뒤적거리기 다반사 입니다ㅎㅎ
마이크로소프트의 최근 행보에 대해 저도 아쉽게 생각합니다.다만 연구자의 행동도 문제라고 생각합니다.
일반적으로 보안 취약점은 벤더에 제보 후 90일이 지나야 연구자가 공개할 수 있는 관례가 있습니다.
개발자분들은 아시겠지만, 기존 업무에 추가되는 보안 패치는 시간이 걸릴 수밖에 없습니다. 그렇기에 그 기간 동안 위험도와 중요도를 산정해 순서대로 처리할 수 있도록, 관례적으로 90일이라는 공개 유예 시간이 생긴 것입니다.
이렇게 무책임하게 공개해버리는 건 마이크로소프트보다도 실제 사용자들을 무방비한 공격에 노출시키는 행동이라고 생각합니다.
이런 사태에 당첨될 줄이야..
라이트한 Pro 요금제 사용자입니다.
학원에서 수업듣는데 갑자기 $220 결제가 되서 보니 추가 크레딧이 결제됐더라고요. 그래서 환불 요청을 하려는데 Fin AI Agent가 이미 사용한 크레딧은 환불이 안된다는 소리만 해서 자동 충전을 끄고 지출한도를 0으로 만들고 추가 크레딧 사용을 껐습니다. 그리고 다시 심란한 마음을 가다듬고 수업을 듣는데 또 결제가 일어나네요. 그래서 다시 들어가보니 추가 크레딧 사용이 켜져있고 지출한도는 $2000로 무제한 설정이 되고 있었습니다. 분명히 껐는데 하며 다시 껐거든요? 이번엔 끄고 나서 잠시 후 새로고침을 했더니 켜져있었어요 황당했습니다 그래서 새로고침하고도 다 꺼져있을 때까지 반복했고 다 꺼지는 것을 확인하고도 새로고침을 몇 번이나 했는지 모릅니다. 그런데 또 몇시간 뒤에 결제가 되네요. 그래서 총 $1013.43가 결제 됐습니다. 인간 상담원 요청을 했는데 묵묵부답입니다. 그래서 활성 세션을 전부 삭제하고 카드도 분실신고했네요.. 신용카드를 등록해서 그나마 대응책이 있다고 믿고 있는데, 카드사에서 처리해줄 수 있을지 지켜봐야겠네요. 다른 카드 등록은 절대 안 할 예정입니다. 믿고 맡길 수 있는 서비스가 맞는지 한 번씩 생각해보시기 바랍니다.
애초에 마소는 개발자에게 개발환경(문서 포함)을 엄청 지원해주면서도. 오픈소스 친화적이지는 않았죠.
사티아 나델라가 ceo가 된 이후. 오픈소스 친화적인 행보를 보이면서 더 호감이 생겼구요. 그 중 하나가 wsl이죠.
마소가 현재 ai 쪽에서는 죽쑤고 있다는 건 동의합니다. 깃헙 코파일럿이든 os에 통합된 코파일럿이든요.
어떤 이유로든. 제로데이 취약점에 대한 대비가 없는 상태에서 취약점을 공개한다는 건. 공개한 사람이 악의적인 해커라 생각합니다. 해킹이란 건. 취약점을 찾고 취약점을 이용하는 게 어려울 뿐. 내가 만든 프로그램이 모든 권한을 다 가진 채로 설치, 실행된다면. 누구나 악의적이인 프로그램을 만들 수 있죠.
마소가 대응을 잘했냐 못했냐 따지기 전에. 취약점에 대해 대비를 못했음에도 그걸 공개한 건. 사이버 테러일 뿐입니다
▶ Day 7 Technical Gate 통과: 본인 hand-label 50개 메일 대비 80% 일치. POC.md에 박아둔 첫 bar.
▶ Email + Calendar 흐름 추가: Klorn이 reschedule draft를 만들고 사용자가 approve. "자동 발송 금지"가 invariant test (PR #454)로 코드에 박혀있어, AUTO 안에서도 외부 송신 액션(send_email, create_event)은 절대 자동 실행 안 됨. LOW-risk 내부 액션(classify, mark_read, briefing)만 자동.
▶ Override = GROUP BY, not LLM: 1-click reclassify가 다음 prompt의 ground truth로 들어감.
4만 카페 운영에 월 8천원 ㅠㅠ
Textrue space shading 이나 reprojection/frame warping같은 기술과 아이디어는 비슷해 보입니다.
거대 언어 모델은 자기 자신의 출력물을 과신, 긍정 평가하는 편향이 있습니다. 할루시네이션을 차치하더라도 다중 모델 크로스체킹, 도큐멘테이션 없는 적대적 리뷰 등을 활용하여 검증을 마친 결과만 공개적으로 공유할 것을 권장드립니다. 계속 이러시면 앞으로 유의미한 성과가 있어도 양치기 소년으로밖에 보이지 않을 겁니다.
댓글 중 여러 커뮤니티에 갓 만든 계정으로 글을 남기고 있다는게 보여서 그냥 보여주기식으로 더 보이긴하네요
너무 좋습니다. 실제 정책브리핑에서 밀고 있는 정책이 국가 정책, 법령에서 변하는 걸 실시간으로 ai에게 분석, 결과를 낼 수 있군요.
서너개 프로젝트를 동시에 작업하다가 즉흥적으로 떠오른 문제점이나 개선사항을 에이전트에게 구현 시켜놓다보면 어느새 내가 뭘 시켰는지 조차 기억 안날때가 있죠. 아님 시켜놓고 어떤 이유로 인해 몇 시간 뒤에 돌아와서 보면 컨텍스트가 기억이 안나서 다시 에이전트와의 대화를 뒤적거리기 다반사 입니다ㅎㅎ
시위를 참 욕먹기 좋게 하시네 저 연구원분
😁😁😁 최곱니다
마이크로소프트의 최근 행보에 대해 저도 아쉽게 생각합니다.다만 연구자의 행동도 문제라고 생각합니다.
일반적으로 보안 취약점은 벤더에 제보 후 90일이 지나야 연구자가 공개할 수 있는 관례가 있습니다.
개발자분들은 아시겠지만, 기존 업무에 추가되는 보안 패치는 시간이 걸릴 수밖에 없습니다. 그렇기에 그 기간 동안 위험도와 중요도를 산정해 순서대로 처리할 수 있도록, 관례적으로 90일이라는 공개 유예 시간이 생긴 것입니다.
이렇게 무책임하게 공개해버리는 건 마이크로소프트보다도 실제 사용자들을 무방비한 공격에 노출시키는 행동이라고 생각합니다.
취약점를 알려줬는데도 수정을 안하다니.. 마소 대단하다. 취약점를 이용해서 공격하려고 보호하나 생각마저 드네요. 리눅스로 가고 싶은 생각이 확 커집니다. 수정할 능력이 안되면 도움을 청하는게 맞지. 돈을 지불하기 싫으면 뭇매를 맞아야하고.. 약자행세를 하려하다니
그냥 본인 상황에 맞는 기술을 택하면 되지 않을지 싶은데요. 죽었다기엔 이미 너무 많이 쓰고 있는데, 싶습니다.
사익추구와 공익적인 홍보가 구분 되어야한다. 공익적인 마케팅기법을 사용하면서, 그만큼의 공익적인 책임을 부담하지 않는다면, 사용자를 우롱하는 것이다. Master Bang-i
이런 사태에 당첨될 줄이야..
라이트한 Pro 요금제 사용자입니다.
학원에서 수업듣는데 갑자기 $220 결제가 되서 보니 추가 크레딧이 결제됐더라고요. 그래서 환불 요청을 하려는데 Fin AI Agent가 이미 사용한 크레딧은 환불이 안된다는 소리만 해서 자동 충전을 끄고 지출한도를 0으로 만들고 추가 크레딧 사용을 껐습니다. 그리고 다시 심란한 마음을 가다듬고 수업을 듣는데 또 결제가 일어나네요. 그래서 다시 들어가보니 추가 크레딧 사용이 켜져있고 지출한도는 $2000로 무제한 설정이 되고 있었습니다. 분명히 껐는데 하며 다시 껐거든요? 이번엔 끄고 나서 잠시 후 새로고침을 했더니 켜져있었어요 황당했습니다 그래서 새로고침하고도 다 꺼져있을 때까지 반복했고 다 꺼지는 것을 확인하고도 새로고침을 몇 번이나 했는지 모릅니다. 그런데 또 몇시간 뒤에 결제가 되네요. 그래서 총 $1013.43가 결제 됐습니다. 인간 상담원 요청을 했는데 묵묵부답입니다. 그래서 활성 세션을 전부 삭제하고 카드도 분실신고했네요.. 신용카드를 등록해서 그나마 대응책이 있다고 믿고 있는데, 카드사에서 처리해줄 수 있을지 지켜봐야겠네요. 다른 카드 등록은 절대 안 할 예정입니다. 믿고 맡길 수 있는 서비스가 맞는지 한 번씩 생각해보시기 바랍니다.
이건 진짜 혁명인데요
프로그래밍의 역사가 워크플로우 구현하고 동작 보장하게하고 보상하고의 반복이었는데
그 문제를 해결하는게 나와버리네요
기존 개념이랑 충돌이 있는것도 아니라 진짜 깔끔한 것 같습니다.
전 아마추어입니다. 그냥 제게 필요한 걸 그때마다 적당히 만들어 사용합니다.
애초에 마소는 개발자에게 개발환경(문서 포함)을 엄청 지원해주면서도. 오픈소스 친화적이지는 않았죠.
사티아 나델라가 ceo가 된 이후. 오픈소스 친화적인 행보를 보이면서 더 호감이 생겼구요. 그 중 하나가 wsl이죠.
마소가 현재 ai 쪽에서는 죽쑤고 있다는 건 동의합니다. 깃헙 코파일럿이든 os에 통합된 코파일럿이든요.
어떤 이유로든. 제로데이 취약점에 대한 대비가 없는 상태에서 취약점을 공개한다는 건. 공개한 사람이 악의적인 해커라 생각합니다. 해킹이란 건. 취약점을 찾고 취약점을 이용하는 게 어려울 뿐. 내가 만든 프로그램이 모든 권한을 다 가진 채로 설치, 실행된다면. 누구나 악의적이인 프로그램을 만들 수 있죠.
마소가 대응을 잘했냐 못했냐 따지기 전에. 취약점에 대해 대비를 못했음에도 그걸 공개한 건. 사이버 테러일 뿐입니다
답변 감사합니다 지적해주신바 ai할루시네이션이 맞았습니다 감사합니다 해당 연구내용은 폐기하도록 하겠습니다 관심가져주셔서 감사합니다
AI로 작업한것 같은데 정작 AI한테 분석을 시키면 아무런 기능이 없는 프로그램이라고 하네요
3일 만에 PoC 진전 공유드립니다 — 위 본문은 카피가 좀 부정확해서 정정합니다.
▶ Tier 정정: PoC 진행하면서 5-tier → 4-tier로 좁혔습니다 (PUSH / QUEUE / SILENT / AUTO). Call tier는 빼고 보류.
▶ Day 7 Technical Gate 통과: 본인 hand-label 50개 메일 대비 80% 일치. POC.md에 박아둔 첫 bar.
▶ Email + Calendar 흐름 추가: Klorn이 reschedule draft를 만들고 사용자가 approve. "자동 발송 금지"가 invariant test (PR #454)로 코드에 박혀있어, AUTO 안에서도 외부 송신 액션(send_email, create_event)은 절대 자동 실행 안 됨. LOW-risk 내부 액션(classify, mark_read, briefing)만 자동.
▶ Override = GROUP BY, not LLM: 1-click reclassify가 다음 prompt의 ground truth로 들어감.
60초 walkthrough (Calendar 흐름 + invariant test 메시지 포함):
https://x.com/klornai/status/2060688051920314608
Dev.to 풀 글:
https://dev.to/k08200/…
랜딩에도 데모 영상 박았습니다: https://klorn.ai
피드백 / 반박 / "이렇게 풀면 더 낫다" 다 환영합니다.
그럴듯 해보이지도 않는 코드를 작성해두시고는 이렇게 주장하시면 사기 그 이상도 이하도 아닌데요...
이미 게임 클라이언트가 렌더링을 다 마친 화면을 캡처해서 GPU 연산량을 줄이겠다는 건 말도 안 됩니다.
소스코드도 연산량을 줄일 수 있는 그 어떤 행동도 하지 않고 있습니다.
어떤 AI와 일하시는지 모르겠지만 모델 바꾸셔야 합니다.