제가 일하는 분야도 그 정도로 극단적인 정도의 분야는 아니긴 한데, AI 분야에서 연구 및 개발하고 있습니다.
일반적으로 많이 사용하는 프레임 워크 외에도 실제 모델을 디플로이하는 타겟 환경이 학습했던 환경과 다른 경우도 있고.
특정 오퍼레이션들이 지원하지 않는다거나 그래서 커스텀 오퍼레이션을 플랫폼별로 만들어야 하는 경우도 있습니다. 이 경우 개발한 환경에서 바로 테스트할 수가 없는 경우도 많습니다.
모델을 직접 모델링하는 경우도 있는데, 특정 데이터를 가지고 테스트 코드를 짤 수 있지만, 데이터셋에 따라서 확률적으로 값들이 변화하고, 특정 시점에 값들이 폭발하거나 하는 현상은 테스트 코드로 커버하기 어렵더라고요.
아마 저보다 더 테스트가 어려운 환경들이 꽤 있지 않을까 싶긴합니다.
SQLite의 접근이 정말 인상적이네요. 코드 590배에 달하는 테스트 스위트를 비공개로 유지한다는 건, 결국 "소프트웨어의 진짜 가치는 동작 명세에 있다"는 뜻이니까요.
실제로 요즘 AI 코딩 도구로 프로젝트를 만들어보면, 기존 프로젝트의 README + API 문서 + 테스트 코드만 있으면 핵심 기능을 놀라울 정도로 빠르게 복제할 수 있습니다. 직접 7개 프로젝트를 운영하면서 느낀 건데, 테스트가 잘 되어있는 프로젝트일수록 역설적으로 복제하기도 쉽더라고요.
다만 Cloudflare vs Vercel 사례에서 간과된 부분이 있는데, "복제"와 "운영"은 완전히 다른 문제입니다. Next.js의 엣지 케이스, 플러그인 생태계, 커뮤니티 의존성까지 재현하려면 테스트 코드만으로는 부족하죠. 결국 해자는 테스트 코드 + 커뮤니티 + 운영 노하우의 조합이 아닐까 싶습니다.
사람도 랜덤하게 고르는 것을 잘 못합니다. 패턴이 없어야 하는데 패턴을 일부러 피하는 것도 패턴으로 볼 수 있기 때문이죠.
실제 토큰 사용량을 단일 작업에 대해서 측정한 결과가 없고 단순히 magpie를 사용하면 재시도가 이정도로 줄 것이다 라는 추측이군요.
Compilation Time 비교가 이상하네요. ms/token을 왜 비교하죠?
관련한 내용 타임라인 정리가 필요할것 같습니다. OpenAI는 계약 협상이 진행중이었다는 말도 있는데요?
항상 잘 보고 있습니다, 감사합니다.
음모론이긴 한데, 학생분들이 올리시는 show gn은 유독 적은 댓글 혹은 단순한 댓글에다가 금방 높은 포인트를 받고 메인에 올라오는 느낌이에요.
디자인은 진짜 엄청 이뻐서 마음에 드네요~
x가 크롤링하기 좀 난감해져서 그런경우가 있는듯 합니다. 개선해보겠습니다
내용 없음이라는 요약 오류는 처음이군요..
제가 일하는 분야도 그 정도로 극단적인 정도의 분야는 아니긴 한데, AI 분야에서 연구 및 개발하고 있습니다.
일반적으로 많이 사용하는 프레임 워크 외에도 실제 모델을 디플로이하는 타겟 환경이 학습했던 환경과 다른 경우도 있고.
특정 오퍼레이션들이 지원하지 않는다거나 그래서 커스텀 오퍼레이션을 플랫폼별로 만들어야 하는 경우도 있습니다. 이 경우 개발한 환경에서 바로 테스트할 수가 없는 경우도 많습니다.
모델을 직접 모델링하는 경우도 있는데, 특정 데이터를 가지고 테스트 코드를 짤 수 있지만, 데이터셋에 따라서 확률적으로 값들이 변화하고, 특정 시점에 값들이 폭발하거나 하는 현상은 테스트 코드로 커버하기 어렵더라고요.
아마 저보다 더 테스트가 어려운 환경들이 꽤 있지 않을까 싶긴합니다.
정말 잘만드셨네요. 이름도 기억에 남고 재밌어요! 범용으로도 쓸만한도구같아요.
SQLite의 접근이 정말 인상적이네요. 코드 590배에 달하는 테스트 스위트를 비공개로 유지한다는 건, 결국 "소프트웨어의 진짜 가치는 동작 명세에 있다"는 뜻이니까요.
실제로 요즘 AI 코딩 도구로 프로젝트를 만들어보면, 기존 프로젝트의 README + API 문서 + 테스트 코드만 있으면 핵심 기능을 놀라울 정도로 빠르게 복제할 수 있습니다. 직접 7개 프로젝트를 운영하면서 느낀 건데, 테스트가 잘 되어있는 프로젝트일수록 역설적으로 복제하기도 쉽더라고요.
다만 Cloudflare vs Vercel 사례에서 간과된 부분이 있는데, "복제"와 "운영"은 완전히 다른 문제입니다. Next.js의 엣지 케이스, 플러그인 생태계, 커뮤니티 의존성까지 재현하려면 테스트 코드만으로는 부족하죠. 결국 해자는 테스트 코드 + 커뮤니티 + 운영 노하우의 조합이 아닐까 싶습니다.
이 말씀이 약간 마음을 후벼파는 것 같아요. 개발자 선배들은 QA테스터도 아닐뿐더러
바이브로 만든거면 바이브로 테스트하는게 어떤가 싶기도 하고
이런 디자인을 네오 브루탈리즘 이라고 하더라구요.
알록달록하니 예쁘네요! 디자인은 직접 하신 걸까요? 혹은 레퍼런스 하신게 있으실까요?
멀티 계정 및 어뷰징 등 사용약관 위반으로 차단되었습니다.
신기하네요.
허깅페이스를 써본 사람이 아니라면 뭐 어쩌라는 거지 싶은 생각이 들 정도로 페이지 디자인이 아쉽긴 한데요. <텍스트 보호> 라는 탭을 클릭하면 사용해볼 수 있습니다.
별개로 https://originality.ai/blog/invisible-text-detector-remover 기존에 공개된 "워터마크 제거"툴을 사용하면 쉽게 파훼할 수 있어보입니다.
코드를 동적으로 환경변수에서 가져오긴 하던데 시연 기능은 있더라고요. 애매한듯 합니다.
비공개라서 실행해볼수가 없는 순수 광고(?)인데 그러면 show gn에 올라오면 안 됩니다.
https://news.hada.io/blog/show
저는 이걸 좀 발전시켜서 한번 작성된 경험이 다시 재발했을 때 패턴화하고 일반화해서 진화(evolve)가 잘 되도록 더 확장해 볼 생각입니다.
Wow