최근 triton이나 cuda 이용해서 gpu커널 개발을 좀 하고 있는데, 3.5만해도 제대로 실행되는걸 못보다가 4.5에서는 어느정도 제대로된 코드나 최적화를 해주는게 보이더라구요

쭉 읽다 보니까..... 의외로 DGX SPARK 수요가 있겠구나 라는 생각이 듭니다? 처음에는 그거 가성비 똥망 왜사냐! 라고 생각했었는데,

vpn을 쓰는것보다 bearer token을 설정하고 ssh tunneling을 쓰는게 더 좋을것같은데

개발자 팀원이 아니라 PM이라고 생각하고 병렬로 하면, 얼추 맞긴 하더라고요.

background, border, outline, appearance, -webkit-appearance, cursor
덮어씌워야하는 기본 스타일시트가 너무 많아요ㅠㅠ

ML, Web에서 잘 쓰고 있는데 uv가 얼른 지루한 기술이 되길 기대합니다ㅎㅎ

카프카 느린데...

우리나라 관공서 사이트는 <a> 많이 사용하던데...

LLM 셀프호스팅 시작은 앞으로 5년 동안은 선투자 비용이 커서 수지타산이 맞지 않는 상태가 지속될 거라 생각합니다. 3~5년 후에 코드 자동완성 한정으로 적당히 빠른 하드웨어가 나와서 가격 메리트가 생겼을 때 다시 고민해볼 예정입니다

검토한 구성들

  1. 올인원 구성: 업무장비에서 LLM 구동 불가합니다. 개발툴, 브라우저 기반 앱들 돌리기에도 램이 모자랍니다
  2. LLM 전용 머신 구성: 회사에선 그래픽카드가 없어서 구동 불가합니다. 개인용 PC로도 사양 선투자가 쉽지 않습니다

사내 보안 정책 때문에 외부 LLM API는 전혀 사용하고 있지 않고, 사내 클라우드 관리 부서에서 vllm 기반으로 gpt oss 제공해주시는 것으로 사용 중 입니다.

Armin Ronacher가 언급했듯 검토자의 인지부하가 병목이라 생각합니다. 이미 코딩이나 다른 작업 때문에 바쁜 경우에는 적용할 수 없는 셈이죠 오히려 예상치 못한 품질 저하나 검수시간 소요등 역효과가 날 수도 있다고 생각합니다

개발자에게 AI 활용과 생산성 증대라는 명분으로 멀티태스킹이 보편화될까 우려됩니다

인간의 뇌가 병렬이 아닌데 ㅋㅋㅋ 어차피 검토는 순차적으로 할 거라면 병렬이 그리 큰 의미가 있을 수 없죠

"단어의 통계적 예측 결과임" 이 사실을 인지하는 것만으로도 AI를 어떻게 다룰지 보이는 듯 합니다

뭐만 하면 "man/readme/docs 부터 읽어라" 라는 대답이 나오는데
사실 UX에서 중요한 것은 그냥 써도 바로 사용법을 알 수 있는 것이거든요

뭐 돈 받고 하는 일이 아니니까 넘어가는 거지만 비개발자 사용자의 입장에서 생각해보면 사용 경험이 좋지 않은 것은 사실이죠

그냥 SQLite가 깨질 때까지 SQLite만 쓸래요

국내는 상황이 좀 다르죠
결국 돌고돌아 대세를 선택하는게 현명합니다
개발씬에서 계속 있고 싶다면요 java react python
스스로의 지식적 갈망을 채우고 싶은게 아니라면요

https://news.hada.io/guidelines

Markdown 지원
본문과 댓글에서 모두 지원됩니다.
기본적으로 CommonMark 규약을 따릅니다.
이미지는 지원되지 않습니다.

추가로 GeekNews URL인 경우 링크 제목 앞에 아이콘이 표시되는 것으로 보입니다

제목이요?

[가장 극단적인 Postgresql 추천글](https://news.hada.io/topic?id=16365)  

딱히 큰 기교를 부리지는 않았는데 말이죠.