[GN#217] LLM 기반의 시스템 & 제품 구축 패턴들
상용 LLM이 인기를 끌고, 그 성능에 준하는 오픈소스 LLM 들이 쏟아져 나오면서 LLM 기반의 다양한 서비스가 만들어지고 있습니다. "LLM 기반의 시스템 & 제품 구축 패턴들"은 LLM을 이용하여 시스템을 구축하는 7가지 핵심 패턴을 "성능 향상 vs. 비용/리스크 감소" 및 "데이터 친화 vs 사용자 친화" 기준으로 정리하는 글입니다. 모델의 성능을 측정하는 Evals, 최신/외부 지식을 추가하는 RAG, 특정 작업을 잘 수행하기 위한 Fine-tuning, 레이턴시 및 비용 감소를 위한 Caching, 출력 품질 보장을 위한 Guardrails, 오류를 예측하고 관리하기 위한 Defensive UX, 데이터 플라이 휠 구축을 위한 Collect User Feedback 등에 대해서 상세한 설명과 함께 추가 링크들까지 제공합니다. LLM 기반 앱을 개발하신다면 참고하시기 바랍니다.
ㅤ
"스크럼은 암 입니다" 라는 도발적인 제목의 장문 트윗이 지난주에 꽤 화제가 되었습니다. 25년 차 개발자인 Santiago Valdarrama 는 Scrum 만큼 소프트웨어 팀을 쓸모없게 만드는 것은 없다며, 오히려 프로세스가 더 많아지고, 스토리 포인트의 불합리성 등 여러 사례들을 들어서 스크럼이 실제 소프트웨어 개발에 잘 맞지 않는다는 얘기를 합니다. 그리고 "스크럼이 잘 맞지 않는다면 당신이 잘못하고 있어서 그런 것이다"라고 말하면 되니 너무 편리하다는 말과 함께요. 스크럼=애자일은 아니지만, 댓글에 애자일에 대한 실패 사례들과 함께 보시기 바랍니다.
ㅤ
"로딩을 위한 UX 디자인패턴"은 적절한 로딩 화면을 만들기 위해 고려해야 할 사항부터, 보여주는 양/빈도/소요시간별로 구현해야 하는 방식들을 정리해서 사용자 경험을 향상시킬 수 있는 방법을 소개합니다. 특히나 소요시간 부분에서는 0.1초 이하, 0.1-1초, 1초 이상, 2-10초, 10초 이상 등으로 세분화해서 예제와 함께 설명하고 있어서 공부가 많이 됩니다.
ㅤ
인터넷에서 스트리밍이 일반화되면서 미디어들은 다운로드를 하지 않게 되었는데요. "젊은이들에게 드리는 한 마디: 사랑하는 것들을 다운로드 받아두세요" 글은 인터넷에 있는 것은 영원하지 않으므로 yt-dlp 같은 도구를 이용하여 저장해 두라는 조언을 합니다. 일부 공감하기도 하고, 많은 분이 댓글을 달아주셔서 흥미롭게 본 기사였습니다.
ㅤ
지난주에 긱뉴스에서 가장 댓글이 많이 달린 기사 중 하나는 "Fortran - 고성능 병렬 프로그래밍 언어" 인데요. 1957년에 만들어진 과학 계산용 언어 Fortran이 계속 발전하고 있으며, Natively Parallel한 언어적 특성 때문에 최근의 멀티코어/클라우드 환경에 적합하여 꽤 많이 쓰이고 있다고 합니다. 전산학개론의 프로그래밍 언어 역사 부분에서나 잠깐 언급될 만한 언어지만, 아직도 명맥을 유지하고 발전시키고 있다는 게 흥미롭습니다.
ㅤ
✓ Show GN - 직접 만드신 오픈소스나, 재직중인 스타트업의 제품/서비스를 소개해주세요
- 서브폰에서 메인폰으로 푸시를 전달 해주는 Notina
- 틸노트 썸 - ChatGPT로 한방에 요약해 주는 크롬 확장앱
- 누군가의 얼굴에 미소를 짓습니다. 사람들에게 영감을 주기 위해 예술과 인용구를 사용한다고 주장하는 앱
- "QR 코드 스네이크 게임"을 80바이트 어셈블리에 맞추었습니다.
✓ Ask GN - 다양한 질문을 올려주세요.
✓ 사내 커뮤니케이션 도구에 GeekNews Bot을 추가해서 멤버들과 함께 새 글을 받아보세요
ㅤ→ Slack봇, 잔디봇, Teams봇, Discord봇, 구글 챗 봇, Swit 봇
✓ 긱뉴스는 RSS로도 구독 가능합니다
✓ 주위분들께 긱뉴스 위클리 - https://news.hada.io/weekly 뉴스레터를 추천해 주세요.
매주 월요일 아침, 지난 일주일간의 GeekNews 중 엄선한 뉴스들을 이메일로 보내드립니다.
- LLM 기반의 시스템 & 제품 구축 패턴들
- 스크럼은 암 입니다
- 로딩을 위한 UX 디자인 패턴
- 젊은이들에게 드리는 한 마디: 사랑하는 것들을 다운로드 받아두세요
- Fortran - 고성능 병렬 프로그래밍 언어
- 웹 개발을 위해 꼭 알아야하는 보안 공격
- DevTools Tips - 브라우저 개발자 도구용 팁들 모음
- Web LLM - Llama2 7B/13B 지원 시작
- 소프트웨어 엔지니어가 알아야 할 로그에 대한 모든 것 | Apache Kafka 탄생 배경
- Fomos - Rust로 제작된 실험적인 OS
- Onboard - GitHub Repo 설명해주는 AI
- ChatGPT로 완성하는 쿠팡 크롤링 봇
- Alexandria - 미니멀한 크로스플랫폼 전자책 리더 오픈소스
- Microsoft LIDA - LLM을 이용한 시각화/인포그래픽 자동 생성
- ISP는 온라인 발언이 아무리 끔찍하더라도 이를 단속해서는 안 됩니다.
- ChatGPT로 DevOps 워크플로 개선하는 방법
- OpenAI의 GPT 모범 사례: 개요. 더 나은 답변을 얻기 위한 6가지 프롬프트 작성 전략
- FreeBSD, 이제 AWS Firecracker에서 25ms 만에 부팅 가능
- Llama2가 요약에 있어 GPT-4만큼 정확하며 30배 더 저렴
- AWS, 맥용 터미널 확장도구 Fig 인수
- Comic-Factory - 디퓨전 모델을 이용하여 만화를 생성해주는 도구
- Elixir가 Pinterest의 서버 비용을 년간 $2M(26억원) 절감
- ChatGPT 엔터프라이즈를 소개합니다.
- PythonMonkey - SpiderMonkey를 Python VM에 임베드
- Google Deepmind, 인간이 식별 불가능하고 삭제도 할 수 없는 AI 이미지용 워터마크 SynthID 개발
- PHP-Tokio - Async Rust 라이브러리를 PHP에서 사용하기
- 글꼴은 어디서 왔을까? 대부분 이 회사 "Monotype" 에서