[GN#193] LLM에 Stable Diffusion Moment가 오고 있다
이번 주는 AI에 있어서 10년 같은 1주였다고 얘기할 정도로 많은 것들이 쏟아져서 어떤 기사를 제목으로 사용할까 엄청나게 고민했는데요. OpenAI의 GPT-4 부터, Meta의 LLaMA를 52K Instruction-Following 데이터로 파인튜닝 한 Alpaca, Google PaLM API, Pytorch 2.0, OpenChatKit, Midjouney v5 등이 발표되었고요. 금요일엔 앞으로 업무환경을 완전히 바꿔줄 Microsoft 365 Copilot 발표까지 이어졌습니다. Django를 만들었던 Simon Willison이 최근 대규모 언어 모델(LLM)의 폭발적인 성장에 대해서 "LLM에 Stable Diffusion Moment가 오고 있다"라는 글을 공개했는데, 이 관점이 IT 업계분들께는 더 큰 영향을 줄 것 같아서 제목으로 뽑아봤습니다.
ㅤ
작년 8월에 오픈소스로 공개된 Stable Diffusion은 생성형 AI에 대한 혁신을 이끌어 내면서, 그 이전에 사람들을 놀라게 했던 MidJouney와 DALL-E를 뛰어넘었습니다. 이게 바로 오픈소스의 힘인데, SD 모먼트가 이제 LLM에도 오고 있습니다. GPT-3 / ChatGPT / GPT-4가 좋기는 하지만 구축과 운영에 엄청나게 큰 비용이 들기도 하고, 모델과 코드가 공개되어 있지 않아서 직접 운영하기도 매우 어렵습니다. 이런 LLM을 유료 API로만 접근해야 한다면 Microsoft같이 기존 수익이 나는 제품들을 가지고 있는 회사들이 아닌 이상 실제 프로덕트에 적용하려면 고민을 해야 합니다. 하지만 페이스북이 공개한 LLaMA는 엄청 작은 사이즈로 누구나 GPT-3.5 수준의 모델을 운영할 수 있게 해주는 데다, 이걸 개인 노트북에서도 실행할 수 있게 만든 llama.cpp가 출시되면서 누구나 쉽게 LLM을 테스트해보고, 그 기반으로 다양한 시도를 해볼 수 있게 되었습니다. 실제로 Simon의 글은 3월 11일 금요일에 공개한 것인데, 3월 14일에는 "Alpaca와 온디바이스 LLM개발의 가속화" 란 글을 통해서 이전 3일간 일어난 일들을 정리했는데요. llama.cpp로 4G 라즈베리 파이에서 실행이 가능해졌고, Dalai 를 통해서 단 2줄 입력만으로 노트북에서 실행되며, 스탠포드가 52k 명령어 셋으로 파인튜닝한 Alpaca를 발표하는 등 실제로 급격한 변화가 발생하기 시작했습니다. 가까운 예로, LLaMA 와 Alpaca는 한국어 데이터셋 학습이 부족해서 실제로 한국어 성능은 낮은데요. 이 LLaMA를 Polyglot-ko 5.8B 한국어 모델로 한 번 더 학습시켜서 한국어 성능을 개선한 KoAlpaca 모델도 공개되었습니다.
ㅤ
이런 언어모델을 개인 장비에서 실행할 수 있게 되면, "프로젝트에 대한 야망/구현 범위가 확장"된다고 생각합니다. 누구나 사이드 프로젝트에도 편하게 언어모델을 붙여서 기능을 고민해 볼 수 있게 되면, 더 다양한 응용 범위가 생길거라 생각됩니다. Microsoft의 365 Copilot은 LLM을 기존 도구에 붙이면 얼마나 생산성이 높아지는지를 극대화해서 보여준 사례일텐데요. 저렇게 큰 것 말고 우리 주위의 작은 것들에도 발전이 있기를 바랍니다.
ㅤ
✓ Show GN - 직접 만드신 오픈소스나, 재직중인 스타트업의 제품/서비스를 소개해주세요
✓ Ask GN - 다양한 질문을 올려주세요.
✓ 사내 커뮤니케이션 도구에 GeekNews Bot을 추가해서 멤버들과 함께 새 글을 받아보세요
ㅤ→ Slack봇, 잔디봇, Teams봇, Discord봇, 구글 챗 봇, Swit 봇
✓ 긱뉴스는 RSS로도 구독 가능합니다
✓ 주위분들께 긱뉴스 위클리 - https://news.hada.io/weekly 뉴스레터를 추천해 주세요.
매주 월요일 아침, 지난 일주일간의 GeekNews 중 엄선한 뉴스들을 이메일로 보내드립니다.
- LLM에 Stable Diffusion Moment가 오고 있다
- OpenAI - GPT-4 발표. ChatGPT Plus에서 GPT-4 모델 선택가능
- Alpaca: GPT-3.5 수준의 강력한 오픈소스 Instruction-Following 모델
- llama.cpp - 페이스북의 LLaMA 모델을 순수 C/C++로 추론하기
- Dalai - LLaMA를 당신의 컴퓨터에서 가장 간단히 실행하는 방법
- Alpaca와 온디바이스 LLM개발의 가속화
- KoAlpaca - 한국어 Alpaca 모델
- Microsoft 365 Copilot 공개 - AI 기반 오피스 도우미
- Rust에서 "& 중심 개발" 극복하기
- Duolingo가 사용자 성장률을 다시 끌어올린 방법
- OpenChatKit 공개 - ChatGPT를 구현 가능한 오픈소스 프로젝트
- 구글 PaLM API와 메이커 스위트 발표
- Midjourney v5 - 더 사실적인 이미지와 5개의 손가락
- 돈을 전혀 벌지 못하는 사이드 프로젝트를 소개해주세요
- Protomaps - Serverless 지도를 오픈소스로 공개
- GPT-4가 프로그래밍 언어를 설계했어요
- CSS Media Query 완벽 가이드
- Highlight - 세션 리플레이 가능한 모니터링 플랫폼 오픈소스
- pgrok - Poor man's ngrok
- DEVIEW 2023 발표영상 공개
- Arm, Arm ARM, Armv9, ARM9, ARM64, Aarch64, A64, A78,.. 구분하기
- 브라우저 탭 변경시에 favicon 교체하기
- Secretive - SSH 키를 맥의 Secure Enclave에 저장하는 앱
- Web Stable Diffusion - 웹 브라우저에서 SD 실행하기
- MagicPrompt-Stable-Diffusion - SD용 프롬프트 생성기
- 이제 ChatGPT가 데이터베이스의 버그를 찾고 있습니다
- Plato - SQL DB를 위한 Airtable
- GPT-4로 교육경험을 향상시킨 Duolingo Max 발표
- Impromptu - GPT-4로 작성한 첫번째 책
- tsai - 시계열 및 시퀀스를 위한 오픈소스 딥러닝 라이브러리
- 기업의 ChatGPT 활용 전략
- PyTorch 2.0 릴리즈
- Flux Keyboard - HD 디스플레이와 Maglev 스위치의 결합
- Announcing TypeScript 5.0
- Mountpoint - Amazon S3용 고성능 파일 클라이언트
- 아이폰의 LiDAR센서로 항공 이미지 생성하기
- LLaMA-rs - Rust로 구현한 LLaMA
- 사회적 가치 도입을 위한 제안 : 언어 모델로 일관성 있게 추론 가능한 의지를 구축하기 [번역]
- 생성 AI 기반 새로운 컨슈머 서비스들의 세계