[GN#265] AI 스타트업들에게: 곡괭이와 삽을 팔지 말고, 직접 캐세요

2024-07-29 ~ 2024-08-04 사이의 주요 뉴스들

시장의 변화를 반영하듯 많은 스타트업이 AI를 기반으로 창업하고 있습니다. AI 모델 자체는 빅테크들이 앞다투어 천문학적인 비용을 쏟아붓고 있으니, 많은 스타트업들은 응용 AI 분야를 공략하게 되는데요. 이런 아이템들은 파운데이션 모델 회사들이 기능을 확장하거나, 기존서비스들이 AI 기능을 탑재함으로 인해 양쪽에서 공격받는 상황이 나올 수 있습니다. 그러다 보니 AI 스타트업들은 AI 기반의 서비스를 위한 도구를 만드는 기존 SaaS 모델의 플레이북을 답습하고 있는데요. "AI 스타트업들에게: 곡괭이와 삽을 팔지 말고, 직접 캐세요" 글에서는 이 전략은 새로운 AI 시대에 적용하기 어렵다고 주장합니다. 즉, AI 도구를 핵심으로 하지만 버티컬에 특화된 "AI 기반 풀스택 스타트업"을 구축해 보라고 제안하는데요. 기존 기업들이 AI를 채택하는 것은 느릴 수 있으니 이를 파고드는 것도 하나의 기회가 될 수 있을 것입니다.

창의성은 어디서 나오는 걸까요? 매우 창의적인 사람들은 아무런 기반 없이도 새로운 것들을 쏟아내는 걸까요? "창의성의 근본은 암기에서 비롯되는가?" 글은 창의성을 발휘하기 위해서는 암기를 통한 시스템을 구축해야 한다고 이야기합니다. 창의성은 "내면화된 개념을 연결하는 영감의 순간"에서 비롯되므로 다양한 개념들을 이해하고 있어야 새로운 것을 만들어 내는 것이 가능해지며, 그래서 더 많은 것들을 빠르게 배우는 시스템을 구축하여 빠르게 학습하고 깊이 이해하는 것을 반복함으로써 많은 영역에서 자율성을 가지게 되면 더욱 창의적이 될 수 있다고 주장합니다. 단순히 암기하는게 아니라 내재화시키고 이를 자유자재로 연결할 수 있도록 해야 창의성을 발휘하기 위한 기본 시스템이 만들어진다고 이해하면 되겠네요.

2년 전에 1인 SaaS인 Healthchecks․io의 기술 스택을 소개하는 글을 한번 올렸었는데요. 운영 9주년을 기념하는 회고 글이 새로 올라왔네요. 아직도 여전히 1인이 운영하며, 현재 652명의 유료 고객을 보유하고 있고, 월간 반복 수익(MRR)은 $14,043이어서 라이프스타일 비즈니스가 되었다고 합니다. 무료 플랜의 리밋을 줄이거나 유료 플랜의 가격을 인상할 생각도 없고, 뭔가 요구가 많은 엔터프라이즈 고객도 받지 않을 예정이라고 하네요. 그 추가 수익이 큰 차이를 만들지 않고 더 바쁘고 짜증만 늘어날 것이라고요. 1인 SaaS로 오래 운영하기 위해서는 좋은 마음가짐이라고 생각합니다. 국내에도 이런 단계에 이른 서비스들이 많아지길 기원합니다.

Feedback : 긱뉴스 위클리 어떻게 읽고 계신가요? 의견과 제안 부탁드려요

Show GN - 직접 만드신 오픈소스나, 재직중인 스타트업의 제품/서비스를 소개해주세요.

Ask GN - 다양한 질문을 올려주세요.


매주 월요일 아침, 지난 일주일간의 GeekNews 중 엄선한 뉴스들을 이메일로 보내드립니다.


  • AI 스타트업들에게: 곡괭이와 삽을 팔지 말고, 직접 캐세요

    새로운 AI시대에 스타트업 창업자들은 도구를 판매하는 대신 AI를 활용한 풀스택 솔루션을 직접 제공해야 합니다. 기존 기업들이 AI 도입에 어려움을 겪는 동안, 새로운 AI 기반 서비스 비즈니스는 큰 기회를 가질 수 있습니다. AI 기술을 활용하면 적은 인력으로도 높은 마진을 달성할 수 있고, 풀스택 솔루션은 위험한 베팅이지만 혼잡한 시장에서 501번째 삽을 팔려고 하는 것보다는 덜 위험합니다.

  • 창의성의 근본은 암기에서 비롯되는가?

    창의성은 내면화된 개념을 연결하는 영감의 순간에서 비롯되며, 이를 위해서는 기본적인 지식과 패턴의 암기가 필수적입니다. 암기와 학습 시스템은 창의성을 직접적으로 만들지는 않지만, 창의성을 가능하게 하고 고차원적인 문제에 집중할 수 있게 도와줍니다. 다양한 분야에서 자율성을 갖추고 빠르게 학습하는 시스템을 구축하면 창의적이고 혁신적인 결과를 만들어낼 수 있습니다.

  • 나의 Obsidian 노트 작성 워크플로우

    Obsidian과 Second Brain 시스템을 통해 효율적으로 노트를 작성하고 관리할 수 있으며, 이는 직업, 학업, 생활에 긍정적인 영향을 미칩니다. 작성자는 OneNote에서 Obsidian으로 전환했는데, 개방형 파일 포맷과 생각 기반 검색 기능, 또한, 다양한 플러그인과 템플릿을 활용하여 개인 맞춤형 노트 작성 환경을 구축할 수 있어서 라고 이야기 합니다. 자신이 사용하는 템플릿과 주로 사용하는 플러그인도 소개합니다.

  • 어트리뷰션의 소멸과 클릭의 감소. 마케팅은 다시 20세기로 회귀중

    마케팅 환경이 변화하면서 과거의 클릭 기반 어트리뷰션 방식이 더 이상 효과적이지 않다는 점을 강조합니다. 주요 플랫폼들이 사용자들을 자사 플랫폼에 머물게 하려는 전략을 사용하면서 클릭과 트래픽 추적이 어려워졌습니다. 성공적인 마케팅을 위해서는 청중이 시간을 보내는 다양한 채널을 이해하고, 그들에게 직접적인 영향을 미칠 수 있는 전략을 세우는 것이 중요합니다.

  • LLM 양자화에 대한 비쥬얼 가이드

    대규모 언어 모델(LLM)은 일반 하드웨어에서 실행하기 어려울 정도로 크기 때문에, 양자화(Quantization)를 통해 모델 크기를 줄이는 연구가 활발히 진행되고 있습니다. 양자화는 모델의 매개변수를 낮은 비트 폭으로 줄여 메모리 사용량을 줄이면서도 정확도를 유지하는 기술로, 다양한 방법론과 기술들이 소개됩니다. 특히, GPTQ와 GGUF 같은 최신 양자화 기법들은 GPU와 CPU를 효율적으로 활용하여 성능을 최적화하며, BitNet과 같은 혁신적인 접근법은 모델의 계산 효율성을 극대화합니다.

  • FastHTML – 순수 파이썬으로 현대적 웹 애플리케이션 구현하기

    FastHTML은 순수 Python으로 현대 웹 애플리케이션을 빠르고 쉽게 만들 수 있는 도구로, HTTP, HTML, JS, CSS에 대한 완전한 접근을 제공하여 유연성과 확장성을 보장합니다. 다양한 호스팅 서비스에서 쉽게 배포할 수 있으며, FastAPI와 유사한 직관성과 깨끗한 아키텍처를 제공합니다. React, Next.JS와 같은 프레임워크와 비교했을 때 속도와 사용성 면에서 경쟁력이 있습니다.

  • 9년간 운영된 1인 SaaS
  • Embedding.io - 모든 웹사이트를 LLM을 위한 지식창고로 전환하기

    모든 웹사이트를 크롤링, 청크 및 벡터화하여 LLM으로 콘텐츠를 사용할 수 있게 해줍니다. API를 통해 컬렉션 생성과 페이지 추가 후 즉시 쿼리가 가능합니다. 무료 버전은 월간 1000페이지까지 지원합니다.

  • Ask HN: FAANG 수준 연봉을 받으면서 다른 곳에서 일하는게 가능한가요?

    FAANG 수준의 연봉을 받기 위해서는 사업을 시작하거나 특정 전문 분야에 특화되는 것이 좋습니다. 당연한 이야기이긴 하지만, 흥미로운 사례들이 몇 개 보이는 질문 글입니다. 국내와는 상황이 많이 다르니 참고만 하세요.

  • SQLite의 트랜잭션

    SQLite는 개발자의 의도와 달리 최근 서버 프로세스의 백엔드 용도로 인기를 끌고 있습니다. SQLite는 엄격한 SERIALIZABLE 트랜잭션을 제공하여 데이터 일관성을 보장하며, 다양한 트랜잭션 모드를 통해 개발자에게 유연성을 제공합니다. SQLite가 제공하는 IMMEDIATE, EXCLUSIVE, DEFERRED 등에 대해 설명하며, 실험적 기능인 CONCURRENT 모드는 여러 쓰기 트랜잭션을 동시에 처리할 수 있어 성능 향상을 기대할 수 있습니다.

  • Floating UI - 툴팁/팝업/드롭다운 포지셔닝 라이브러리

    이 자바스크립트 라이브러리는 모든 플로팅 요소를 배치하고 인터랙션을 생성하는 데 유용하며, Smart Anchor 포지셔닝을 통해 다른 요소와의 충돌을 피하면서 시야에 유지됩니다. React 인터랙션을 통해 툴팁, 팝오버, 셀렉트 메뉴 등 다양한 플로팅 UI를 구축할 수 있습니다. 또한, Tree-shakeable 및 Platform-agnostic 특성으로 다양한 플랫폼과 호환됩니다.

  • SAML에 대한 간단한 소개

    SAML은 XML 형식의 보안 메시지를 교환하기 위한 표준으로, 시스템 간 복잡한 통합 작업을 단순화합니다. 주로 Single Sign-On(SSO)에 사용되며, 사용자가 중앙 집중식 시스템에 인증한 후 다양한 애플리케이션에 접근할 수 있게 합니다. SAML 기반 로그인을 직접 구현하는 것은 복잡할 수 있으므로, 오픈소스 도구인 SSOReady를 활용하면 시간을 절약할 수 있습니다.

  • rrweb - 웹용 레코드 & 리플레이 디버거

    rrweb은 사용자 인터랙션을 녹화하고 재생할 수 있는 도구로, 웹 디버깅에 유용합니다. 이 도구는 스냅샷과 리빌드, 레코드와 리플레이, 그리고 플레이어 UI로 구성되어 있어 다양한 디버깅 상황에 대응할 수 있습니다. 특히, DOM의 모든 변화를 기록하고 재생할 수 있어 문제 해결에 큰 도움이 됩니다.

  • 디버깅 원칙

    디버깅은 개발자의 필수 역량으로, 문제 해결을 위한 네 가지 단계(의심하기, 분류하기, 학습하기, 연결하기)를 통해 효율적으로 접근할 수 있습니다. 이 글은 디버깅 과정에서 직관을 활용하는 방법과 나만의 디버깅 원칙을 세우는 데 도움이 되는 유용한 팁을 제공합니다.

  • Swift, Homomorphic Encryption(동형 암호화) 패키지 공개

    Swift의 새로운 오픈소스 패키지 swift-homomorphic-encryption은 데이터를 복호화하지 않고도 연산할 수 있는 동형 암호화 기술을 제공합니다. 이 패키지는 클라우드 서비스에서 사용자 데이터의 프라이버시와 보안을 보호하며, Apple의 iOS 18 기능인 Live Caller ID Lookup에 적용되어 실용성을 입증했습니다.

  • Mem0 - 개인화 AI를 위한 Long-Term 메모리

    Mem0는 LLM을 위한 Self-improving 메모리 레이어를 제공하여 개인화된 AI 환경을 구현합니다. 다단계 메모리와 적응형 개인화를 통해 사용자 경험을 지속적으로 개선하며, 개발자 친화적 API로 다양한 애플리케이션에 쉽게 통합할 수 있습니다. 또한, 크로스 플랫폼 일관성과 관리형 서비스로 모든 기기에서 일관된 동작과 번거로움 없는 호스팅 솔루션을 제공합니다.

  • StreamPot - ffmpeg 을 API로 만들기

    StreamPot은 fluent-ffmpeg와 호환되며 큐 및 S3를 이용하는 FFmpeg API 오픈소스입니다. 이 API는 비디오 자르기, 오디오 제거, mp4를 webp로 트랜스코딩 등 다양한 미디어 변환 작업을 지원합니다. 또한 셀프호스팅과 Hosted 버전을 제공하여 환경에 맞게 유연한 사용이 가능합니다.

  • ky - 작고 우아한 Fetch API 기반 Javascript HTTP Client

    ky는 최신 브라우저와 Node.js/Bun/Deno에서 사용할 수 있는 간단하고 우아한 Fetch API 기반의 Javascript HTTP 클라이언트입니다. 이 클라이언트는 더 간단한 API, 실패한 요청 재시도, 타임아웃 지원 등 fetch보다 개선된 기능을 제공합니다. 또한, TypeScript와의 호환성을 통해 더욱 안전하고 효율적인 코딩이 가능합니다.

  • Yelp, 내 앱이 10년간 사용하던 API에 단 4일 기간만 주고 비활성화

    Yelp API의 갑작스러운 유료화 전환으로 인해 앱 개발자가 겪는 어려움을 토로한 글입니다. 서드파티 API에 의존하는 앱 개발의 위험성을 강조하며, 지속적인 서비스 접근이 필요한 앱의 경우 구독 모델이 더 적합할 수 있음을 시사합니다. 비슷한 기능을 제공하는 다른 API로는 Google Places가 있지만, Yelp API만큼 포괄적이지 않다는 점도 언급됩니다. 특정 API에만 종속되는 서비스의 위험도를 알 수 있는 글이네요. 특히나 무료라면 더더욱요.

  • 넷플릭스 게임의 두 번째 시즌: 도전, 변화, 그리고 앞으로의 길

    넷플릭스는 게임 산업에 진출하며 10억 달러를 투자해 100개 이상의 게임을 출시하고 여러 게임 스튜디오를 인수했지만, 아직 업계 최고의 비디오 게임 서비스로 자리 잡지 못했습니다. Apple Arcade와의 비교에서 콘텐츠의 질, 수익화 모델, 유통 채널 등 여러 면에서 부족함이 드러났으며, 새로운 리더십 하에 전략적 개편이 필요합니다. 넷플릭스 게임의 성공을 위해서는 상품-시장 적합성, 투자 수익률, 사업 타당성 등의 문제를 해결하고, 더 나은 품질의 게임을 제공하는 방향으로 나아가야 합니다. 전 솔직히 넷플릭스가 이상한 방향을 잡았다고 생각합니다. 돈만 엄청 들이고 포기하게 되지 않을까요?

  • 사용자 위치정보(User Location)를 믿지마세요

    사용자 위치 정보를 신뢰할 수 없는 이유와 다양한 위치 추적 방법의 한계를 설명하는 글입니다. 위치 정보를 활용한 다양한 애플리케이션 시나리오와 그에 따른 해결책을 제시하므로 위치 정보를 활용하는 서비스를 고려하는 분들은 꼭 읽어 보세요.

  • Torchchat - LLM과 대화를 어디에서나 가능하게

    Torchchat는 PyTorch LLM을 로컬 환경에서 실행할 수 있게 해주는 소형 코드 베이스로, 서버, 데스크톱, 모바일 등 다양한 플랫폼에서 사용할 수 있습니다. Llama 3/2, Mistral 등 인기 있는 LLM과의 커맨드 라인 인터랙션을 제공하며, 다양한 하드웨어 및 운영체제를 지원합니다. 또한, 다양한 데이터 유형과 양자화 스킴을 지원하여 유연한 사용이 가능합니다.

  • OpenAI, 보이스 모드를 일부 ChatGPT Plus 사용자들에게 배포 시작

    OpenAI의 고급 음성 모드는 자연스러운 실시간 대화와 감정 인식을 제공하며, 사용자의 개인정보 보호를 위해 미리 설정된 목소리만 사용하도록 설계되었습니다. 이번 알파 버전 테스트는 45개 언어에 걸쳐 100명 이상의 외부 레드팀원과 함께 진행되었으며, 가을에는 모든 ChatGPT Plus 사용자가 이용할 수 있도록 확대될 예정입니다. 댓글에 국내 사용자 분도 열렸다고 하네요.

  • LG와 삼성은 TV 화면을 사라지게 만들고 있다

    LG와 삼성은 CES 2024에서 투명 디스플레이 기술을 선보이며 많은 관심을 끌었습니다. 이 기술은 미래지향적이지만 높은 가격과 실용성 문제로 인해 당분간 대중화되기 어려울 것으로 보입니다. 투명 디스플레이는 주로 산업 현장, 상업 공간, 자동차와 같은 특수 목적에 먼저 도입될 가능성이 높습니다.

  • SAM 2: 이미지와 비디오를 위한 Segment Anything

    Segment Anything Model 2는 이미지와 비디오에서 프롬프트로 객체를 분할해주는 혁신적인 모델입니다. 다양한 작업과 도메인에서 강력한 성능을 제공합니다. 또한, 50,583개의 동영상과 642,036개의 고품질 시공간 분할 마스크로 구성된 Segment Anything Video 데이터셋을 공개하였습니다.

  • Claude로 코드리뷰 경험 개선하기

    Claude를 활용한 코드리뷰는 기능적 문제를 AI에게 맡겨 감정적 문제에 더 집중할 수 있게 해줍니다. XML 태그를 사용해 Claude 프롬프트의 정확도를 높여 코드리뷰의 효율성을 극대화할 수 있습니다. 이를 통해 확보된 시간을 팀 관리와 소통에 투자하여 전반적인 생산성을 향상시킬 수 있습니다.

  • glhf - (거의) 모든 언어 모델 실행하기

    vLLM과 오토스케일링 GPU 스케줄러를 사용하여 다양한 오픈소스 대규모 언어 모델을 쉽게 실행해주는 서비스입니다. 허깅 페이스 리포지토리 링크를 붙여넣기만 하면 별다른 설정 없이 동작하며, 최대 8개의 Nvidia A100 80Gb GPU를 사용할 수 있습니다. 베타 기간 동안 무료로 제공되며, 이후에도 주요 클라우드 GPU 가격보다 저렴하게 이용할 수 있습니다. Llama 405B 모델을 돌릴 수 있다고 해서 화제입니다.

  • Flux - 12B 파라미터 오픈소스 Text-To-Image 모델

    Stable Diffusion을 개발한 오리지널 팀이 있는 Black Forest Labs에서 개발한 Flux는 12B 파라미터를 가진 오픈소스 텍스트-이미지 모델로, 창의성과 성능의 경계를 확장하여 Midjourney 수준의 고해상도와 현실적인 이미지를 생성할 수 있습니다. 다양한 변형 모델을 통해 사용자 맞춤형 솔루션을 제공하며, 특히 빠른 처리 속도와 높은 품질을 유지하는 fal 추론 엔진을 통합하여 효율성을 극대화했습니다.

  • 구글 딥마인드 논문의 비용 계산 해보기

    구글 딥마인드의 최신 논문 "Scaling Exponents Across Parameterizations and Optimizers"는 다양한 환경에서 최적의 하이퍼파라미터를 도출하기 위해 10,000회 이상의 LLM 트레이닝을 수행한 결과를 담고 있습니다. 이 논문을 재현하는 데 필요한 총 연산량을 추산해보니 총 필요 FLOPS는 5.42e24 이고, 비용은 $12.9M(178억원) ($3/H100/시간당) 라고 합니다. 논문 하나 쓰는데 170억이 들었다는 것이네요. 물론 자신들의 비용 효율화를 위해서 작업 하다 보니 이런 논문이 나온 것이겠지만, 규모의 차이가 점점 커져서 국내 AI 산업은 어쩌나 하는 생각이 듭니다.


✓ 사내 커뮤니케이션 도구에 GeekNews Bot을 추가해서 멤버들과 함께 새 글을 받아보세요
ㅤ→ Slack봇, 잔디봇, Teams봇, Discord봇, 구글 챗 봇, Swit 봇
긱뉴스는 RSS로도 구독 가능합니다
✓ 주위분들께 긱뉴스 위클리 - https://news.hada.io/weekly 뉴스레터를 추천해 주세요.