[GN#252] 2024년 AI 스타트업을 위한 데이터 수집 전략
작년에 이어서 올해, 그리고 앞으로 한동안은 AI가 업계의 화두일 것 같습니다. 생성형 AI 제품들이 소비자들에게 점점 익숙해지는데, 스타트업들은 AI 제품에서 어떻게 차별화를 가져가야 할까요? 가장 중요한 것 중 하나가 데이터 수집인데요. 남들보다 뛰어난 AI 제품을 위해서는 그 기반이 되는 데이터를 잘 수집해야 할 텐데 스타트업에게는 여기서부터 어려움이 있기 때문입니다. "2024년 AI 스타트업을 위한 데이터 수집 전략" 글에서는 스타트업들이 어떻게 좋은 데이터를 수집할 수 있는지를 여러 방면으로 정리하고 있는데요. 대규모 생성형 모델을 통한 합성 데이터 생성, 데이터 레이블링 플랫폼 활용, 유용한 개방형 데이터셋 리소스들, 시뮬레이션 환경 구축을 통한 데이터 생성, 데이터 스크래핑 방법의 발전, 저작권 과 라이선싱 까지 폭 넓게 이야기하고 있으니 참고하시기 바랍니다.
ㅤ
지난주 위클리 주제였던 "당신이 기술 코파운더를 찾을 수 없는 이유" 글이 꽤 인기였는데요. 그 글과 관련해서 "당신이 바로, 당신이 찾던 기술 코파운더에요" 라는 제목의 글이 보여서 연재처럼 이어가 봅니다. 외부에서 개발자를 힘들게 구하는 것 보다, 먼저 본인이 어느 정도 엔지니어링 역량을 가지도록 해야 한다는 얘기인데요. 전체 시스템을 만들 수 있는 소프트웨어 엔지니어가 되진 못하더라도, 적어도 MVP 수준까지는 직접 만들어 볼 수 있게 배움에 대해 열려 있어야 한다고 조언합니다. "엔지니어와 비엔지니어의 유일한 실제 차이점은 전자가 엔지니어가 되는 법을 배우는 데 시간을 할애했다는 것"이라는 말과 함께요.
ㅤ
요즘 해외 스타트업의 앱/서비스 기능 소개 영상을 보면 굉장히 스타일리시해서 어떤 것으로 만드나 궁금했는데, "멋져 보이는 스타트업 데모는 어떻게 만드나요?" 라는 질문에 답변들이 꽤 많이 달려서 정리해 봤습니다. 그중에서 ScreenStudio가 정말 좋네요. macOS 전용 스크린 레코더로 다양한 디자인 패턴이 내장되어 있어서 편집 기술 없이도 훌륭한 영상을 만들 수 있는데요. 자동 줌, 버티컬 모드, 사용자 웹캠/마이크 추가, 아이폰/아이패드 화면 녹화등 정말 다양한 기능을 제공하는데 구독이 아닌 1회 구입 방식이라 더 좋네요. 그리고 ARCADE는 제품 화면을 녹화해서 인터랙티브 한 데모를 만들어주는 도구인데요. 제품 소개 및 온보딩용 데모를 녹화영상만 가지고 금방 만들 수 있게 해줍니다. 재미난 것은 해커뉴스 댓글에 ARCADE CEO가 등장해서 곧 출시되는 업데이트 버전에서는 ScreenStudio 영상을 가져와서 편집할 수 있다고 홍보한 것인데요. 이런 방식의 협업이 국내에서도 많이 일어나면 좋겠습니다.
ㅤ
✓ Feedback : 긱뉴스 위클리 어떻게 읽고 계신가요? 의견과 제안 부탁드려요
ㅤ
✓ Show GN - 직접 만드신 오픈소스나, 재직중인 스타트업의 제품/서비스를 소개해주세요
✓ Ask GN - 다양한 질문을 올려주세요.
- 구인 공고 - 멤버를 찾고 계신가요? (2024년 2분기) - 분기별로 한번씩 올라오는 구인공고입니다.
- 이번 주말에 뭐 하시나요?
✓ 사내 커뮤니케이션 도구에 GeekNews Bot을 추가해서 멤버들과 함께 새 글을 받아보세요
ㅤ→ Slack봇, 잔디봇, Teams봇, Discord봇, 구글 챗 봇, Swit 봇
✓ 긱뉴스는 RSS로도 구독 가능합니다
✓ 주위분들께 긱뉴스 위클리 - https://news.hada.io/weekly 뉴스레터를 추천해 주세요.
매주 월요일 아침, 지난 일주일간의 GeekNews 중 엄선한 뉴스들을 이메일로 보내드립니다.
- 2024년 AI 스타트업을 위한 데이터 수집 전략
- 당신이 바로, 당신이 찾던 기술 코파운더에요
- Ask HN: 멋져 보이는 스타트업 데모는 어떻게 만드나요?
- "제2의 기회"라는 미신
- OpenVoice v2 - 다재다능한 인스턴트 음성 복제
- Freeter - 모두를 위한 오거나이저 앱 오픈소스
- Pyinfra: 파이썬을 활용한 인프라 자동화 도구
- Y Combinator 없이 미국 진출하기 (feat. Techstars)
- Cria - Python으로 간단히 LLM 구동하기
- 인증서 문제로 인한 cdn.jsdelivr.net 접속 불능 사태
- SSH를 통해서 커피를 판매하는 새로운 스타트업
- 기술 문서 번역용 GPT 프롬프트 작성 방법
- Fluent - 자연스러운 번역을 위한 로컬라이제이션 시스템
- Run0 - sudo를 대체하는 systemd 기반 도구 발표
- Meta Llama 3 발표후, 첫 일주일간 생긴 일
- Captable - 스타트업을 위한 지분 관리 플랫폼 오픈소스 (Carta/Pulley의 대체제)
- CSS Grid로 악보 출력 하기
- GitHub Copilot Workspace 기술 시험판 공개
- Penpot 2.0 - Figma의 오픈소스 대체제
- MSA 환경의 수많은 API 문서 자동으로 통합하기
- 구글이 더 저렴한 인건비를 위해 자체 파이썬 팀을 해고
- Ubuntu 24.04 Noble Numbat 출시
- 모든 중국 지도의 오류
- BASIC 프로그래밍 언어 60주년
- Ozempic, 담배ㆍ제과ㆍ주류 산업 위협하는 게임 체인저
- Ollama v0.1.33 - Llama 3 + Phi 3 + Qwen 110B 지원
- 유럽에 드리는 당부의 말, "제발 깨어나시길"
- EU, "애플은 6개월 내에 iPadOS에 사이드로딩 허용하라" 요구
- 리튬 불포함 소듐(Sodium) 배터리, 실험실을 나와서 미국에서 생산 돌입
- SQLite가 Bytecode를 사용하는 이유
- JSON Path 사용법
- Claude, iOS용 앱 공개