내가 바라는 28가지 AI 도구
(sharif.io)- 2025년 9월 현재 Claude Opus 4.1, GPT-5, Nano Banana 등 강력한 AI 모델이 등장하며 소프트웨어 개발의 황금기가 도래
- 현재의 AI 환경을 배경으로, 실제로 존재하지 않지만 있었으면 하는 혁신적 AI 도구 28가지를 제안
- 제안된 아이디어는 개인 생산성, 코드 개발, 헬스케어, 콘텐츠 제작 등 다양한 분야를 포함
- 공통적으로 강조되는 특징은 맥락 인지, 사용자 맞춤화, 자동화된 학습과 피드백 루프를 통한 개선 기능
- 오늘날의 일반적인 에이전트 대신 특화된 단일 목적 AI 에이전트와 이들을 교환할 수 있는 마켓플레이스 개념을 제안
제안된 28가지 AI 도구
1. Nano Banana 기반 카메라 앱
- 평범한 iPhone 사진을 Leica로 촬영한 것처럼 변환하는 앱
2. 라이트/다크 모드 자동 추가 에이전트
- 모든 프론트엔드 프로젝트에 라이트 모드, 다크 모드, 커스텀 테마 지원 자동 추가
- 비전을 사용해 UI 변경 사항을 확인하고 렌더링된 UI 기반으로 반복적 수정
3. 난독화 코드 디컴파일 및 디버그 에이전트
- 미니파이된 코드를 해독 가능한 코드베이스로 디컴파일하고 디버그
- 강력한 코드-디버그 루프 필요
4. Strong 앱과 ChatGPT의 하이브리드
- 모델이 운동 데이터에 접근하여 개선 제안 및 코칭
- 각 세트 사이 시간까지 포함한 상세한 맥락을 알고 있는 모델과 채팅 가능
5. 추천 엔진
- 브라우징 기록을 분석하여 가장 오래 읽은 블로그 글이나 기사 파악
- 매일 밤 웹을 검색해 읽어야 할 콘텐츠를 찾아 아침에 링크 다이제스트 제공
- 좋은/나쁜 추천에 대한 피드백으로 다음 날 다이제스트 개선
6. 칼로리 추적 채팅 앱
- 영양 데이터베이스에 기반한 채팅 앱
- 식사 기록에 필요한 인지적 노력 최소화
7. 긴 형식 콘텐츠 작성용 미니멀 앱
- 모델이 구절을 강조하고 여백에 코멘트 남김
- 다양한 "페르소나"를 설정하여 작성한 내용 검토 가능
8. 전문 AI 에이전트 빌더 에이전트
- "코드 디컴파일 에이전트 만들어줘" 같은 작업 설명을 받으면 초특화 에이전트 자동 생성
9. 미니멀 전자책 리더
- 전자책을 읽으면서 구절을 강조하면 모델이 옆에서 더 깊이 설명
- 저자의 페르소나를 취함
- 별도의 채팅 인스턴스가 아닌 책의 확장처럼 느껴져야 함
10. 며칠간 추론하는 Deep Research 에이전트
- 매우 복잡한 쿼리 제공 가능
- 수백 개의 하위 에이전트를 생성하고 3일간 추론 후 응답 반환
11. 페인트 바이 넘버 영화 제작 앱
- 단편 영화 아이디어를 브레인스토밍하고 모델이 상세한 스토리보드 생성
- 사용자는 스마트폰으로 각 스토리보드 장면을 촬영하기만 하면 됨
- 영화 제작을 위한 보조 바퀴 역할
12. 화면 녹화 및 시맨틱 요약 앱
- 로컬 모델을 사용해 매일 컴퓨터에서 하는 일의 상세한 시맨틱 요약 생성
- 채팅 앱에 맥락으로 제공: "어제 누구에게 답장을 깜빡했지?"
- Rewind를 1년간 사용했지만 기대만큼 유용하지 않음
13. Twitter/X/YouTube용 시맨틱 필터
- "화나게 만들 가능성이 있는 트윗 숨기기" 같은 개방형 필터 작성 가능
- 분노 유발 콘텐츠를 피드에서 제거
- 피드를 형성함으로써 우리 자신을 형성
14. 니치 주제 맞춤형 커리큘럼 생성 에이전트
- "진보의 과학에 대해 우리가 아는 모든 것을 배우고 싶다" 같은 요청
- 웹에서 인물, 블로그, YouTube 비디오, 에세이, 교과서 검색
- 모든 콘텐츠를 읽고 초보자에서 전문가까지 안내하는 커리큘럼 제공
15. 진짜 좋은 도서 추천 엔진
- 과거에 읽은 것, 목표, 즐기는 독서 유형에 대해 먼저 퀴즈
- 많은 정보를 알게 되면 다른 에이전트가 사용자가 메인 에이전트의 제안에 대해 어떻게 생각할지 시뮬레이션
- 매우 즐길 가능성이 높은 책만 표면화
16. TikTok과 Instagram Reels용 시맨틱 검색 엔진
- 짧은 형식 비디오에 갇혀 있는 유용한 정보에 접근
- 쿼리 가능한 검색 기능 필요
17. 수면 피트니스 앱
- Apple Watch(심박수, VO₂), Eight Sleep, Oura Ring, 운동 앱 데이터 통합
- 수면과 회복 개선을 위한 실질적 추천 제공
- 능동적으로 메시지: "이번 주 HRV가 낮아졌는데, 과훈련 중일 수 있어요?"
18. 대규모 컴포넌트 라이브러리
- 채팅 인터페이스 내에서 렌더링되도록 설계
- 기존 라이브러리는 프리미티브가 너무 저수준
- 커스터마이제이션보다 고수준 위젯 우선
19. Apple Watch용 미니멀 음성 비서
- Siri에게는 너무 복잡하지만 ChatGPT에게는 적합한 질문들
- 몇 단어 길이의 짧은 응답 제공
20. 추천 독서 목록 제공 글쓰기 앱
- 작성 중인 주제에 대해 웹 검색하여 도움이 될 만한 자료 목록 구성
- 글쓰기 앱은 사용자를 대신해 작성해서는 안 됨
21. 러닝 앱
- 맞춤형 계획 생성, 러닝 페이스와 심박수 추적
- 실제 데이터 기반으로 훈련 프로그램 반복 조정
22. Nano Banana 사진 편집 슈퍼 앱
- 프롬프트 작성 없이 수백 개의 템플릿 제공
- 다양한 헤어스타일 시도, 파트너와의 자녀 모습 예측, The Rock처럼 보이게 만들기 등
23. Same.energy 스타일의 YouTube 비디오 검색
- URL을 입력하면 비슷한 분위기의 비디오 찾기
- 현재 YouTube 알고리듬은 단순히 평균 사용자의 참여도 극대화에만 집중
24. 어린이용 Sony Walkman 스타일 기기
- LLM에 질문할 수 있는 음성 우선 기기
- 설명에 집중하며 화면이 전혀 없는 디바이스
- 오프라인 우선이면 더욱 좋음
25. 전기 검색 엔진
- 현재 직면한 문제, 인생 단계, 분야 등에 대한 설문지 기반 쿼리
- 역사상 위대한 인물들의 전기/자서전 중 유사한 상황을 다룬 챕터 결과로 제공
26. 화면 녹화로 콘텐츠 소비 감사 에이전트
- 컴퓨터와 스마트폰 사용 관찰
- 매일 소비한 콘텐츠 감사
- Screen Time은 충분히 구체적이지 않음
- 소비하는 토큰의 정확한 영양가 파악 필요
27. 니치 작업용 AI 에이전트 마켓플레이스
- 범용 에이전트보다 특정 사용 사례에 맞게 설계된 에이전트가 더 나을 것
- 샌프란시스코에서 임대 아파트 찾기 같은 니치 작업용 초특화 에이전트 카탈로그
- 웹이나 API를 통해 사용 가능한 수만 개의 에이전트 필요
28. 유명 작가의 비평 요청 기능
- "Hemingway는 이 블로그 글에 대해 뭐라고 할까?"
- 그가 혼란스러워한 부분과 좋아한 부분 파악
Hacker News 의견
-
"24. 아이들이 LLM에게 질문할 수 있는 Sony Walkman 스타일의 기기를 주는 것"에 대해선 정말 신중해야 한다고 생각함
- AGI가 아닌 이상, 아이가 듣게 될 답변들은 대부분 매우 정확하겠지만 아주 적은 수의 잘못된 답변이나 미묘한 오해가 아이의 학습 여정에 치명적인 영향을 줄 수 있음
- 만약 완벽한 LLM이라 실수를 전혀 하지 않는다고 해도 결과적으로 타인과 소통할 필요가 줄어들기 때문에 협동 능력을 키울 기회가 감소함
- 부모 입장에서는 잠깐의 휴식을 원하지만, 아이가 항상 즉시 답해주는 기기를 알게 된다면, 함께 답을 찾으며 보내는 소중한 교감의 시간이 사라질 것임. 아이가 부모로부터 점점 멀어질 수 있음. 어떤 가치관이 아이에게 전달될지 고민해야 함
- 이런 시스템을 아이에게 장착해주는 부모는 자신의 세계관과 가치관이 그 시스템에 잘 반영되었으리란 전제를 갖고 있음. HN에 있는 부모들은 과학 중심 시각을 갖고 있을 수 있지만, 다른 나라/지역에선 그 기기가 정치, 종교, 문화적 선전 도구로 변할 수도 있음. 이런 도구가 세뇌의 무기로 악용될 위험 큼
-
학교 선생님에게 물어보는 것보다 훨씬 더 나은 결과를 얻을 수 있다고 생각함
-
이틀 전에 ChatGPT에게 여섯 살 아이가 이해할 수 있는 자리값 체계(place-value system)에 대해 설명해 달라고 했음. 그런데 자리값과 숫자값 개념을 헷갈려서 잘못된 설명을 했음. 나는 그 오류를 알아차리고 ChatGPT가 사과했지만, 아이가 직접 물었다면 이 오류를 못 느꼈을 것임.
내 아이가 이런 기기에서 얼마나 많은 잘못된 정보를 진짜라고 믿게 될지 고민임
-
19번 관련해서, 몇 주 전에 iOS Shortcut으로 직접 만들어 봤음
Apple Watch용 최소한의 음성 비서임. Siri로는 복잡한 질문이 어렵지만 ChatGPT에겐 괜찮음. 답변은 150자 이내의 짧고 간결한 문장으로 받음
Dictate Text 액션으로 음성을 받아 OpenAI API로 전송하고, 아래와 같은 시스템 프롬프트를 사용함
“CRITICAL: iOS 푸시 알림 또는 워치 화면에만 답변이 표시되므로, 150자 미만으로 간결하게 대답. 마크다운 금지, 평문만 사용. 최소한의 세련된 어휘와 구두법 활용.
사용자는 답변에 추가질문 불가. 한 번에 한 문장으로, 필요시 질문에 대한 가정도 해줘야 하며 잘못된 가정이면 사용자가 다시 물어봐야 함.”
꽤 잘 동작함. 가장 큰 단점은 답변받는 데 5~20초 걸리는 것임. 하지만 질문 보내는 건 거의 즉각이라(앱을 따로 열 필요 없음) 굉장히 만족스러움 -
내가 많은 아이디어/기사에서 느끼는 점은, LLM에 대해 "포탈로 사고(thinking with portals)"하지 않는다는 것임. 우리에겐 "포탈건" 수준의 기술이 있는데(그렇게 홍보하니까), 단지 더 나은 문으로만 쓰고 있다는 느낌임
-
LLM이 할 수 있는 것은 결국 논리적으로 이어진 텍스트 확장임. 응용 가능성은 넓지만 실제로는 고급 텍스트 에디터를 넘어서기 어려움. 예를 들어 동영상 편집에 활용하고 싶다면, 스크립트 언어를 만들어야 하고, 편집기와의 기능 동기화도 해야 함. Adobe 같은 대기업엔 인력 대비 가치가 애매하고, 스타트업은 Adobe와 오랜 기능/사용자 잠금경쟁을 해야 함. 둘 다 LLM이 정말 혁신적이지 않은 이상 큰 메리트가 없음. 게다가 LLM은 비디오 결과물을 직접 볼 수 없고, 현 시점에서 "그럭저럭" 수준임
-
이 관점에 동의함. "thinking with portals"에 대해 참고할 만한 자료가 있다면 공유해 줄 수 있는지 궁금함
-
포탈식 사고에 대한 예시가 있다면 쉽고 간단하게 공유해 줄 수 있으면 좋겠음
-
-
22번 관련, 내 브라우징 히스토리를 분석해서 내가 가장 오래 읽은 블로그/기사 유형을 파악하고, 매일 밤 내가 아직 보지 않은 추천 콘텐츠를 찾아주는 엔진이 있었으면 좋겠다는 의견임
ChatGPT Pulse가 유사하게 존재함. 이 서비스는 브라우저 히스토리가 아니라 ChatGPT 기록을 활용하지만, ChatGPT를 자주 쓰는 사용자에겐 더 신뢰할 만한 추천임
https://openai.com/index/introducing-chatgpt-pulse/- 사실상 모든 소셜 미디어 알고리즘 피드가 이미 이 역할을 한다고 할 수 있음
-
이 글에서 제안된 대부분의 아이디어는 기반 LLM에 UI/UX만 좀 더 잘 만들어 줬으면 하는 요구에 가깝다고 생각함
-
이런 사고에는 근본적인 범주 오해(category mistake)가 있다고 느낌
예시로 "헤밍웨이가 내 글을 어떻게 평했을까?" 기능이 있는데, 실제론 해당 AI가 생성하는 답변이지, 실제 헤밍웨이의 평이 아님
100개의 모델에 물으면 100가지 대답이 나올 텐데, 실제 헤밍웨이의 사고방식이나 성격은 그의 저작 몇십만 단어로 온전히 복원할 수 없음.
결국 "이게 정말 그 사람이 말한 것처럼 그럴듯하게 들릴 수 있나"의 문제임
우리가 유명인의 평가를 듣고 싶어하는 이유는 살아있는 진짜 사람의 관점 때문임. AI의 흉내는 진짜 샌드위치 대신 샌드위치 사진을 먹으려는 것과 같음
많은 사람들이 이 환상에 더 명확히 선을 긋지 못한다는 것이 뭔가 불안함-
100% 동의함
그런데 이 댓글을 읽으며 Star Trek TNG의 홀로덱을 떠올렸음. 거기선 아인슈타인, 프로이트 등 유명 인물을 재현하는데, 시청자 입장에선 15살 때조차 "이게 그냥 컴퓨터가 뽑아낸 무작위 답변"이라고 생각하지 않았음
실제 에피소드 중엔 기록만으로 실제 인물을 재현하다 실수한 장면이 나오고(https://www.imdb.com/title/tt0708682/), 나중엔 그게 얼마나 다른지 드러나기도 함(https://www.imdb.com/title/tt0708720/)
요약하자면,- 그런 에피소드들이 정말 시대를 앞섰다고 느꼈음
- 그런 역사적 인물의 가짜 재현에 전혀 불편함을 못 느꼈는데, 왜 LLM 문맥에서는 민감한지 나도 궁금함. 애초에 모두가 100% 가짜라는 사실을 알기 때문인지, 아니면 뭔가 다른 이유가 있는지...
이 글을 보고 여러 가지를 생각하게 됨
-
AI Hemingway가 굳이 필요 없는 이유를 단순하게 설명할 수 있음. 실제로 이미 10년 전쯤 hemingwayapp과 같은 좋은 글쓰기 가이드가 등장함 https://hemingwayapp.com/
간단한 규칙 기반으로 문법을 교정하고, 더 간단한 표현으로 바꾸도록 유도함. 오히려 자동으로 다시 써주지 않아서 스스로 배우기에 더 좋을 수도 있음 -
"바나나처럼 초소형 포토에디팅 앱, 프롬프트 없이 수백 개 템플릿 제공..." 등과 같은 많은 아이디어를 보면, 결국 인간이 어떻게든 더 게으르게 살려는 욕구가 보임. "헤밍웨이가 뭘 떠올랐을까" 같은 것도 비슷하게 느껴짐
-
"이게 과연 그 사람식의 plausible한 답변인가 인간을 속일 수 있나"라는 게 본질인데, 사실 그 자체로도 유용함
인간이 속임을 인지하고 있다면, 그걸 make-believe, 혹은 불신의 유예라고 부름
우리가 누군가를 연기하거나, 다른 관점에서 생각하려 할 때마다 이런 과정을 거침. 실제 인물 기록이나 소설 인물로부터 배우려 할 때도 마찬가지임
"스티브 잡스/헤밍웨이의 평가가 진짜 인간이니까 듣고 싶다"는 게 오히려 반대라고 생각함
실제로 대화 상대는 진짜 인간이기보다, 우리가 상상하는 유명인이나 캐릭터의 요약된 개성이 더 중요함. 그 사람의 실제 모습에 집착하는 사람은 거의 없음
신화화된 "유명인 헤밍웨이" 자체가 더 매력적임. 오히려 진짜보다 더 유용하고 흥미로움
그래서 스타트렉 TNG의 사례처럼, 오히려 그런 가상 인물 시물레이션이 원래 의도대로 잘 작동한다고 봄 -
페인만이 "과학에서 가장 첫 번째 원칙은 자기 자신을 속이지 않기"라며, 이 말은 LLM 결과물에도 적용된다고 생각함
-
-
정말 흥미로움
우리 모두가 이 리스트의 데모들이나 유사한 기술을 많이 봤고, 이미 많은 스타트업이 수년간 수억 달러를 쏟아부어 제품을 만들고 있음
그런데도 실제로 쓸만한 제품은 거의 안 보이고, 일상에서 만나는 것들은 데모처럼 잘 동작하지 않음
도대체 무슨 일이 일어나고 있는 건지 궁금함.
즉, 제품이 실제로 존재하지만 거의 아무도 안 쓰는지도, 아니면 충분히 쓸만한 모델을 사용하려면 너무 비싸서 그런지, 그도 아니면 멋진 데모를 만드는 게 실제 제품 만드는 것보다 훨씬 쉬워서인지... 여러 가능성이 궁금함- 맞춤 타겟 유저에게 다가가는 비용이 너무 큼
핀테크 앱 광고 대행사와 이야기할 때, 3개월 동안 월 2만 달러 정도 광고비를 소진해야 작동 방식이 파악되고, 그 후에야 CAC가 내려가고 타겟 사용자를 얻을 수 있다고 들음
광고를 끄는 순간 제품 인지도가 다시 사라지고, 신규 사용자가 끊김. 존재 자체를 알릴 방법이 없게 됨
- 맞춤 타겟 유저에게 다가가는 비용이 너무 큼
-
이런 아이디어의 상당수는 유저의 취향, 패턴, 커뮤니케이션, 일정, 건강 정보를 파악해야 함
이 분야에서 Apple이 정말 강점이 있을 수 있음.
폰과 워치가 개인 정보를 가장 많이 알고 있으니, Apple이 프라이버시 보호를 전제로 LLM과의 다양한 맥락을 똑똑하게 조합해 줄 수 있음 -
해당 링크를 눌러봤더니 실제 툴이 아니라 아무 관련 없는 앱 아이디어 모음 정도여서 실망스러웠음
-
"아이들이 LLM에게 음성으로 질문할 수 있는 Sony Walkman 스타일의 기기"
100% 완벽히 일치하진 않지만 https://www.aliexpress.com/item/1005009196849357.html 이 제품이 꽤 비슷함.
오프라인은 아니지만, 핑퐁공보다 약간 큰 크기임
손주들(5, 3살)에게 2분만에 익히게 시킨 뒤, "유니콘 Bob의 이야기 들려줘", "개와 원숭이는 친구가 될 수 있어?" 등 수많은 질문 폭탄을 쏟아부었는데 모두 몇 초 만에 그럴듯한 답이 나왔음
이런 제품이 크리스마스엔 장난감에 내장된 채로 나올 것 같고, 나오면 바로 구매할 예정임