Hacker News 의견
  • 이런 아이디어가 마음에 들어서 직접 만들어보고 싶음, 하지만 whisper의 작은 모델들을 로컬에서 사용해본 경험이 기대 이하였음, 이 정도 사용 사례에 충분할 만큼 좋은 결과를 얻은 분이 있는지 궁금함, 내 마이크가 안 좋았던 것 같기도 함
    • 마이크 상태를 꼭 다시 점검해볼 필요가 있음, 우리 회사에서는 Whisper를 사용해서 전체 회의를 실시간으로 녹취 및 번역하고 있는데 아주 뛰어난 성능을 보여줌
    • 어떤 모델을 쓰는지 궁금함, 나는 보통 large 모델을 GPU에서 사용함, 속도도 빠르고 정말 잘 동작함, 하지만 한 번에 한 언어만 인식 가능하다는 점을 유의해야 함, 지정하지 않으면 자동 감지로 진행됨, 작은 모델들은 그만큼 성능이 부족하고 주로 영어만 지원하는 경우가 많음, 나에게는 large가 최고의 성능을 제공하지만 실제로 쓸 만한 속도를 내려면 GPU 하드웨어가 꼭 필요함, faster-whisper나 insanely-fast-whisper와 함께 사용해도 마찬가지임
  • 그냥 설치해 쓸 수 있는 제품이나 앱 형태였다면 정말 좋겠음, UI로 쉽게 설정하고 학습시키고 싶음, 그래도 이 가이드 덕분에 내가 원하는 걸 만들 수 있을 것 같아서 정말 고마운 마음임
  • 정말 멋진 자료, 고맙다는 뜻을 전하고 싶음, 아직 다 따라해보진 않았는데, 이 모델이 아이폰에서 실제로 잘 돌아가는지 궁금함, 우리 집 9살 아이가 ollama로 Qwen 0.6B 모델은 잘 돌렸지만, 그 외의 모델은 너무 느려서 쓸 만한 사용자 경험이 아니었음
    • 아, 9살 된 전화기 얘기였군, 난 초등학생이 모델을 직접 배포하고 있다는 줄 알고 깜짝 놀랐음, 내가 그 나이 때는 아직 구구단도 배우는 중이었음
    • MLC 자료에 따르면 8B 규모의 모델까지도 iOS에서 구동 가능하다고 함, 하지만 1-3B 정도가 더 현실적으로 보임, 참고 자료 있음: https://llm.mlc.ai/docs/deploy/ios.html#bring-your-own-model
  • 왜 LLM이 쓴 글이어야 하지? 의문이 듦
    • 이런 요약 형태의 스타일, 그러니까 강한 포맷팅과 (!) 모든 단락이 불릿 리스트로 나오는 점 때문에 몹시 혼란스러움, 특히 긴 글에서는 화면이 산만하고 밋밋해 보여서 가독성이 떨어지는 느낌임
  • 최근에(내가 공지를 놓쳤는지도 모르겠음) Siri가 최소한 일부 명령에 대해 로컬로 작동하고 있음을 발견함, 예를 들어 애플워치를 에어플레인 모드로 두고 타이머나 알림을 요청해보면 됨
    • Siri는 적어도 iOS 15부터는 제한적인 오프라인 기능을 가지고 있었음, 하지만 대부분의 사용자는 이를 잘 알아채지 못했음, Siri 명령의 대부분이 네트워크 연결을 필요로 하기 때문임
  • 왜 Apple은 데이터를 분석해서 상위 약 1000개 정도의 사용 용도에 대해 하드코딩된 핸들러를 마련하지 않았는지 의문임
    • 사실 이 작업을 이미 하고 있기는 한데, 속도가 너무 느린 상황임, 밝기 및 전원 관련 기능을 추가하긴 하는데 오프라인에서 뭘 사용할 수 있는지 제대로 안내하지 않음, 사용자가 에어플레인 모드로 전환해서 이것저것 직접 시도해봐야만 확인 가능함, 사용자 경험이 너무 나쁨
  • 멋진 프로젝트와 좋은 정리임
  • Apple에서 Siri를 다른 비서로 대체하는 걸 허용하는지 의문임, 안드로이드에서 구글 이외의 비서들은 오랫동안 백그라운드 청취나 하드키, 제스처, 단축키 사용에 제한이 있었음, 구글 어시스턴트가 여전히 특혜를 유지하고 있는지 확실치 않지만 그렇다고 해도 별로 놀랍지 않을 것임
    • 문제의 일부 원인은 “hey siri” 웨이크 워드를 처리하는 별도의 코프로세서(AOP)에 있음, 모델도 펌웨어에 컴파일되어 있음, 기술적으로 불가능하지는 않지만, 단순히 구글 앱이 백그라운드에서 동작하도록 두는 것만으로는 불가능함, 왜냐하면 AP가 잠든 상태에서 제스처가 발생하기 때문임, 측면의 액션 버튼 등으로 비서 앱을 구동할 수는 있겠지만 만족스러운 경험은 아닐 것임(앱이 열려 있지 않을 수 있음 등), 자세한 내용은 아래 링크 참고: https://machinelearning.apple.com/research/hey-siri
    • 새로 추가된 액션 버튼을 이용하면 커스텀 단축키를 통해 대체 비서 앱을 띄우는 게 상당히 쉬움
    • Perplexity도 이 방식으로 동작함
  • 1년 반 동안 iPhone에서 chatGPT를 충실히 써왔음, Siri의 답답함이 심해서 점점 더 싫어짐, OpenAI가 Microsoft의 도움을 받아 iPhone과 경쟁할 GPT폰을 언제쯤 내놓을지 궁금함, 나는 지루한 iPhone에 질렸음, 잠금화면에서 바로 GPT가 모든 걸 대신해주는 GPT폰이 필요함, 어서 나오길 손꼽아 기다리는 중임, 아마 비밀리에 개발 중일 거란 기대감 있음