2P by GN⁺ 11시간전 | ★ favorite | 댓글 1개
  • Harper오픈소스 문법 검사기로, 유명한 상용 서비스인 Grammarly의 대안 제품임
  • 누구나 무료로 사용할 수 있으며, 코드와 알고리듬이 투명하게 공개되어 있음
  • 영어 텍스트의 문법, 스타일, 맞춤법 문제를 자동으로 감지 및 수정하는 기능이 제공됨
  • 개발자, 작가, 학생 등 다양한 사용자층에 적합하여 자유로운 커스터마이징 가능성 보유함
  • 서버 자체 호스팅, 로컬 실행이 가능하므로, 프라이버시 및 데이터 보호에서 이점이 있음

Harper 소개

  • Harper는 Grammarly와 유사한 기능을 제공하는 오픈소스 문법 및 스타일 검사기
  • 완전히 무료로 제공되며, 누구나 자유롭게 소스코드를 확인하고 활용 가능함
  • 맞춤법 검사, 문법 오류 탐지, 스타일 개선 추천 등 영어 텍스트 교정 기능을 구현함
  • 사용자는 Harper를 로컬 서버 또는 자체 인프라에 설치하여 데이터 프라이버시를 강화할 수 있음
  • 확장성과 커스터마이징이 뛰어나, 각자의 필요에 맞추어 알고리듬 수정 및 기능 추가가 용이함

주요 기능 및 장점

  • 오픈소스 프로젝트이므로, 서비스 의존성 없이 내부 아이디어 관리 및 개선 가능함
  • 영어에 최적화되어 있으나, 향후 다국어 지원 확장 가능성도 내포함
  • 커뮤니티 지원이 활발하여, 피드백과 기능 개선이 활발하게 이루어지는 중임
  • 서버 기반, 또는 직접 설치 방식으로 높은 유연성을 제공함

활용 대상 및 적용 예시

  • 소프트웨어 엔지니어, 기술 문서 작성자, 학생 등 영어 글쓰기 품질 향상에 관심 있는 사용자에게 적합함
  • 개인정보를 외부 서비스에 노출하지 않고 자체적으로 문서 교정 프로세스를 구축하고자 하는 조직에 유리함
  • 맞춤형 룰, 워크플로우 통합 등 고급 커스터마이징이 필요한 환경에서 효과적임

결론

  • Harper는 완전 무료로 제공되는, 신뢰성이 높은 Grammarly의 오픈소스 대안임
  • 사용자나 조직의 프라이버시 요구를 충족할 수 있는 독립 실행 환경을 제공함
  • 개발 커뮤니티의 참여로 지속적인 기능 향상과 오류 수정이 기대됨
Hacker News 의견
  • 대부분 문서의 경우 Harper가 10ms 이내로 제안을 제공할 수 있다는 점에서, 10l이나 10kg는 익숙한 단위로 받아들일 수 있지만 왜 10ms는 거부감이 드는지 궁금증

  • 문법 규칙이 오픈소스 프로그램에 하드코딩되어 있어 스스로 수정할 수 있는 방식이, 프롬프트 튜닝이나 LLM의 학습 데이터에 암묵적으로 하드코딩된 방식보다 훨씬 선호하는 부분 Neovim을 위한 LSP 설정이 상당히 좋아 보임 Neovim 통합 문서 이런 도구들이야말로 미래라는 생각 Automattic이 이런 내용을 홈페이지에서 강조해야 한다고 제안

    • 이런 방식은 언어의 자연스러운 진화라는 측면을 놓칠 수 있다는 의견
  • 개인적으로 LLM을 사용하지 않는 점이 큰 장점이라고 판단 Grammarly는 AI 기능이 추가되면서 점점 불안정해졌고, 한 시간 전에는 쉼표를 빼라고 하더니 그 다음엔 다시 넣으라고 안내하는 등 일관성을 잃은 모습

    • LLM 기반의 일반적인 모델은 실제로 문장 부호에서 자주 혼란을 보임, 이게 얼마나 뚜렷한 단점인지 경험했고, Grammarly 같은 서비스에서 이 현상을 그대로 두는 것이 신기함

    • 최근 1년간 Grammarly와 gboard의 예측 결과가 매우 형편없어져 버림

    • LLM 기반으로 개발된 비슷한 도구가 있는지 궁금증 LLM이 항상 더 뛰어나진 않지만, 두 방식의 차이를 비교해보는 것에 흥미가 있음

    • 문장 부호 관련 제안이 시시각각 바뀌는 모습이 영어 교사들과 비슷하다는 농담식 반응

  • LanguageTool(Grammarly 경쟁자) 역시 오픈소스이고 로컬에서 직접 실행 가능 GitHub, Docker 이미지 나는 주로 Docker 컨테이너로 로컬에서 LanguageTool을 실행 중 Harper는 자세히 써보진 않았지만 존재는 예전부터 알고 있었음, 다양한 선택지가 있다는 점이 반갑고 Harper의 웹사이트에서도 경쟁 툴 중 하나가 로컬에서도 구동 가능하다는 설명이 분명히 있었으면 좋겠다는 바람

  • “Me and Jennifer went to have seen the ducks cousin.”에 에러가 전혀 감지되지 않는 상황 이런 식으로 규칙이 더 많이 보완되어야 Grammarly 수준에 접근 가능할 것이라는 지적

    • 처음엔 인상적이었지만 여러 테스트 후, 꽤 기본적인 오류도 캐치하지 못해 성능이 들쭉날쭉하다는 결론

    • 비슷하게 “My name John. What your name? What day today?”도 문법 오류로 잡히지 않음

    • 이런 테스트 문장이 무엇을 의미하는지 의문

  • 다운로드나 확장 프로그램 설치 전에 데모나 테스트를 할 수 있는 웹사이트가 있으면 정말 유용할 것이라는 의견 Firefox 확장은 이 페이지로 연결되는데, 긴 텍스트 붙여넣으면 하이라이팅이 제대로 동작하지 않는 문제점

  • 언어 학습 도구에 왜 LLM을 활용하지 않는지 궁금증 언어 문제는 LLM에 100% 맡길 수 있다고 생각 ChatGPT가 영어 실수를 하는 걸 본 적이 없는지 질문

    • Grammarly는 AI 기능이 강화되면서, “wasn't”을 분리해서 “was trulyn't” 같은 추천을 하는 등 이상한 문장도 제안 관련 이미지

    • LLM의 실수는 충분히 자주 목격되고, 때때로 매우 엉뚱한 제안도 보임 물론 대부분 매우 잘 작동하지만, 절대 “믿을만한” 수준까지는 아니고, 오히려 사용자의 실수를 그대로 따라가기도 하는 경향

    • 이런 언어 학습 도구는 본질적으로 언어를 “실제로 배우는 것”을 피해가려는 용도로 많이 쓰인다는 지적

  • Grammarly의 타깃 시장이 누구인지 궁금증 영어를 제2외국어로 쓰는 전문직 종사자들이 대상일지 의문

    • LLM의 존재를 모르는 사람들도 주요 타깃이라는 추측
  • 코드 주석의 문법 검사까지 처리할 수 있는 훌륭한 LSP 서버가 제공된다는 소개 LSP 문서

  • Automattic이 만든 제품인 만큼 성공하면 Matt가 이익을 위해 망칠 거라는 걱정 때문에 사용을 망설이는 모습

    • 오픈소스(FOSS)이기 때문에 만약 최악의 경우가 와도, 마지막 좋은 버전을 커뮤니티가 포크해서 개발을 이어갈 수 있다는 반박

    • 이 사실(Automattic 제품이라는 점) 때문에 사용하지 않겠다는 단호한 입장