Hacker News 의견
  • Semantic 웹 표준의 문제점

    • 수십 년 동안 킬러 애플리케이션이 부족함
    • 웹의 질이 나빠졌고, 위키피디아 같은 사건이 없었음
    • 비전의 불완전성: SPARQL 쿼리와 reasoners는 유용하지만, 평균 사용자에게는 인지 비용이 높음
    • 더 나은 웹을 위해서는 여전히 Semantic 웹 방향이 필요함
  • 시도 실패 경험

    • 시도한 사이트에 "Poem" 카테고리가 없었음
    • 9년 전부터 요청되었지만 해결되지 않음
  • JSON-LD와 RSS 비교

    • "Googlers, JSON-LD가 RSS만큼 인지도를 가질 수 있음"
    • 앱이나 서비스를 출시하고 종료하면 좋겠다는 의견
  • LLM과 Semantic 웹의 의미

    • 의미는 출판자가 정의해서는 안 됨
    • 평균 출판자가 LLM보다 정확하게 분류할 수 있는지 의문
    • SEO 해킹과 블로그 스팸은 출판자가 유일한 진리의 원천이었기 때문
    • 의미를 정의하는 문제를 해결해야 함
  • Semantic 웹의 현재 상태

    • Facebook과의 통합으로 승리를 선언하는 것은 Semantic 웹의 죽음을 의미함
    • OWL과 다른 표준은 페이지 내용을 주석 처리하는 것이 목적이었음
    • 저자, 제목, 사진, 출판 날짜 정보는 거의 무의미함
  • 중요 개념 누락

    • 링크 데이터, RDF, 연합 및 웹 쿼리 언급 없음
    • JSON-LD는 단지 직렬화 형식일 뿐
    • 링크 데이터 기술은 데이터의 상호 운용성과 재사용성을 높임
    • LLM과 링크 데이터는 상호 보완적임
  • PDF의 메타데이터

    • PDF의 메타데이터도 Semantic 웹 표준을 기반으로 함
    • JSON-LD 대신 RDF를 XML로 작성함
  • HTML의 중요성

    • HTML이 어려워서 회피하는 것 같음
    • 의미는 마크업에 숨겨져 있는 것이 아니라 마크업 자체임
  • AI와 메타데이터

    • AI가 메타데이터를 대체하지 못하는 이유 두 가지
      • LLM이 자주 틀림
      • GPU 시간이 비쌈
    • LLM은 이미 99% 정확도를 보임
    • 미래에는 텍스트를 LLM에 통과시키는 것이 큰 문제가 되지 않을 것임
  • JSON-LD와 SEO

    • Google은 JSON-LD를 SEO 개선을 위해 5년 이상 추진해옴
    • Open Graph 프로토콜로 대부분의 관련 페이지 메타데이터가 이미 캡처됨
    • 추가 작업을 통해 JSON-LD를 생성할 필요가 없음