# defuddle - 어떤 웹페이지든 Markdown으로 추출합니다

> Clean Markdown view of GeekNews topic #27540. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=27540](https://news.hada.io/topic?id=27540)
- GeekNews Markdown: [https://news.hada.io/topic/27540.md](https://news.hada.io/topic/27540.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2026-03-16T09:47:01+09:00
- Updated: 2026-03-16T09:47:01+09:00
- Original source: [github.com/kepano](https://github.com/kepano/defuddle)
- Points: 56
- Comments: 8

## Summary

웹페이지의 댓글·사이드바·푸터 등 **불필요한 요소를 제거**하고 핵심 본문만 정제해 **HTML이나 Markdown으로 추출**하는 콘텐츠 파서입니다. **Mozilla Readability**의 대체를 목표로 하며, 모바일 스타일 분석과 schema.org 메타데이터 활용을 통해 더 일관된 출력과 풍부한 메타 정보를 제공합니다. Obsidian Web Clipper용으로 시작했지만, 브라우저·Node.js·CLI 등 다양한 환경에서 활용할 수 있습니다.

## Topic Body

- 웹페이지의 불필요한 **댓글, 사이드바, 헤더, 푸터를 제거하고 핵심 본문만 정제해 HTML/마크다운으로 추출**하는 콘텐츠 파서  
- 유튜브 영상은 대화를 화자별로 분리해서 추출해줌(0.12.0부터)  
- **Obsidian Web Clipper**용으로 개발되었으나, 브라우저·Node.js 등 다양한 환경에서 사용 가능  
- **Mozilla Readability** 대체용으로 설계되어 더 유연한 처리와 일관된 출력 제공  
  - 불확실한 요소 제거를 최소화  
  - 각주, 수식, 코드 블록 등 표준화된 출력 지원  
  - **모바일 스타일 분석**을 통한 불필요 요소 감지  
  - **schema.org 메타데이터**를 포함 더 많은 메타데이터 자동 추출  
- **CLI 인터페이스**를 지원해 터미널에서 직접 HTML·URL 파싱 가능  
- MIT 라이선스

## Comments



### Comment 53078

- Author: xguru
- Created: 2026-03-16T09:48:01+09:00
- Points: 3

[Defuddle - Readability를 대체하는 HTML-to-Markdown 오픈소스](https://news.hada.io/topic?id=21069)  
10달 전에도 한번 올라왔었는데요, 이번에 유튜브 영상의 대화를 화자 분리해서 뽑아내는 기능이 추가되었습니다.  
그리고 그동안 X URL의 비동기 추출이나 아티클 추출, substack 앱 지원, CLI 추가, GitHub URL  지원등 많은 기능이 추가되었네요.

### Comment 53117

- Author: tested
- Created: 2026-03-16T13:56:07+09:00
- Points: 2

[Jina AI Reader - URL을 LLM 친화적인 입력으로 바꿔주는 도구](https://news.hada.io/topic?id=14498)

### Comment 53118

- Author: tested
- Created: 2026-03-16T13:56:44+09:00
- Points: 1
- Parent comment: 53117
- Depth: 1

긱뉴스 내부 링크는 자동으로 타이틀 달아줬으면...

### Comment 53121

- Author: xguru
- Created: 2026-03-16T14:44:25+09:00
- Points: 2
- Parent comment: 53118
- Depth: 2

수정해두었습니다. 앞으로 달리는 댓글은 자동으로 타이틀 변환됩니다.

### Comment 53134

- Author: tested
- Created: 2026-03-16T17:19:28+09:00
- Points: 1
- Parent comment: 53121
- Depth: 3

우왕 감사합니다

### Comment 53122

- Author: crawler
- Created: 2026-03-16T14:47:51+09:00
- Points: 1
- Parent comment: 53121
- Depth: 3

와 이게 이렇게 바로 되는 거였군요 ㄷㄷ 저도 불편한 적이 있었는데 말씀 드려볼 걸 그랬네요

### Comment 53088

- Author: shakespeares
- Created: 2026-03-16T10:47:13+09:00
- Points: 1

마크다운이 애매하게 추출되네요. 웹 페이지에 있는 딱 SEO가 잘 적용된 기준에서만 잘 추출되는 것 같은데요. 맞나요?

### Comment 53084

- Author: dbs0829
- Created: 2026-03-16T10:15:15+09:00
- Points: 1

클로드 코드랑 결합해서 쓸때 정말 좋더라고요.
