# borb - PDF 읽기/쓰기/편집용 파이썬 오픈소스 라이브러리

> Clean Markdown view of GeekNews topic #5041. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=5041](https://news.hada.io/topic?id=5041)
- GeekNews Markdown: [https://news.hada.io/topic/5041.md](https://news.hada.io/topic/5041.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2021-09-19T09:51:01+09:00
- Updated: 2021-09-19T09:51:01+09:00
- Original source: [github.com](https://github.com/jorisschellekens/borb)
- Points: 6
- Comments: 1

## Topic Body

- PDF 문서를 JSON 비슷한 데이터 구조로 나타내어 쉽게 사용 가능

ㅤ→ Nested list, dictionary, primitive 등

- PDF를 처음부터 생성 하기

ㅤ→ Page, PageLayout 생성

ㅤ→ Paragraph, Image, Shape, Barcode, Chart, Emoji, List, Table, Form 등 생성

- 기존 PDF 변경하기

ㅤ→ 메타 데이터 추출 및 변경

ㅤ→ 텍스트/이미지 추출

ㅤ→ 이미지 변경

ㅤ→ Annotation (Note, Link 등) 추가

ㅤ→ 텍스트/테이블/리스트 추가

ㅤ→ 페이지 레이아웃 관리자 이용하기

## Comments



### Comment 6906

- Author: v08zbv8fvlkjasdflkj
- Created: 2021-09-23T13:06:19+09:00
- Points: 1

몇일전 올라온 서비스중에 논문을 HTML로 변환하는 것도 있었는데,

관건은 multi-column에서 text 읽는 순서, 이미지의 범위 등이네요.

이런 서비스로 논문의 serialization 성숙해지고 요약서비스도 곧 나올듯 ㅎㅎ
