Git Scraping - 웹 변경사항을 Git Repo에 기록하기
(simonwillison.net)- 계속 바뀌는 웹사이트 데이터를 GitHub Actions 로 긁어다가 기록해서 커밋로그와 함께 쌓아두기
- 캘리포니아 산림보호 및 화재예방국 에서 최근의 CA 산불 데이터를 긁어다가 기록해본 예제
- XHR JSON 데이터를 curl로 가져다가 jq 로 분리해 내서 기록하는 간단한 깃헙 액션 워크플로우 YML 파일을 만들어 실행
- 내용이 변경되었을 경우에만 커밋하도록 하고, 깃헙 Cron 설정으로 한시간에 3번 정도 실행
- 작성자는 예전에 허리케인 정보나 다른 공공서비스등에도 적용한 기록들을 다 공개 한바 있음