This repository is implematation of 📄 DOM based content extraction via text density and I just tested this code for Korean web pages.
📄 DOM based content extraction via text density 논문의 내용을 Go로 구현 한 것입니다. 한국어 페이지들을 대상으로 테스트 해 봤습니다.
gh repo clone minarc/godensity
cd godensity
go test