1 Chrome 확장 프로그램인 Clearly 는 웹 페이지의 내용 중에서 본문만 추출해서 읽기 쉽게 도와 주는 도구이다.
2 어찌 보면 이 부분이 가장 중요한 부분이라고 할 수 있다.
3 해당 노드가 컨테이너라면(tagName이 파싱 옵션 중 '_elements_container'에 속한다면 컨테이너다) 본문 후보 자격이 주어진다.

이거 예전에 저도 분석해봤었는데 좋네요

트위터 반응

@helloworld_nhn: 웹 페이지 본문만 추출해서 보여주는 Chrome 확장프로그램 Clearly가 어떻게 제목과 본문을 선정하는지 소스코드를 분석해봤습니다. http://t.co/5FJnYB5w

@iamkimtree: 에버노트에서 웹 페이지 클리핑을 할 때 사용하는 Clearly 소스코드 분석기. NHN 헬로월드가 또 한 번 흥미로운 시도를 했네요. 소스코드를 직접 뜯어서 어떤 방식으로 제목과 본문만을 추출하는지 분석! #dev http://t.co/2u9Sl0Yj

@chatii2412: HelloWorld » #Clearly 로직 분석: 본문/제목 선정 로직 분석 http://t.co/GV1l4mHF via @helloworld_nhn