Vanilla Scraper
동적 규칙기반 웹 스크래핑 솔루션

웹 데이터를 크롤링 하는데 처음 접근은 쉬우나 변경이 잦아 많은 어려움이 있습니다.
이를 해결하기 위해 각 사이트마다 동적 Rule을 만들고 실시간 푸시 방법으로 공유하여 정밀하게 데이터를 가져오는 것이 가능합니다.
JVM또는 Swift 기반의 서버나 클라이언트에서 각종 웹 사이트의 데이터를 설정파일에서 Rule 을 동적으로 설정하여 쉽게 가져올 수 있습니다.

모듈 상세

데이터 스크래핑 기술을 서버 뿐만 아니라 클라이언트도 적용하여 더욱 정제된 데이터를 수집합니다.
컨텐츠 리더빌리티 기능과 연계하여 정제된 텍스트 처리 – 규칙을 실시간으로 적용가능 합니다.
HDFS, S3(Amazon) 등의 빅데이터 연계 저장 할 수 있습니다.