Instagram Crawler - woowacourse-teams/2020-songpa-people GitHub Wiki

Instagram Crawler

사용 기술

  • Jsoup
public static Document crawling(String url) {
    try {
        return Jsoup.connect(url)
          //위장할 브라우저, 디바이스 정보
            .userAgent(USER_AGENT)
          //최대 연결 시도 시간
            .timeout(HOLDING_TIME)
            .get();
    } catch (IOException e) {
        throw new CrawlingUrlException();
    }
}

사용방법

InstagramCrawler.createHashtagDto(검색할 이름)

public CrawlingDto createHashtagDto(String placeName) {

  	...
      
    return CrawlingDto.of(placeName, hashtagCount, postDtos);
}

CrawlingDto에 포함된 정보

  • 가게이름
  • 해시태크 게시물 수
  • 인기게시물 9개의 postUrl 과 imageUrl

...스케줄러 구현후 보완예정