今回の仕様書 - GoobyeEarth/google_news_scraping GitHub Wiki

必要な機能

  • ダウンロード機能 works
  • ページのhtmlを取得する機能 works
  • タブの自動生成 (必要か微妙)
  • timehandler works
  • 履歴から自分の検索パターンを取得(必要になった時に試す)
  • サイトに対する自動アクセス works

実装

  • ボタンをクリックしたらtime handler起動
  • タブの自動生成
  • time handler
  • 30分ごとにtabの検索キーもって検索(urlの方がいい( できるだけ、ずらす(5なら6分おき
  • 1分ごとにgoogleに対するアクセスを履歴から実行(ここのアルゴリズムは要検討。)(検索に対してn回アクセス

注意

  • googleのリスポンスの計測
  • googleのアクセス制限要件の確認
  • 後でアクセス制限に対処できるように設計