機械学習による混雑度予想実装のアイデア - showwin/DisneyWT GitHub Wiki

Abstract

機械学習による混雑度予想のために思いついた方法のメモ

Contents

目的変数

Lv.1: その日の混雑度

  • 例えば 混雑度 = 1日の待ち時間の合計 と定義
  • 亜種として以下のようなものも考えられる:
    • 混雑度 = 特に重要なアトラクションの待ち時間の合計/平均 (特に重要 = ファストパス持ち とか)
    • 混雑度 = アトラクションの重要度によって変化する重み付き和

Lv.2: 各アトラクション・各 period ごとの待ち時間

特徴

Lv.1: 日時情報のみ

  • 3月と8月は長期休暇だから人が多いとか、土日は人が多いとかは基本中の基本
  • 年月日と曜日のみを特徴として利用
  • 各値 (year, month, day, weekday) は OneHot にエンコーディングする

Lv.2: 天候情報の追加

年月日
平均気温(℃)
降水量の合計(mm)
最高気温(℃)
最低気温(℃)
平均風速(m/s)
  • 実際の天候を使うべきか、予報の天候を使うべきかは非自明だけどそんなに変わらなさそうな気がする

Lv.3: アトラクション・パレード情報等の追加

  • 新しいアトラクションの公開日とか、パレードが変わる日とかは客足が伸びそう
  • 自動でクロールしてきて特徴に含められると精度上がりそう
  • アトラクションの休止情報(メンテナンス) (showwin)

その他

  • 開園・閉園時間
  • 埼玉県民の日とか卒業式の日とか特殊な休日情報も良さそう (showwin)
  • ディズニーシー15周年とか、N周年記念で特別な行事をやっていると年間通して来園者数が増えそう (showwin)
  • 既存の混雑予想サイト の予想値 (showwin)
    • めっちゃ混む予想が出てる日はみんな避けるので逆に空いたりすることがありそう
    • どれぐらいの人がこれに影響されて行動しているのかは微妙