分類 (Classification) - noriko33/test00 GitHub Wiki

分類とは、既存のデータを元として、各レコードをターゲットとなるカテゴリもしくはクラスに割り当て(分類し)ます。例えば、既存の顧客データから、顧客が会員になるのかならないのかを分類し、その確率がどれくらいなのかを出力します。

classification

上図の例では、「契約」列にYes/Noが入力されており、これをターゲットとして「分類モデル」を構築します。結果として、Yes/Noになるであろう条件群がモデルとして作成されます。このモデルに新規顧客データをあわせることで、その顧客が契約をしてくれるかどうかを判別することができます。

Oracle Data Miningは、この分類のためのアルゴリズムとして以下の4つのアルゴリズムを提供しています。


分類モデルの活用例

  • ロイヤルカスタマーの予測
  • 稼働会員から外れる会員の予測
  • 優良商品へ成長する製品の予測
  • インバウンドニーズのある店舗の予測 など

分類モデルのサンプル

  • シナリオ データベース表「INSUR_CUST_LTV_SAMPLE」を学習データとして分類モデルを作成します。 この表には1レコードに各種顧客情報およびとある保険商品を購入したか否かのデータ(Yes/No)を保持しています。 SQL Devの表の図 上図の「BUY_INSURANCE」列をターゲットとして「CUST_ID(顧客ID)」ごとに保険を購入するか否かを分類するモデルを作成します。

  • 環境およびデータの準備 Oracle Data Miningを使用できる環境を用意し、SQL Developer上でData Minerを設定する際に「サンプル・・・(要確認)」をチェックするとサンプルデータが準備されます。

  • ハンズオン資料 // 五十嵐さんの公開まち