分類 (Classification) - noriko33/test00 GitHub Wiki
分類とは、既存のデータを元として、各レコードをターゲットとなるカテゴリもしくはクラスに割り当て(分類し)ます。例えば、既存の顧客データから、顧客が会員になるのかならないのかを分類し、その確率がどれくらいなのかを出力します。
上図の例では、「契約」列にYes/Noが入力されており、これをターゲットとして「分類モデル」を構築します。結果として、Yes/Noになるであろう条件群がモデルとして作成されます。このモデルに新規顧客データをあわせることで、その顧客が契約をしてくれるかどうかを判別することができます。
Oracle Data Miningは、この分類のためのアルゴリズムとして以下の4つのアルゴリズムを提供しています。
分類モデルの活用例
- ロイヤルカスタマーの予測
- 稼働会員から外れる会員の予測
- 優良商品へ成長する製品の予測
- インバウンドニーズのある店舗の予測 など
分類モデルのサンプル
-
シナリオ データベース表「INSUR_CUST_LTV_SAMPLE」を学習データとして分類モデルを作成します。 この表には1レコードに各種顧客情報およびとある保険商品を購入したか否かのデータ(Yes/No)を保持しています。 SQL Devの表の図 上図の「BUY_INSURANCE」列をターゲットとして「CUST_ID(顧客ID)」ごとに保険を購入するか否かを分類するモデルを作成します。
-
環境およびデータの準備 Oracle Data Miningを使用できる環境を用意し、SQL Developer上でData Minerを設定する際に「サンプル・・・(要確認)」をチェックするとサンプルデータが準備されます。
-
ハンズオン資料 // 五十嵐さんの公開まち