apriori法はどうやって使うの?

アプリオリアルゴリズムは、頻繁アイテムセットと関連ルールを抽出するために使用されるアルゴリズムです。主な思想としては、イテレーションによって候補アイテムセットから頻繁アイテムセットを見つけだし、頻繁アイテムセットを使用して次回の候補アイテムセットを生成します。

Aprioriアルゴリズムを使用する手順を以下に示します。

  1. データセットの準備: データセットを二次元リストまたはトランザクションデータベースとして表す。
  2. 用途に応じて、出現頻度のしきい値である最小サポート度を設定します。サポート度は、データセット内で特定のアイテムセットが出現する頻度を指します。
  3. データセットをスキャンし、各アイテムのサポート数をカウントし、サポート数が最小サポート数を超えた場合は、頻繁な 1 項目セットとしてそれを選択します。
  4. 頻繁k項集合の前k-1項が同じ集合を結合して、候補k+1項集合を生成する。
  5. データセットのスキャン: 候補セットのデータセット内のサポート度を計算する。
  6. サポート度が最低サポート度以上の候補アイテムセットを生成:新しい頻繁アイテムセットとして。
  7. 反復: 頻繁項目集合が空にならない限り、候補項目集合の生成、支持度の計算、頻繁項目集合の選別を続ける。新しい頻繁項目集合が生成されなくなるまで、この作業を行う。
  8. 頻出アイテムセットから関連ルールを作成する: 各頻出アイテムセットに対し、そのすべての非空部分セットを生成し、信頼度(ルールの信頼性)を計算し、最小信頼度閾値を超える信頼度を持つ関連ルールを抽出する。

以上でAprioriアルゴリズムの基本的な利用步骤を説明しました。実際利用においては、必要に応じてアルゴリズムを最適化および改良できます(例:剪定法の使用、候補セット生成の削減)。

bannerAds