「Adobe Analytics」ハッシュ衝突とは何か

Adobe Analytics GA In JP 24時間前 11 ページビュー 0コメント

更新日: 2025年8月18日

問題

eVar/Prop 項目の中には、重複して出現するはずがないにもかかわらず、重複して出現するものがあります。例えば、注文 ID の場合、一部の注文 ID が複数回出現することがあります。

さらに分析を進めると、異なる行動フローで同じ注文IDが生成されていることが判明しました。これは、この注文を1人の人物が行ったことを示しています。

しかし、システム設計では注文IDは一意であると規定されているため、競合が発生しています。何が問題だったのでしょうか?

原因

これはハッシュ衝突が原因です。

Adobe Analytics は、ディメンションのデータを収集する際、文字列が数バイトであろうと数百バイトであろうと、パフォーマンス向上のためにハッシュ値に変換します。この処理では32ビットハッシュが使用され、理論上は2³²(約43億)通りのハッシュの組み合わせが可能です。しかし、ディメンションのデータ量が多い場合、2つの異なる値が同じハッシュ値を生成する可能性があります。これはハッシュ衝突と呼ばれます。

ハッシュ衝突は、Workspace と ReportBuilder で発生する可能性があります。

 

解決策

  • ハッシュ衝突の影響を受けない Warehouse を使用します。
  • 期間の変更:期間を短くすることで重複の可能性を減らします。
  • 一意の値の数を減らすことで重複の可能性を減らします。
Like (0)
私のコメントを投稿してください
コメントをキャンセル
表現

こんにちは:

  • ニックネーム (必須)
  • メールアドレス (必須)
  • URL