更新日: 2025年8月18日
問題
eVar/Prop 項目の中には、重複して出現するはずがないにもかかわらず、重複して出現するものがあります。例えば、注文 ID の場合、一部の注文 ID が複数回出現することがあります。
さらに分析を進めると、異なる行動フローで同じ注文IDが生成されていることが判明しました。これは、この注文を1人の人物が行ったことを示しています。
しかし、システム設計では注文IDは一意であると規定されているため、競合が発生しています。何が問題だったのでしょうか?
原因
これはハッシュ衝突が原因です。
Adobe Analytics は、ディメンションのデータを収集する際、文字列が数バイトであろうと数百バイトであろうと、パフォーマンス向上のためにハッシュ値に変換します。この処理では32ビットハッシュが使用され、理論上は2³²(約43億)通りのハッシュの組み合わせが可能です。しかし、ディメンションのデータ量が多い場合、2つの異なる値が同じハッシュ値を生成する可能性があります。これはハッシュ衝突と呼ばれます。
ハッシュ衝突は、Workspace と ReportBuilder で発生する可能性があります。
解決策
- ハッシュ衝突の影響を受けない Warehouse を使用します。
- 期間の変更:期間を短くすることで重複の可能性を減らします。
- 一意の値の数を減らすことで重複の可能性を減らします。