メルカリ 不正取引ユーザーを機械学習、ネットワーク解析で検出

このエントリーをはてなブックマークに追加


ユーザー間の取引がサービスの大きな要であるメルカリ。当然、不正取引は悩みの種だ。

そのメルカリは2019年5月、増田直紀上級講師(英ブリストル大学)、小舘俊(東北大学)と共同で、機械学習と「ネットワーク解析」と呼ばれるデータ解析方法を用いて不正取引を検出する研究成果をネットワーク科学の主要な国際会議である「NetSci 2019」で発表した。

ネットワーク科学とは

ユーザとユーザの取引関係はネットワークとして表すことができます。同様に、他の人間関係、経済現象、インターネット、交通網、生態系、遺伝子と遺伝子の関係など、様々な現象やデータはネットワークという共通言語で表すことができます。ネットワーク科学は、「つながりの科学」であり、ネットワークとして表されるデータから有用な情報を引き出したり、社会や科学などにその知見を応用することを目指す研究分野です。

「ネットワーク解析」を用いて不正取引を検出

メルカリはすでに、AIを活用した利用規約違反の商品・取引を自動検知する監視システムを導入している。さらに、カスタマーサービスによる目視により出品や取引を常時監視し、偽装品や盗品など出品禁止物の排除に努めているという。

機械学習と「ネットワーク解析」と呼ばれるデータ解析方法を用いて不正取引を検出する研究では、ネットワーク科学の第一人者である英ブリストル大学増田直紀上級講師のチームと共同で、ネットワーク解析の手法を用いて、不正取引を行ったユーザの検出を試みたという。

不正取引を行っているユーザの周りのネットワーク(取引関係)から不正取引ユーザーを検出する研究だ。

ネットワークから12個の特徴量を計算、機械学習

半年間の分析の結果、高い精度(※)で、あるユーザが不正取引ユーザーであるか、一般ユーザーであるかを分類、抽出できたという。

その際、テキストや画像の情報を使わなかったという。つまり、言葉通りネットワーク解析によって不正取引ユーザーを検出しているということだ。

研究開発チームまず、不正取引を行っているユーザの周りのネットワーク(取引関係)は、通常の取引を行っているユーザーの周りのネットワークとは異なっている場合が多いという仮説を立てた。

そして個々のユーザーの周りのネットワークから12個の特徴量を計算。これらの特徴量をもとに機械学習を行った。

その結果、平均取引回数や他のいくつかの特徴量は、一般ユーザと不正取引を行っているユーザーでは値が異なる傾向があり、それらの特徴量を用いた機械学習モデルは不正取引ユーザの同定に有効であることが判明したのだ。

メルカリから、共同研究成果を発表するなどのアカデミックな情報発信は初となる。

次々に新しい技術がが出てくる一方で、技術を使った“高度な不正”が増えるのは目に見える。そこに対して従来の手法で対応していては限界がくる。そこに対して企業も技術で対抗していくのは必須だろう。

紹介した研究論文は下記にて公開されている。
>> https://arxiv.org/abs/1906.07974

※誤検出の少なさと見逃しの少なさとのバランスを示す指標であるReceiver operating characteristic AUC, precision recall AUC ともに 0.94-0.99。
source:https://about.mercari.com/press/news/article/20190624_collaborative_research/