(DeNAのエンジニアブログに寄稿したものをそのまま引用)
今回私が参加したのは「 Facebook AI Image Similarity Challenge 」というFacebook AI主催のコンペで、約4ヶ月間にわたって画像のコピー検知の性能を競いました。なんと言っても20万ドルという賞金総額の高さには目を見張るものがあり、自分のようにお金に釣られた参加者はたくさんいたのではないでしょうか。また、本コンペは「NeurIPS 2021 competition track」に採択されており、入賞者は NeurIPSのワークショップ で発表できる特典付きとなっています。
一言で言うと、↓のような画像のコピー(改ざん)を検知するタスク(copy detection)
やることを単純化して言ってしまうと、画像をベクトル化して、類似サンプルを引っ張ってくるだけなので、実質画像検索。
与えられたデータは3つ:
改ざん済みの画像セット。画像の枚数は5万枚。いろんな加工が施されている。
↓ stage1のquery setの画像例。
↓stage2のquery set。stage1より加工が激しい。
改ざん元の候補の画像のセット。画像の枚数は100万枚。