Deep Percept

OFFICIAL BLOG

AML/CFTにおけるAI・機械学習の活用方法

はじめに

こんにちは。開発チームの氏弘です。

前回の記事でAML/CFTの概要と課題をご紹介しました。

AML/CFT業務において、大量の顧客・取引情報の中から高リスクな顧客・取引を人手で検知することが難しくなってきており、システムによるサポートや自動化の仕組みが求められています。既存のシステムでは主にルールエンジンベースの不正検知が用いられていましたが、近年は機械学習の活用事例が増えてきました。今回の記事ではルールエンジン・機械学習の特徴を整理し、機械学習の活用例についてご紹介します。

ルールエンジンと機械学習のメリット・デメリット

ルールエンジン、機械学習どちらも万能ではないため、それぞれの特徴を把握し適切に使うことが業務の効率・高度化には必要であると考えています。

  精度 メンテナンス性 結果解釈性
ルールエンジン ×
機械学習

ルールエンジンのメリット

  • エンジニア・データサイエンティストではない金融機関職員がルールの追加・修正・削除ができる。
  • ルールは言語化できるので規制当局に対して不正理由を説明しやすい。

ルールエンジンのデメリット

  • ルールの仕様が属人化しやすく、全容を把握する人が限られてくるのでルールの追加・修正・削除が難しくなる。そのため、冗長なルールや陳腐化したルールがいつまでも生き続ける傾向がある。
  • 誤検知が多い。不正の疑いのある取引は調査しなければならないので、誤検知が多いとオペレーションコストが増える。

機械学習のメリット

  • 誤検知数がルールエンジンより少ない傾向にある。ルールエンジンの場合、メンテナンスを考慮すると数十くらいの変数しか扱えないが、機械学習の場合は数千から数万の変数から不正検知が可能。多数の変数が扱えると様々なパターンを検知できるので正常/不正の見極めの高度化に繋がる。
  • 大量のデータから異常パターンを機械的に洗い出すことができ、人間やルールエンジンでは発見できなかった不正取引が検知できる。
  • 非構造化データ(文書、画像、動画、音声)に対しても効果的な分析ができるため、より高度なサポートが可能。

機械学習のデメリット

  • 不正検知理由の把握が難しい。
  • 学習に使うデータの質が悪い・量が少ないと高精度な予測モデルが作成できない。精度検証を十分に行わないで質の悪い予測モデルを使った場合、業務に混乱が生じてしまう。

機械学習の活用例

リスク低減措置業務の顧客管理(CDD)と取引モニタリングにフォーカスを絞り、機械学習の活用例を紹介します。

顧客管理(CDD)における機械学習活用例

1.文書検索

機械学習(自然言語処理)を使うことで、顧客リスク格付けに影響を与えそうなニュースや文書の検索自動化が実現できます。検索理由(判断根拠)となった文章の抽出機能を一緒に付与することで、人による確認作業の効率化が期待されます。

2.ネットワーク分析

ニュースや取引情報から顧客同士の繋がりをネットワーク構造化することで、高リスク顧客との関連度合い(リンク予測)やネットワーク構造の異常度合いを顧客リスク格付けの材料に加えることができます。

3.顧客属性認識

機械学習(音声認識、自然言語処理)によって、顧客との会話情報(音声データ、チャットボットによるテキストベースの会話データ)から顧客属性に関わる情報を自動抽出、保存できます。

取引モニタリングにおける機械学習活用例

1.教師あり学習による取引リスク算出

ルールエンジンや手作業で不正であると判断した過去の取引情報・顧客情報を教師データに使うことで、取引リスク算出(不正取引検出)に特化した機械学習モデルを作成します。

ルールエンジンでは人手で行っていた取引リスク算出ロジックのメンテナンス作業を機械学習に委譲することになるのでロジックのメンテナンスを自動化できます。自動化のおかげで、日々変化する犯罪手法に対してロジックが追随します。

不正取引と正常取引の数がアンバランスなので、学習の時にダウンサンプリングするなどの様々な工夫が必要になります。

2.教師なし学習による取引リスク算出

教師あり学習、ルールエンジンによる仕組みでは過去に人間が不正であると認識した取引パターンだけしか対処できません。クラスタリングなどの教師なし学習によって未知の取引パターンの検知が可能になります。未知の取引パターンの場合に必ずしも不正取引とみなすことはできませんが、今まで見逃していた不正や新規不正の発見につながる可能性があるため重要な機能であると考えられます。

3.取引リスクの統合(アンサンブル)

教師あり学習・教師なし学習・ルールエンジンによる取引リスクの結果を元に最終的な取引リスクを算出します。取引リスクの統合(アンサンブル)手法は様々ありますが、代表的な手法は以下の2つです。

  • 各々の取引リスクに対して手作業で重み付けを行う。一律な重み付けをした場合は、最終的な取引リスクは平均値となる。
  • 各々の取引リスクに対して機械学習で重み付けを行う(教師あり学習)。

4.判断根拠の解析

規制当局や社内の報告書には不正取引であると判断した根拠を記載する必要があります。決定木やGLM,GAMといったアルゴリズムは解釈性が高いため判断根拠の分析が容易です。一方でディープラーニングや勾配ブースティングといったアルゴリズムの場合は、SHAPやLIMEといった説明性技術を用いて判断根拠の分析をする必要があります。

説明性技術の一つであるInfluenceを用いると、不正であると判断した取引に類似の過去取引を抽出することができます。過去の不正取引とその時の報告書を参考にして新たに発見した不正取引の報告書を作成できます。

5.フィードバック

取引リスク算出結果が誤っていた場合に、その時の取引情報・顧客情報を用いて再学習することで機械学習モデルの改善を行います。また、機械学習モデルの判断根拠を元にルールエンジンのルール改善を行います。

犯罪手法は日々変化していくため、機械学習モデル・ルールエンジンの継続的な改善が重要です。このように継続的な改善を実現するためにAIシステムの中に人による結果確認やフィードバックのフローを組み込むことをHuman in the Loopと言い、AIシステムに欠かせない仕組みです。

AML/CFTシステムの高度化に向けて

各金融機関が保持する顧客・取引情報を共有することで横断的な分析が可能になりルールエンジンや機械学習モデルの改善に繋がります。

しかしながら、個人情報・機密情報の扱いが難しいため実現は難しいと考えています。

横断的な分析を可能にするアプローチの一つとして、Federated Learningがあります。

Federated Learningはデータが保存されている環境で学習を行い、それぞれの学習結果を1つの共通モデルに反映する手法です。Federated Learningは携帯電話のキーボード入力の予測変換に活用されていますが、AML/CFTにおける活用事例はまだありません。

Deep Percept株式会社でも様々な機械学習手法を調査・研究しAML/CFTへ活用していきたいと思います。

まとめ

AML/CFTへの対応としてリスクベース・アプローチが推奨されており、その中でITシステムの活用も重要なファクターとなっています。ITシステム内でルールエンジン/機械学習どちらを使うにせよデータが重要であり、AI Readyな仕組みを構築しておくことが大切です。

AML/CFT業界でも機械学習を用いた改善事例が多数報告されており、今後も活用の幅が広がっていくと思います。

Deep Perceptは、一緒にAIソリューションの開発をしてくれる仲間を募集しています。
ご興味を持たれた方は是非こちらまで!
https://www.deep-percept.co.jp/recruit/

この記事をシェアする

この記事の投稿者

氏弘 一也(うじひろ かずや)

エンジニアです。マルチモーダルデータを扱った学習に興味があります。
機械学習の社会実装に向けて日々開発に取り組んでいます。
開発で得られた知見をブログで紹介していきます。

PAGE TOP