機械学習キャンバスを活用して、成功する機械学習プロジェクトの要件を利害関係者の間で共有する

予測をするのは難しい、未来についてはなおさらだ。(ヨギ・ベラ)注1)


【対象とする皆様】

  • 人工知能(機械学習)を活用したPoC(概念実証)や試行実験を企画しようとしている方々
  • 人工知能(機械学習)を活用したPoC(概念実証)や試行実験が上手く進捗していない方々
  • 顧客企業に対して、人工知能(機械学習)の導入や活用を支援するコンサルタント、システムインテグレーター、テクノロジープロバイダーの方々

精緻なモデル構築テクノロジー、大量の利用可能なデータ、コンピューターの処理能力という3つの要素の進化に伴って、幅広い領域における人工知能の活用が期待されるようになってきました。しかしながら、一部の企業が人工知能の活用によって大きな成功を収めている一方で、多くの企業がPoC(概念実証)や試行実験の段階で挫折しているというのも事実です。これは、人工知能テクノロジーが未成熟であるというよりも、成功するために必要な要素を適切に定義していなかった、または曖昧に定義されていたことに起因します。ここでは、失敗リスクを減らす機械学習プロジェクトの要点についてご紹介していきます。 

意思決定、トレードオフ、予測という3つの重要なコンセプト

人工知能/機械学習は、結局のところ、私たち人間に代わって何かを予測してくれるシステムと言えます。したがって、機械学習プロジェクトを通じて構築しようとしている対象を「予測システム」と呼ぶことにします。ここで言及する予測とは、「欠落しているデータを補充するプロセスであり、手持ちのデータを利用して、まだ持っていないデータを生成すること」を意味します。注2)私たちが知っているプロダクトやサービスの中で、実は多くの人工知能による予測が実行されています(図1)。 

様々なプロダクトやサービスで実行されている予測

(図1)様々なプロダクトやサービスで実行されている予測

それでは、なぜ私たちは予測を必要とするのでしょうか?それは、日常生活やビジネスの場面において、適切な意思決定をしたいからです。意思決定とは、「あらかじめ定義されたロジック用いて、1つ以上のインプットデータ(判断材料)からアウトプットデータ(結論)を導き出そうとする行為」を意味します。実際に、ビジネスの様々な場面において、多くの意思決定がなされています(図2)。 

様々な場面でなされている意思決定

(図2)様々な場面でなされている意思決定

重要な意思決定をしなければならない際、そこにはトレードオフが存在します。トレードオフとは、「一方を追求すれば、他方を犠牲にせざるを得ない状態や関係のこと」を意味します。プロダクトやソフトウェアの開発における評価指標であるQCDF(品質、コスト、納期、柔軟性)は、典型的なトレードオフです。その他の領域においても、多くのトレードオフが存在します。私たちは、「効率化」や「最適化」といった言葉を頻繁に耳にしたり、口にしたりすることがありますが、これらの言葉の背後にはトレードオフが存在していることがあります(図3)。

 

ここで重要なポイントは、「何を知る(予測する)ことができたら、これらのトレードオフを解消/軽減することができるだろうか?」、次に「そのためには、どのようなデータが必要だろうか?」と自問してみることです。

様々な領域に存在するトレードオフ

(図3)様々な領域に存在するトレードオフ

機械学習プロジェクト推進に関する5つのステージ

予測システム構築に対する機械学習プロジェクト(PoCを含む)は、「選択する」「定義する」「学習する」「予測する」「評価する」という5つの大きなステージから構成されます(図4)。

機械学習プロジェクト推進に関する5つのステップ

(図4)機械学習プロジェクト推進に関する5つのステップ

選択する

このステージの大きな目的は、前述した意思決定、トレードオフ、予測という3つの要素から、対象領域の棚卸しをし、機械学習プロダクトに対する適切な領域を優先付けしながら選択していくことです。以下の視点から優先付けしていくとよいでしょう。

  • 一定期間の中で、多くの意思決定がなされる
  • 意思決定に必要な時間が制約されている
  • 意思決定の中に、ビジネスのパフォーマンスに大きな影響を与えるトレードオフが存在している
  • 意思決定に必要とされるインプットとアウトプット(教師あり機会学習)を定義することができる
  • 意思決定のロジックをルールベース(例.もし..であれば、..する)で定義することが難しい
  • 予測に必要とされるデータがすでに存在する、または獲得することができる

機械学習キャンバスの活用

適切な対象範囲を選択したら、残りのステージに対して必要な要素を、プロジェクトメンバーを含む利害関係者の間で定義、共有、可視化していくための機械学習キャンバス 注3)というツールを活用して整理していきます。機械学習キャンバスは、プロジェクトを推進していくために必要なゴール学習予測評価という4つの大きなパートから構成されます(図5)。 

機械学習キャンバス

(図5)機械学習キャンバス

定義する

このステージの大きな目的は、機械学習プロジェクト(予測システムの構築)のゴールを、価値提案という言葉を使って明確に定義することです。価値提案には、以下の項目が含まれます。

  • 予測システムによってベネフィットを受ける最終的な利用者は誰か?(Who)
  • その利用者に対して何の価値を提供するのか?(What)
  • なぜそれを提供することが重要なのか?(Why)

また、プロジェクトの適切な期間、適切な投資額、ビジネス上のROI算出の方法についても定義しておくことが必要でしょう。

 

学習する

学習ステージの大きな目的は、プロジェクトのゴールとしての価値提案を実現するために、システムが学習する方法(How)を定義することです。このステージと次の予測パートは相互に依存する関係にあるため、同時に検討していきます。機械学習キャンバスにおける学習パートは、以下の4つの要素から構成されています。

  • データソース - 利用することができるデータソース(例.内部または外部データソース)は何か?
  • 特徴 - データソースから抽出されるインプットの特徴量(例.属性や変数)は何か?
  • データ収集 - インプットとアウトプットから学習するために、どのように新しいデータを獲得するのか?
  • モデル構築 - いつ新しいトレーニングデータでモデルを生成/更新するのか?どれくらいの期間でトレーニングデータの特徴を選択し、モデルを生成するのか?

 

予測する

このステージの大きな目的は、プロジェクトゴールとしての価値提案を実現するために、システムが予測する方法(How)を定義することです。機械学習キャンバスにおける予測パートは、以下の4つの要素から構成されています。

  • 機械学習タスク - インプット、予測すべきアウトプットとそのタイプ(例.回帰、識別、ランキング)は何か?
  • オフライン評価 – 予測システムの実装前に、それを評価するための方法や指標は何か(例.予測値vs実測値)?
  • 意思決定 - 最終利用者の意思決定に対して、どのように予測が活用されるのか?
  • 予測実行 - いつ、どれくらいの期間で、新しいインプットを使って予測するのか?

評価する

このステージの大きな目的は、予測システムの実装後にそれを評価するための方法や指標を定義し、監視することです。

解約防止のケース

機械学習プロジェクトにおける5つのステージは、ウォーターフォール型(直線的)というよりも、小さな積み重ねによる反復作業を必要とします。特に、学習ステージと予測ステージは段階的かつ相互に洗練させていく必要があります。

 

最後に、マーケティング領域における解約防止を目的とした初期のシンプルな機械学習キャンバスのサンプルを掲載しておきます(図6)。

解約防止のケース

(図6)解約防止のケース

注1)米国MLBのプロ野球選手で、長年ヤンキースの捕手を務めた。

注2)この章の多くは、書籍「予測マシンの世紀」からヒントを得たものである。

注3)米国のテクノロジーコンサルタントであるルイス・ドラード氏によって開発されたオープンソースツール。


【お問合せ】

ビジネスイノベーションハブでは、機械学習プロジェクトに関する各種サービス(ワークショップ、プロジェクト支援、人材育成プログラムなど)をリーズナブルな料金で提供しています。ご要望やご用命の方は、こちらよりお気軽にお問合せ下さい。 

シェアをお願いします!