事前学習済みモデルを積極的に活用すべき3つの理由

こんにちは、ガロガロニーです！

自社で機械学習システムを取り入れたいと考えたとき、ラベル付けしたデータを大量に用意したり、モデルを構築するのに長時間学習を回すのが、大変だと感じる方が多いのではないでしょうか？

多くの企業が実際のビジネスデータを活用したいと考えたとき、機械学習モデルを一から作成するという方法を最初に考えがちですが、その前に検討してほしいことがあります。それが事前学習済みモデルの活用です。

解決したい課題にもよりますが、事前学習済みモデルを活用することで、すばやくより精度の高い機械学習モデルを構築することが可能です。

本日はAIプロジェクトで事前学習済みモデルを積極的に活用すべき理由について、3つ紹介したいと思います。

理由1：すでに優秀な事前学習済みモデルが多く存在するため
理由2：少量の訓練データで、性能を発揮できるため
理由3：最小限の計算資源で、学習時間を短縮できるため
まとめ

理由1：すでに優秀な事前学習済みモデルが多く存在するため

世の中にはすでに有識者たちが作った優秀な事前学習済みモデルで溢れています。例えば、深層学習フレームワークとして有名なKerasでは、ImageNetという大量の画像データを使って、1000クラスの画像分類を高精度できるモデルを公開しています。画像の物体検出なども、YOLOv4などの優秀なアルゴリズムを適用したモデルを使えば、下記のような人物追跡システムも容易に実装できたりします。

https://github.com/theAIGuysCode/yolov4-deepsort

またAzure Machile Learningなどのクラウドサービスでも、様々な用途に応じた事前学習済みモデルを公開しています。もし自社で構築したい機械学習システムを、このようなモデルを使って実現できるのであれば、利用しない手はありません。積極的に活用していきましょう。

理由2：少量の訓練データで、性能を発揮できるため

自社でモデルを構築する際の大きな課題のひとつに、正解データのラベル付け作業（アノテーション）があると思います。この作業はモデルを一から学習させようとすると、大量の正解データが必要となるため、その準備のために多くの時間を消費してしまいます。せっかく自社に利用したいデータがあっても、アノテーションのせいで、AI導入を諦めてしまう企業も多いのではないでしょうか？

そういった状況の場合、なおさら事前学習済みモデルの利用をおすすめします。事前学習済みモデルの中に、自社の実現したい機能と完全に合致するものがなくても問題ありません。そのような場合は、転移学習と呼ばれるテクニックを活用していきましょう。このテクニックを利用することで、事前学習済みモデルと、自社の少量のラベル付けされたデータセットのみで、簡単にモデルを構築することができます。

しかも大抵の場合、一から学習したモデルよりも、転移学習で作ったモデルの方が精度が良い場合が多いです。これはあらかじめ大量のデータで、様々な特徴量を学習しているためです。そのため、せっかく工数をかけて、一からモデルを作ったとしても、性能が上がるとは限らないのです。そうであれば、なおさら事前学習済みモデルを積極的に利用すべきでしょう。

理由3：最小限の計算資源で、学習時間を短縮できるため

事前学習モデルの活用方法には、大きく二つあります。一つ目は事前学習済みモデルをそのまま利用する方法で、二つ目が理由2で述べた転移学習を利用する方法です。

事前学習済みモデルをそのまま利用できる場合、そもそも学習という工程が不要です。本来、モデルの学習には、GPUなどの豊富な計算資源を必要とし、処理時間もかなりかかることが多いため、この工程を飛ばせるのは大きなメリットになります。転移学習を利用する場合でも、モデルの一部のパラメータのみ再学習させるため、最初から学習させるよりもはるかに短い時間で学習を終わらせることができます。

事前学習済みモデルを利用し、最小限の計算資源ですばやくモデルを学習できれば、AI導入にかかるコストもかなり抑えられます。特にビジネスでAI導入を目指す場合は、事前学習済みモデルの利用した方が良いと思います。

まとめ

本日はAIプロジェクトで事前学習済みモデルを積極的に活用すべき理由について、3つ紹介しました。昨今の急激なAI技術の発展とともに、ビジネスでも利用できる優秀な事前学習済みモデルがますます増えてきたように感じます。モデル構築を最初から実施するよりも、すばやく性能の良い機械学習モデルが構築できるので、ぜひ事前学習済みモデルを積極的に活用してほしいなと思います。

それではまた！