IoTの普及により、膨大なデータをリアルタイムで処理する必要性が高まり、エッジAIが注目されています。特に、自動運転やFA機器などは高いリアルタイム性が求められる場面では需要が大きいです。また、クラウドAIは通信量の低減やセキュリティなどが課題となりますが、エッジAIは組み込み機器上で処理が完結できるというメリットがあります。
ただし、エッジ上ではクラウドのような複雑で大規模な処理は向かないというデメリットがあります。さらに処理内容によっては、AIモデルの軽量化を行い、より高速に動作させるための工程が必要になる場合があります。軽量化についてはまた別記事で解説したいと思います。
製造業を中心に需要が広がりつつあるエッジAIですが、実装する上で重要となるのがハードウェアの選定です。最近ではエッジ用AIチップとして、CPUやGPU、FPGA、AIアクセラレータなど様々なプロセッサで構成されたものが存在します。
本日はエッジAI向けのプロセッサについて4つ紹介し、それぞれの特徴について解説していきたいと思います。
CPU
AI処理を行うのにCPUを使うというのは、あまりイメージできないかもしれません。汎用的な処理が可能な一方で、AIと相性が良い並列処理は苦手な傾向にあるためです。
しかし、よく話題になる「AIのプライバシー保護問題」を考えた場合、CPUは一つの選択肢となり得ます。AIを利用するには個人のデータを収集し、解析する必要があるため、プライバシー保護技術に重きを置いたAI技術が必要となります。CPUは他のプロセッサと異なり、データを暗号化した状態でメモリ内での計算を実現することができるため、ハードウェア攻撃やプロセス内攻撃、OSによる攻撃などの脅威への対策がしやすいです。
また、CPUでも工夫次第では、GPUなどの他プロセッサに近い推論速度を達成できます。例えば、インテルのOpenVINOは、AIモデルを最適化させるためのツールとして有名であり、モデルを高速化させるための最適化や量子化、並列化などをスムーズに実装できます。
一方で、他プロセッサと比べて価格はやや高い傾向にあります。また、並列化の観点ではAIと相性があまり良くないため、処理性能も最適化しない状態では劣ってしまうという特徴もあります。
GPU
今日の第三次AIブームがあるのは、ビッグデータと汎用GPUコンピューティングの急速な進化のおかげです。サーバやPCでのDeep Learningに欠かせないGPUは、並列処理の観点でAIと相性が良く、NVIDIA社のグラフィックボードを中心にもはや必須のハードウェアとなっています。
組み込み用として有名なNVIDIA Jetsonは、GPU SoCが搭載されており、非常に強力なマシンパワーを発揮できます。画像認識などの非常に処理負荷が大きいアプリケーションでも、高速にリアルタイムで処理させることができます。
一方でデメリットもいくつかあります。例えばコスト面で、先ほどから例に挙げているNVIDIA製品なども他のプロセッサに比べて高価な場合が多いです。またGPUは、非常に電力の消費が激しいため、組み込み製品として採用する場合は注意が必要となります。特に自動車やドローンなどは消費電力をかなり気にする場合が多いので、安易にGPUを選定できないことがあります。
FPGA
FPGAとは、Field Programmable Gate Array の略で、ハードウェア回路をソフトウェアで定義し、かつ、プログラマブルなので、書き換えると違う動作をすることができる半導体です。低消費電力、スループットが高い、低レイテンシ、そして柔軟な実装が可能であることから、エッジAIとして近年注目されています。
代表的なところでXilinx社のFPGAなどがあり、基本的にハードウェアで演算するので、GPUよりも圧倒的に高速に動作できます。消費電力も低いため、自動運転などにも採用される可能性があると考えています。
デメリットはある程度ハードウェアの知識がないと実装が難しいところです。最近はFPGA上にAIをすばやく実装できるプラットフォームなどがありますが、それでも実際にやってみるとかなり実装に苦戦することが分かります。AIや機械学習のことだけでなく、ハードウェアの知識を高度なレベルで身につけている技術者は意外と限られているため、ある意味一番の課題となるかもしれません。
ASIC
ASICはApplication Specific Integrated Circuitの略で、特定の処理向けに組まれた専用回路であり、AI処理向けに特化したものがいくつか存在しています。
特定のAI処理向けに最小限の回路で実装されているため、非常に安価に入手できるのが特徴です。また、ハードウェア上ですでに専用回路が組まれているため、高速にアプリケーションを動作させることができ、消費電力も少ないです。自動運転向けだとルネサス社のR-Car V3HやNXPセミコンダクターズ社のS32V234などが有名です。
デメリットは柔軟性があまりないことです。専用回路として実装されているため、特定の用途以外の処理が実行しにくいです。基本的にAIや機械学習は、最新の技術がどんどん出てくるため、柔軟に実装できないのはつらいところだと思います。実行する処理が決まっていて、量産向けの場合は選択肢としてありだと思います。
まとめ
組み込み型エッジAI向けプロセッサとして、CPU、GPU、FPGA、ASICの概要と特徴について紹介しました。各プロセッサを比較すると下記のような結果になると思います。
デバイス | CPU | GPU | FPGA | ASIC |
コスト | △ | × | △ | 〇 |
スループット | △ | 〇 | ◎ | 〇 |
柔軟性 | ◎ | 〇 | ◎ | × |
消費電力 | 〇 | × | 〇 | 〇 |
実装容易性 | 〇 | 〇 | × | △ |
現状、どのプロセッサが一番良いというのは無く、用途やアプリケーションなどによって選択はかなり変わると思います。それぞれの目的に応じたプロセッサを選定していけたらなと思います。それではまた!
コメント