• ホーム
  • AI(人工知能)
  • AI解析用の映像データを従来の10分の1に圧縮!クラウド活用で防犯等の社会課題の解決に貢献

AI解析用の映像データを従来の10分の1に圧縮!クラウド活用で防犯等の社会課題の解決に貢献

メインビジュアル : AI解析用の映像データを従来の10分の1に圧縮!クラウド活用で防犯等の社会課題の解決に貢献

目次


5GとAI解析の実用化に伴い質・量ともに増加する映像データをICTで自動処理

2020年からサービスが開始された5G(第5世代移動通信システム)は高速大容量、多数同時接続、低遅延を可能とする通信システムです。高速大容量通信が可能なことから、大容量の映像データもスムーズにやり取りできるようになります。

5Gのサービス開始に伴い、今後、個人間の動画メッセージや動画広告をはじめ、4Kや8Kの高性能カメラで撮影した超高精細な映像データや、街頭・製造ライン等に設置された多数のカメラの映像等、送受信される映像データの量が爆発的に増大すると考えられています。

また、映像データは、他のデータに比べ非常に多くの情報が含まれています。高精細な映像データをICT(情報通信技術)でサイバー世界にとりこみ、AI(人工知能)で自動的に解析すれば、大量のデータから得られる気づきや洞察をデジタルマーケティングや製造業における品質検査、防犯・監視、無人店舗、自動運転等様々な分野で活用できます。

5Gの利用が本格化することで、送受信される映像データの量が急激に拡大するだけではなく、映像データをAIで解析して活用しようというニーズもますます増加していくと予測されているのです。

クラウドで大量の映像データをAI解析するためには品質を落とさず高圧縮する技術が必要

膨大な映像データをAIで解析する場合、計算パワー確保のためにクラウドと連携した処理が有効です。しかし、映像データはそもそものデータサイズが大きく、また、映像が高精細になるのに比例してデータサイズはさらに大きくなります。

クラウドでの映像解析を行う場合、通常はカメラ映像を無線ネットワークで伝送し、それらを基地局で受信して集約し、クラウドまではキャリアのコア網やインターネット等の有線ネットワークで伝送するということが行われます。この時、カメラから基地局までは5Gを適用することで問題なく伝送できるのですが、基地局からクラウドまでの有線ネットワーク帯域を逼迫することが懸念されます。

これを避けるために、映像データを圧縮することでデータサイズを小さくすることはできますが、既存の方法は、人間による視認を目的とした圧縮技術であるため、AIの認識率が低下しない(維持できる)映像品質で要求されるデータサイズまで高圧縮にできない問題がありました。

そこで、ネットワーク帯域を逼迫させず、かつAIが認識できるよう映像データの品質を落とさずにクラウドへ送信できる高圧縮技術が必要とされていたのです。

映像のAI解析の特性に着目し、映像データのサイズを従来の10分の1まで圧縮可能に

ネットワーク帯域を逼迫させずに大量の映像データをクラウドに伝送するという課題に対して、富士通研究所はAIが認識できる画質を維持しつつ、映像データのサイズを従来の映像圧縮技術に対して10分の1まで高圧縮する技術を開発しました。

この技術は、AIが映像を認識する際に重視する画像の領域が、人間が目視で確認する領域とは異なることに着目し、AIが重視する領域は残しつつ、他の領域を大幅に圧縮するというものです。AIが認識できる必要最低限な画質にまで映像データのサイズを小さくすることで、クラウドに送ることを可能にしたのです。

図 : AIが映像を解析するために必要最低限な画質レベルまで映像データを高圧縮することが可能に

AIが映像を解析するために必要最低限な画質レベルまで映像データを高圧縮することが可能に

今回の技術のポイントは、AIが注目している領域(認識に必要な重要な特徴)を「過度に圧縮しない」ようにしたことです。ここを圧縮しすぎると認識率が低下します。

そこで、今回の圧縮技術では映像データの1コマ1コマに対してAIが「どこを認識しているのか」を自動的に解析して、AIが映像を認識するために必要な領域は低圧縮に、不要な領域は高圧縮にするように圧縮率を自動推定し、適用しました。

さらに、圧縮して伝送した後に復号した映像によるAIの認識精度の結果をフィードバックすることで、AIの認識精度を維持しつつデータサイズを必要最低限にまで圧縮することを可能にしました。

クラウドに映像データを高圧縮で伝送し、様々なデータと組み合わせた高度な解析を可能に

富士通と富士通研究所では今回開発した技術を検証するため、実際に工場で梱包作業を行っている複数の作業員の様子を4Kの超高精細カメラで撮影した映像を使って実証実験を実施しました。その結果、AIの認識精度が劣化することなくデータサイズを従来の10分の1に圧縮できることを確認しました。
本技術を活用することで、伝送回線コストを大幅に削減しつつ、様々な時間や場所から収集されてクラウド上に蓄積されている複数の映像データの解析が可能となります。

また、センサー等のIoTデバイスから送られてくるデータやクラウド上に蓄積されている映像以外のデータを組み合わせることにより、より高度なデータ解析が可能になることが期待できます。

映像のAI解析を安全安心や働き方改革等の社会課題の解決に活用

AIを活用した映像解析は、今後、様々な業種におけるデジタルトランスフォーメーション(DX)を推進する原動力の1つとして注目されています。

街中や建物内に設置された大量のカメラにより、高精細な映像データが爆発的に増加することが予測される今、それらの映像データから価値ある情報を抽出し、予測や判断に活用することは、社会課題の解決にも繋がります。

例えば、店舗におけるユーザの導線やPOSデータ等と映像データと組み合わせることで、ユーザ属性による購買動向を分析することにより、マーケティングに活用できる可能性が考えられます。

その他、工場における製造品質の検査や無人店舗への導入等、人手不足が課題となっているビジネスの分野に活用すれば、働き方改革に繋がります。また、カメラによる防犯や監視、自動車の自動運転技術に活用すれば、安全かつ安心して暮らせる社会の実現が期待できます。

様々な映像解析で本技術を活用するために、富士通と富士通研究所では、解析対象の撮影条件、動き、大きさ等、実適用で想定される各種ケースにおいて評価し、さらなる圧縮性能の向上のための研究開発を進め、2020年度中の実用化を図ります。