この記事を読むのに必要な時間:およそ 1 分
※「ディープラーニングを支える技術「正解」を導くメカニズム[技術基礎]』第1章より。
毎日,多くの人が写真や動画を撮影し続けているスマートフォン搭載のカメラ。2000年に日本発のシャープ製カメラ内蔵端末「J-SH04」の爆発的ヒット以来,ずっと身近で欠かせない存在ではないでしょうか。
スマートフォンのカメラは需要と相まって急激に進化し続けており,今の性能は近距離や逆光,星空も楽々で,高精細なデジタルズームやポートレートまで従来のデジタル一眼レフなどの単体の高性能カメラの仕上がりに匹敵するほどです。この小さなカメラで,いったいどうしてこれほど綺麗な画像や動画を撮ることができるのでしょう。その背景には,
- 機種ごとに設計されたカスタムSoCというハードウェア
- ディープラーニング/機械学習を中心としたソフトウェア/アプリケーション
- ユーザーから生まれる各種の膨大なデータ
の存在があるようです。ここでは最近の話題に事欠かない上の二つについて見てみます。
カスタムSoC
Socは「エスオーシー」「ソック」と呼ばれる「System-on-a-chip」の略称です。一つのチップ上に各種回路を組み込んで一つのシステムとして動作させる設計手法とその手法で作られたチップを指します。
スマートフォンは機種ごとにカスタマイズされたSoCを内蔵し,機械学習/AIエンジンを搭載しています。スマートフォンに載ったAI対応SoCチップは,とくにカメラ撮影の画像/動画処理で使われています。カスタムSoCの設計や製造には多大なコストがかかりますが,スマートフォンでは撮影した画像や動画の品質が製品の差別化要因になっており,画像品質の向上に使われることでチップのコストが回収できているようです。
ディープラーニング/機械学習
スマートフォンでの撮影においてセンサーから画像/動画を出力するまでの多くのステップで,ディープラーニングや機械学習が使われるようになっています。
データから知識やルールをコンピュータ自身が獲得するしくみが機械学習であり,機械学習の中でも層数が多く幅の広い「ニューラルネットワーク」と呼ばれるモデルを使うアプローチがディープラーニングです。その実体は「膨大な関数の塊」です。
ディープラーニングは,コンピュータがデータからデータや問題の表現方法/特徴を学習する表現学習を実現することで,特徴設計などの職人芸的な工程が求められていたこれまでの機械学習にない,高い性能と柔軟性を兼ね備えています。身近なスマートフォンのカメラでも,画像認識による被写体の検出や分類,画像処理を筆頭に不可欠な技術で,この表現学習の実現がディープラーニングの成功につながっているといえます。
いずれも重要度の高さもあって技術の進化の早い分野ですが,しくみや考え方を一度学ぶと長く役立つ分野の一つです。一枚の写真,一本の動画の背景に,最先端のハードウェアとソフトウェア,膨大なデータの積み重ねがある,そんな身近なところから学んでみませんか。