SSブログ

パターン認識 [雑感]

自分は、最近、仕事やプライベートの両側面において、”パターン認識”というキーワードを意識するようになった。AIや人間脳の処理において、結構この”パターン認識”というワードは旬な言葉で世間を飛び交っているので、なんとなく耳に入ってくるのだが、自分はその意味を真に理解はしていなかった。


でも自分が普段、仕事やプライベートで接するある瞬間のとき、これって人間のパターン認識なんじゃないかな、と漠然と思うときがある。もう毎回そう思うので、これは、きちんとパターン認識について勉強して、日記にきちんと書くことで、日頃の疑問を払拭したい、という狙いである。


major_img01.jpg


”パターン認識”というのは、画像・音声などの雑多な情報を含むデータの中から、一定の規則や意味を持つ対象を選別して取り出す処理のことをいう。


パターン認識には、音声データから人間の声を認識して取り出して命令として解釈する音声認識、画像データの中から文字を認識してテキストデータに変換するOCRとか、有名である。


さらに、画像認識であれば、画像データから、オブジェクト(文字/顔など)や、対象物の特徴(形状、寸法、数、明暗、色など)を抽出/分析/識別して認識検出することをいう。


パターン認識は、音声認識、文字認識、画像認識、顔認識、バイオメトリクスなど、いろいろな分野で活躍している。


いま昨今ではAIの勢いが凄くて、人間の脳を超えてしまうとか、AIが人間の仕事を奪ってしまうとか、盛んに言われていることだけれど、じつは、この人間が普通に兼ね備えている”パターン認識”という能力が、このコンピュータやAIにとって、すごく苦手な処理なのだそうだ。(笑)



コンピュータは数値計算などには非常な威力を発揮するが、人間が五感を通して容易に実現するパターン認識をまねることがむずかしいと言われている。人間のパターン認識の能力はきわめて優れているが、コンピュータにとってはもっとも苦手な処理の一つなのだそうである。


でも、いまや「パターン認識なくしてAIの進化なし」と言われるほど、我々の身近なところまでに忍び寄っているのだ。我々が普段何気なく使っている便利機能。そこにはパターン認識を備えたAI機能によるものだったりする。



001.jpg


人間というのは生まれた瞬間からすべてを知っているわけではない。親から言葉などを学び、そして学校で勉強することによって知識が蓄えられる。それはコンピュータも同じ。人間に覚えてほしいことを教えるように、コンピュータに覚えてほしいことを教えるのである。それが機械学習である。


機械学習というのは、元々は機械に数字や記号を覚えさせることがきっかけで始まりであった。でも情報というのはときには数式や記号では表せないこともある。人間の顔や建造物などはまさに論理的に処理できないもの。そこで活躍するのがパターン認識である。


パターン認識と機械学習を組み合わせることで、論理的には処理できない人間の顔などの物体も学習させることができた。これにより論理的な処理のほかに、パターン認識による処理も可能となり、結果的に機械学習の幅が大きく広がった。


そしてそれによりAIも進化したのである。



機械学習はもちろん、コンピュータを動かすにはアルゴリズムというものが必要になる。コンピュータはもちろん、Webサイト内のプログラムも全て、アルゴリズムを元に動いている。コンピューターのプログラム・ソフトを書いたことのある人ならわかると思うが、コンピューターの処理できるソフトってフローチャートで、YESかNOでどんどん進んでいく。


アルゴリズムと言っても、その種類は様々ある。基本的に一つのプログラムには必ず一つのアルゴリズムが設定されている。機械学習においても、記号や数字などを覚えるためのアルゴリズムが作られたからこそ実現したのである。


パターン認識も同じ。人間の顔や歴史的建造物などの画像や音声を機械に覚えさせるためのアルゴリズムができたからこそ、機械学習でパターン認識を取り入れることができたのである。AIやパターン認識、そしてそれらの元となる機械学習が進歩するには、アルゴリズムは非常に重要な存在なのである。


ここまで、AIによるパターン認識ができるようになるまで、そのための機械学習とアルゴリズムが必要なことがわかった。要は、AI独自の機械学習とそれを動かすためのソフトウエア作りという感じなのかな。


パターン認識と機械学習の組み合わせが誕生したとしても、その実現をするにはアルゴリズムが欠かせない。いくら機械学習にパターン認識を取り入れたとしても、そのためのアルゴリズムがなければ機能させることは難しいということなのだろう。



こうしたパターン認識と機械学習、それぞれ異なる技術や方法の融合と、それらを結びつけたアルゴリズムの関係があったからこそ、現在のAIがあるのである。



自分もかねてより、ずっとAIのプログラミングをしてみたいと考えていて、AIの構造を使って、このようなことができるようになった、というそういうソフトウエア、成果物を作ってみたい、と憧れるのである。


自分はもともとハードウエア・エンジニアではありますが。。。(笑)


でも自分の体内に宿る、心の奥深くに潜む、技術者魂がうずくというか、興味津々なのである。


そしてこれは昔からそうなのであるが、巷ではAI,AIと簡単に言うけど、そのAIの仕組みってどんなものなの?具体的にどのような仕組みで、それでなぜそんな奇跡的なことが実現できるようになるのか、自分の体験でもって実感してみたい、という欲望があるのだ。


ただ、表面的な部分での文章、文字で書かれたAIのことを読んでも、自分の欲求を満たされることがない。そういう悲しい性なのだ。



パターン認識.jpg


パターン認識を取り入れたAIとしてもっとも有名なのは、顔認識技術なのではないだろうか。


防犯カメラに映った犯人であろう顔をAIに学習させて、犯人を捜す顔認識技術。


またスマホの写真撮影でもAIによるパターン認識は使われている。


あらかじめパターン認識で顔を記憶させておき、カメラで情報を見つけ出すようにすることで、万が一顔を認識したときは自動でフォーカスを調整してくれて、より鮮明な写真を撮影してくれる。


自動ブレーキなどの安全運転技術でも使われている。現在では多くの自動車に導入されている安全装備。バックミラーの近くに取り付けられたセンサーやカメラを駆使して前方の車を確認し、危険を察知したら自動でブレーキをかける。


今やほとんどの車に標準装備されている。その自動ブレーキも進化したAIだからこそできるのである。


パターン認識の技術によって前方の車との距離と自車の速度を計算し、このままの速度だとぶつかってしまうが、今ここでブレーキをかければ、この車のブレーキであればぶつからずに済むと判断し、自動ブレーキをかける。こうした安全のための技術は、AIがあるからこそできることである。



う~む・・・AIによるパターン認識、恐るべしである。昔はパターン認識はコンピュータのもっとも苦手とする領域であったにも関わらず、もういまや克服して、我々の日常生活の進化に役立っているのである。


では、話を一番最初に戻して、自分が普段の仕事やプライベートのどういうときにパターン認識ということを感じるのか。


まずプライベート。


自分は日記を書くときは、写真を多用する。特に外の取材の時は、1回の外出で大体400~500枚くらいの写真を撮ってくる。それをPCに取り込むわけだ。


日記を書くまでのその写真の整理が1番大変なのだ。カメラで写真を撮るときは、やはりボケて失敗する場合もあるから、大抵の場合、1枚のフレームにつき、何枚も連写して複数枚撮影しておく。だからトータルで400~500枚もいってしまう。


いろいろな写真、これだけの膨大な写真ライブラリーの中から、日記でどれを使うのか、どれがいいショットなのかを選定する。そして、それをmixiのアルバムとブログ(SS-Blog)に取り込む作業をすることになる。


これはもう本当に苦痛な作業だ。(笑)


そのときに、PCのアルバムから、mixiとブログの両方に取り込むとき、その膨大な写真データの中から、間違いなくこの写真を選ぶという選択眼が備わっていないといけない。


mixiとブログとで違った写真では困る訳だ。同じ写真を取り込まないといけない。そうすると、自分は日記で使うために、この写真を選んだんだという、その写真の図柄を自分の中で認識できるようになるのだ。最初から大体1時間くらい経過すると、もう頭の中に、1枚たりとも間違いなく、インプットされる。


普通の人は、日記に使う写真って、1枚か2枚だろう。だからそんなに大変じゃないかもしれないが、自分はいつも膨大な写真を使うので、どの図柄を使うか、全部頭に認識、インプットされるのである。大体1時間経過すれば、完璧にその図柄がインプットされる。PCのライブラリーの中に、どんなに膨大な枚数の写真があっても、その中から間違いなく、これとこれ・・・というように完璧に選択できる。


自分は、長年こういう作業をやっていて、これって人間のひとつのパターン認識じゃないのかな~と思い始めた訳だ。頭にそういう写真データが認識されるのである。これはひとつの才能かな~と思ったりすることもあった。


プロのカメラマンもそうなんじゃないかな、と思う。


自分は、長年日記を書いていく上で、他人とは違う膨大な写真を使うという性格、傾向があるので、他人よりそういうパターン認識能力が発達しているのではないか、と秘かに思っていたりするのだ。



つぎに仕事。


自分はライセンス管理業務なので、日頃の仕事のツールはExcelである。自分の事業部が世界中のマーケットに販売するモデルを全部、そのExcelで管理し、ライセンス管理をおこなっている。もうそのモデル数は、5000モデル以上はゆうにある。


他のメーカーって、こんなモデル数扱っているのか知らないけれど、うちの会社は、もういろんな派生モデル含めて、それこそ膨大な種類のモデル数をリリースしている。


そのExcelには1台1台、もちろんその各々でモデル名が違う、そのモデル名のリストが5000モデル以上並んでいるのである。自分はそれを1台1台全部認識できるのである。(笑)


ちなみにモデル名は、アルファベットと数字で形成された無機質な文字列である。


自分がいままで見たことがない新モデルが入ってくると、もうすぐにそこに違和感のオーラが発せられているのを感じ、このモデルは見たことがない、と一発でわかるのである。


もうこの業務、10年間続けているベテランである。毎日5000モデル以上のモデル名をExcel上で転がしながら(スクロール)を毎日やっているのである。


だから、自分はその無機質な文字列であるにもかかわらず、自分にはきちんと確実に1台1台認識できるのである。慣れていない人や、ふつうの人が、この5000モデル以上のモデル名の羅列を見ても、チンプンカンプンなのでは、と思う。


ある意味、モデル名を見て仕事をしている人たちなんて、会社の中でもそんな業種はないのではないか、と思う。自分たちの原価メンバーと営業ぐらいなものだろう。


これもある意味パターン認識なのだではないのだろうか、と思うのだ。ある種の才能なのだと自分は思う。10年間ずっと毎日、Excelで5000モデル以上のモデル名を眺めてきたある意味、一種の職業病なのではないか、と思う。


よく思うのだ。この才能って、これから自分がもし他の世界に行くようなことがあった場合、役に立つ才能なのかなって。(笑)


期しくもそういう環境下にあって備わったパターン認識力だけれど、この才能って、なんか他の世界で役に立つのかな、とよく毎日思っているのである。


自分は、この写真データの整理と、自分の業務上でのモデル名の羅列で、パターン認識ということを日頃強く意識するようになり、これは一度きちんと調べて、真の意味を理解したいと思っていたのである。







nice!(0)  コメント(0) 

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。