実世界データサイエンス研究室

実世界データサイエンス研究室では,実世界の様々な事象をデータサイエンスのアプローチによって有用なインサイトを引き出し課題解決につなげることを目指しています.その応用分野は幅広く,メンタルヘルス,移動・交通,人間行動理解,情報推薦,一次産業,ビジネス,アートなど多岐に及びます.ご自身で抱えている実世界の問題を最先端の人工知能によって解決を模索している方はぜひご相談ください.

実世界データサイエンスとは

実世界データサイエンスとは、実世界データ×AIによって有用なインサイトを発見し、課題解決につなげるアプローチです。実世界データサイエンス研究室では、最先端のAI技術を理論的基盤として、さまざまな人間活動から生み出される異種混合の実世界データを統合的に処理、解析し、さまざまな社会課題やビジネス課題の解決につなげる方法論について研究を進めています.

人工知能の活用

⼈⼯知能(AI)は比較的新しい学問ですが、その活⽤領域は予測、意思決定、自動化、最適化など多岐に亘って急速に拡⼤しています。こちらの図では、データサイエンスがどの領域で活用されているかを示しています。まず円の部分には、日本のあらゆる産業を総務省が分類整理した項目を並べています。その周辺には、それぞれの産業において、データサイエンスがどう活用されているかを記載しています。ぜひご自身が興味を持っている産業分野に注目してください。



人間と人工知能の相乗効果を引き出すために

AIと人間にはそれぞれ得意分野があります。例えば、大規模なデータからインサイトを引き出す、あるいは大量の条件から最適解を求める、などはAIが得意です。一方で、様々なコンテキストを読み取る、あるいは一度経験すれば次に応用可能な多くの知識を学ぶことができる、などは人間は得意ですがAIは苦手です。これからの時代では、人工知能の得意・不得意を理解し、人間と人工知能の相乗効果を引き出すことが、社会課題やビジネス課題の解決に重要になります。

研究室ではどのようなスキルを学べますか?

社会やビジネスの現場でどういったデータサイエンティストが求められているでしょうか?データサイエンスに関する基礎的なスキルを有し、課題の現場に入り込んでデータドリブンの思考で課題解決を遂行できる人材が必要とされていると考えています。データサイエンススキルとドメイン知識活用スキルの二つが重要だと考えています.データサイエンススキルとは、最新AI・機械学習技術の習得・実装スキルで授業や研究、データ分析コンペ、学会発表当を通じて、身に着けてもらいたいと思います.ドメイン知識活用スキルは、課題背景を理解した上で、ビジネス課題を整理し解決するスキルになります。効果的な問題設計をするためには、現場に入り込んで、ドメインを理解した上で、何が課題となっているかしっかり見極めることが必要になります。さらに、現場の方がこれまでどうやって判断や予測していたかヒアリングすることで、効果的な特徴量の設計をすることができます。

われわれはいまどこにいるか?

ーAIの挑戦の軌跡と展望ー

AIが目指す究極の難問

AIは二つの難問にチャレンジしています。1つ目は、知的存在の理解です。小さくて遅い脳がそれよりはるかに大きくて複雑な世界を理解し、予測し、そして操作できるのか?ここに鏡を見ている人のイラストがありますが、哲学者です。この人は鏡をみながら、ここにその存在があるのだから探求は可能であると確信を持っています。2つ目は、知的存在の構築です。どのようにこのような学習し、記憶し、推論できるような性質をもったものを構築することができるのか?計算機の発達によって、ようやく知的存在の構築が始まりました。このイラストにあるように、知能の研究で確立した理論を計算機の力を借りて、再現してみようと、こういうことであります。

他分野からの継承

AIは若い分野ですが他分野からの多くの考え方、視点、技術を継承しています。特に先ほどの難問の一つ目については、哲学、数学、心理学の分野で探求されてきました。哲学では、もちろん様々な考え方が提唱されていますが、AIにつながる考え方としては、ライプニッツが提唱した、脳や精神を含む世界のすべては物理法則に従って動作している(唯物論)が転換点になりました。これによって、推論と学習の理論が誕生しました。数学では、計算をアラビア数字と代数によるアルゴリズムとして定式化する考え方がうまれました。これをベースにして、論理、確率、意思決定や計算の形式理論が生まれました。そして、計算機の誕生のもととなる重要な考え方としてチューリングによる万能チューリングマシンが考案されました。これは、単純な記号操作の繰り返しによって認識のアルゴリズムを実装できるというものです。そして心理学では、人間の心を調査する道具と、その結果得られた理論を表現する言語が生まれました。特にAIにつながる重要な考え方として、認知心理学では、脳は情報を保持し処理するものと位置づけ、認知は入力情報の変換過程と捉える考え方が提唱されました。そして、難問2へのチャレンジです。1940年ごろからは、計算機が発明され、とうとう知能の構築が進んでいきます。

人工知能の創成(1943-1995)

AIという言葉が初めて用いられたのは有識者が集まったダートマス会議においてです。それから「Artificial Intelligence」という言葉が使われ始めました。1943年から1995年の50年間は、現実世界の知識の獲得をめぐってAIブームと冬の時代を繰り返した時代であるといえます。まず第一次ブームですが、計算以外の知的な処理を行えるようになったということで熱狂が生まれました。そしてゲームやパズルなどの分野でのアプリケーションが考え出されました。ロジックはLISPによってハードコーディングされていました。この時代に、扱った問題は、非常に限定的でマイクロワールドといわれていました。世界について知識は全く持っていません。そのため次第に、現実世界の問題が全く解けないことが分かってくると失望が生じました。次に、第二次ブームです。現実世界の知識が必要と考えた研究者たちは、専門家からヒアリングした知識をルールとして埋め込もうと考えました。Prologによって、ルールを組み合わせることで、課題解決を図りました。これは非常に産業界の期待も高まり、投資も相次ぎました。一つ例を挙げます。Mycinというシステムですが、これは、専門家のインタビューから獲得した医学知識を450個の規則として設定し、感染症の原因と確信度の推論を実現してものです。しかしながら次第に、企業はきづきました。エキスパートシステムは、維持コストが非常に高くつくことから衰退がはじまりました。ルールがロジックに組み込まれているので、ルールを新たに追加すると、すべてのルールとの整合性を見直す必要があるからです。また、入力の誤りに対して頑健性がなく、入力が誤ると完全に誤った応答をしてしまいます。

機械学習、ビッグデータの登場(1995-2010)

次の1995年~2010年は、機械学習とビッグデータが登場します。1995年までに、研究者たちは、現実世界のすべての知識、規則を人が埋め込もうとするのとは別のアプローチをとろうとします。人が埋め込むのではなく、機械が自分自身でデータから現実世界の知識を獲得する方向へとかじを切ります。これが機械学習です。1995年から2005年の間には、名著も生まれています。Tom ミッチェルによるMachine Learning、サットンによる強化学習、そして、通称ビショップ本と呼ばれているパターン認識です。また、この間には、GAFAなどの重要な企業もうまれ、デジタルの世界が急拡大していきました。そして、デジタルの世界の急拡大とともに、デジタルデータが大量にうまれました。このビッグデータから機械学習を使って課題解決をしようとする動きがお多くうまれました。例えば、この本にあるように、データマイニング、Webデータマイニング、情報検索などです。2005年からは、本格的に、ビッグデータと機械学習を使ったビジネス応用が広がり、第三次AIブームが始まりました。一つ象徴的なできごとがありました。NetFlixプライズです。DVDのレンタルデータに基づき、映画推薦あるyごりズムのコンペてっぃションが行われました。賞金1億円です。その過程で重要なアルゴリズムもうまれました。

深層学習の登場(2010-現在)

そして、2010~現在です。ますますデータも増加し、テキストデータだけでなく、画像、動画像などのデジタルデータもふえてきました。2012年に重要な技術に注目が集まります。それは深層学習です。画像分類のコンペティションが昔から開催されていたのですが、2011年ごろは正解との誤差が下げ止まっていました。ところが、この深層学習を使ったチームが、10%以上も精度を改善したのです。驚いた研究者たちは、深層学習を使った様々な応用を模索し始めました。その後、画像認識だけでなく、音声認識、翻訳など、様々なアプリケーションで最高の精度を出すようになりました。現在も応用が広がっております。2017年には、AlphoaGoがプロキシに勝利したということで大変有名になりました。これも深層学習と強化学習を組み合わせて、自分と自分を戦わせて最強のモデルを学習しました。一番右は、深層学習の名著であります。IanGoodfellow先生、Bengio先生によります。

AIと機械学習

AI、機械学習、深層学習というキーワードができました。整理すると、AIが一番広い概念になります。そして、AIの概念の中に機械学習があります。そして機械学習の概念の中に深層学習が含まれます。AIの初期では、知識を人が与えていました。機械学習の時代になり、知識はデータから獲得するものとなりました。ただし、データの表現は特徴量の設計という形で、まだ人に依存しています。そして深層学習の時代になると、データから特徴の抽象的な表現を自動で獲得できるようになっています。

生成AIの登場

そして、2022年には生成AIが登場しました。言語、音声、画像、動画など多岐にわたって応用が開発され、爆発的に利活用が広がっています.

AIの未来(ディストピア)

ディストピア的な予想とユートピアの予想が拮抗しています.ディストピアの予想の例を挙げます.AIが及ぼすリスクの軽減を目指す非営利団体 Center for AI Safety (CAIS)が、AI専門家や各界著名人による共同声明『Statement on AI Risk』(AIの危険性についての声明)を公表しました.深層学習の生みの親であるヒントン氏は、生成AIの普及で偽の画像や文章が氾濫し、真実がわからなくなる可能性があると指摘。しました.ハラリ氏は,人間(ホモ・サピエンス)は時代遅れになる。ホモ・サピエンスに代わる新しい人類「ホモ・デウス」は、コンピュータ・サイエンスや遺伝子工学などのテクノロジーの力を借りて、自分自身を含めた全世界を思い通りに創造しうる。その他の大多数はただデータを提供するだけの存在になり下がる。自らをアップグレードできなかった人間(ホモ・サピエンス)は、やがてネアンデルタール人のように淘汰されてしまうかもしれないと指摘しています.

AIの未来(ユートピア)

カイフー氏は,AIによって人類は働く必要がなく何でもただで手に入る世界を技術と小説で描きました.レイカーツワイル氏は,「2045年に人工知能は地球上で最も賢く最も有能な生命体としての人間を上回る。暴力的なマシンによって人類が絶滅させられる可能性は(ありえなくはないが)、人間と機械の間の明確な区別はもはやサイボーグ化で強化された人間とコンピューターにアップロードされた人間の存在のおかげで存在せず、ほとんどありえない。」と述べています.アンドリュー氏は,「AIを恐れる人たちは「亡霊」にうなされているだけで、火星に移住する前から火星の人口過密を心配するのに似ている。「マスクは抜け目のない男だ。彼がAIに口を出すのはAIの将来性を確信しているからだ」と述べています.