「ビッグデータ」 – これは、膨大な量のデータを収集、処理、分析することを意味します。技術は何よりも、そこから正しい結論を導き出すことにあります。米国のコンピューター科学者マイケル・ジョーダンは、たとえその背後にある研究に数十年かかるとしても、コンピューターサイエンスと統計の長所を組み合わせた「新しい思考スタイル」を提案しています。
科学研究の危機
「何が起こっているのか実際には理解していないため、ビッグデータから誤った結論を導き出すのは非常に簡単です。 「コンピューターがすべての仕事をやってくれる」とバークレー大学(米国)の統計学とコンピューターサイエンスの教授はAPAとのインタビューで述べ、初期の問題の1つを概説した。明日の水曜日、ジョーダンはオーストリア科学技術研究所 (IST) で「計算的思考、推論的思考、データ サイエンス」について講義を行います。

たとえば、人口データを分析するときに、人口が不均衡に表現されている場合 (「オーバーサンプリング」)、コンピューターはこれを「認識せず」、歪んだ結果を生成します。このような統計上の不正確さは、近年の科学研究における「再現性の危機」を引き起こしています。たとえば、遺伝子と病気との関連性が噂されていたとしても、その後は追跡できなくなることがよくある、とジョーダン氏は医学の例を挙げた。

コンピューターサイエンスと統計学のギャップ
多数の人々、異なる文化、状況にまたがる統計的意思決定の根本的な問題を解決することは、専門家にとって「コンピューター サイエンスでこれまでに行われたことよりもはるかに困難」です。この問題は、データがコンピュータ システムによって評価されるときに、「誤検出率」などの統計的エラーの修正を事前に計画することで、少なくとも部分的には克服できる可能性があります。しかし、これらのシステムを計画および構築する多くのコンピュータ科学者は、そのような統計的解決策について何も知らないか、またはほとんど知りません。
克服する必要がある根本的な核心は次のとおりです。統計学者は、より正確な結論が得られるため、できるだけ多くのデータに満足していますが、コンピューター科学者は、概要を維持するためにデータの複雑さを軽減したいと考えています。これらの世界の間にギャップがあるのは、部分的にはトレーニングに集中していないことが原因ですが、さらに深い理由もあります。 「両方の領域をサポートする既存の概念は、お互いに利益を得るというよりも、互いに衝突する傾向があります」とジョーダン氏は説明しました。

本質的には、推論的思考 (大まかに言えば、統計に基づいて結論を導き出すこと) とコンピューターによる思考を、制度的なものも含めてより緊密に組み合わせることです。 「より効果的に連携する概念を開発するには、ある程度の知的探究と、おそらく数十年の研究が必要になるだろう」とジョーダン氏は述べ、これらの取り組みは最終的には新しい学問分野の確立につながるだろう。
機械の超知能は依然として SF のシナリオ
科学的影響力と米国バスケットボール界のレジェンドとの共通名により、かつては「機械学習のマイケル・ジョーダン」と評されたコンピューター科学者は、人類を脅かす機械超知能を恐れてはいない。このようなシナリオは純粋な SF であり、もしそうだとしてもおそらく 500 年以内にしか考えられないでしょう。 「懐疑的で楽観主義者」は、少なくとも今日のコンピューターにおける真の知性をきっぱりと否定します。せいぜい、人々をサポートする拡張インテリジェンスについて話すことができます。たとえば、Web 上の検索クエリ、音声認識の使用、レコメンデーション サービスなどです。
心理学、数学、認知科学で大学の学位を取得したジョーダンにとって、囲碁のような非常に複雑なゲームでコンピュータが人間のトッププレイヤーに勝っているという事実さえ、本質的には「まったく何の意味もない」。正しいものはエンジニアリングの素晴らしい功績です。しかし、それはコンピュータが突然非常に賢くなるという意味ではありません。」
