大規模学習: 分散非同期クラスタリングアルゴリズムへの貢献
Lokad における最初の大きな画期的発見は、サプライチェーン向けに非常に異例な種類の予測、特に 分位点予測 の利用でした。Lokadでは、分位点予測が 確率的予測 の先駆けとなりました。分位点は、いまだに『主流』と考えられる サプライチェーン理論 からの Lokad の初の重大な逸脱を示しました。この画期的な成果は、Lokad の最初の従業員である Benoit Patra の業績に結びついています。(CEOであり創業者として、私自身はずっと後になってから自社の給与リストに加わりました。)
15年後、私の大きな驚きとして、Lokadで行われた複数の博士論文の原稿が一度も当社のウェブサイトに公開されていなかったことに気づきました。ですから、遅くなってもやらないよりは、今ここでこの原稿を再公開しましょう!
著者: Benoit Patra
日付: 2012年3月


要旨:
本博士論文で取り上げられるテーマは、Lokad社で直面した研究課題に着想を得たもので、第一章で概説されています。第二章では、実数値の 時系列 の分位点を予測するためのノンパラメトリック手法について論じ、最小限の仮定の下でこの手法の整合性結果を確立しました。論文の残りの部分は、分散非同期クラスタリングアルゴリズム (DALVQ) の解析に充てられています。第三章では、まずモデルの数学的記述を提示し、次に理論的解析を行い、漸近的合意の存在と、歪みの臨界点へのほぼ確実な収束が証明されることを示しました。次の章では、DALVQアルゴリズムの実用的な展開のために実装すべき並列化スキームについて、詳細な議論およびいくつかの実験を提案します。最後に、第五章では、Microsoft Windows Azure の クラウドコンピューティング プラットフォーム上での DALVQ の効果的な実装を紹介します。さらに、並列計算資源を増やすことによって得られる高速化効果について検討し、同じく分散されWindows Azure上で展開されているいわゆる Lloyd 法との比較も行っています。
豆知識: 要旨内では ‘Windows Azure’ と記されていますが、これは初期の頃の Microsoft Azure の商標名でした。
審査委員:
