クラウド上に分散された分類アルゴリズム
Lokadの最初の大きな変革、すなわちプロジェクト開始当初の2008年以降に起こった出来事は、クラウドコンピューティングの出現でした。クラウドコンピューティングは業界を席巻した新たなパラダイムでした。一夜にして、従来のHPC(ハイパフォーマンスコンピューティング)は役目を終え、Lokadはその後継技術を受け入れなければなりませんでした。クラウドコンピューティングは、いまだ「主流」と見なされるエンタープライズソフトウェアからのLokadの初めての大胆な脱却を意味していました。今日、多くのエンタープライズベンダーがSaaSを提供しているにもかかわらず、ほとんどの企業がクラウドネイティブ設計を採用しているわけではありません1。クラウドコンピューティングの採用は、Lokadの第2従業員であるMatthieu Durutの先駆的な取り組みによって推進されました(最初の従業員は別の博士号保持者でした)。
Benoit Petraの業績と同様に、この原稿はこれまでLokadのウェブサイトで公開されたことがありませんでした。本日、その不備を正すことができ、喜ばしく思います。
著者: Matthieu Durut
日付: 2012年9月


概要:
本論文で扱う主題は、Lokad社が直面している研究課題に触発されたものです。これらの課題は、クラウドコンピューティングプラットフォーム上でのクラスタリングアルゴリズムの効率的な並列化技術の設計という挑戦に関連しています。第2章では、特に大規模な計算処理に特化したクラウドコンピューティング技術の概要が紹介されます。第3章では、Microsoftのクラウドコンピューティング製品であるWindows Azureについて、より具体的に解説しています。続く章では、クラウドアプリケーション開発の技術的側面を詳述するとともに、いくつかのクラウドデザインパターンが提示されます。第5章は、よく知られたクラスタリングアルゴリズムであるバッチK平均法の並列化に捧げられており、分散型バッチK平均法のクラウド実装における課題、特に通信コストが実装効率に与える影響について洞察を提供します。第6章と第7章では、別のクラスタリングアルゴリズムであるベクトル量子化(VQ)の並列化に焦点が当てられています。第6章では、VQのさまざまな並列化手法の分析と、それらによってもたらされる収束の加速効果が示され、第7章では、これらの手法のクラウド実装が紹介されます。ここで、VQ手法のオンライン特性が非同期のクラウド実装を可能にし、第5章で述べた通信コストを劇的に低減することが明らかにされます。
審査委員:

-
ベンダーがクラウドネイティブな設計を有しているかどうかを見極める試金石として、クライアントの立場から、ベンダーの許可を得ることなく数時間でゼロから10テラバイトにスケールできるかどうかを尋ねることが挙げられます。ほとんどのエンタープライズソフトウェアベンダーはリソースのプール運用をしていないため、適切なサイズの専用リソースプールを確保するためには、事前の交渉が必要となります。 ↩︎