クラウド上で分散された分類アルゴリズム
Lokadの初の大きな変革は、2008年のプロジェクト開始後に登場したクラウドコンピューティングでした。クラウドコンピューティングは、業界を席巻した新しいパラダイムでした。一夜にして、古いHPC(ハイパフォーマンスコンピューティング)は死に、Lokadはその後継者を受け入れる必要がありました。クラウドコンピューティングは、Lokadがまだ「主流」と考えられるものからの最初の根本的な脱却を表していました1。ほとんどのエンタープライズベンダーは現在SaaSを提供していますが、クラウドネイティブな設計を採用しているベンダーはほとんどありません1。クラウドコンピューティングの採用は、Lokadの2番目の従業員であるMatthieu Durutの先駆的な業績によって推進されました(Lokadの最初の従業員は別の博士号を持っていました)。
Benoit Petraの業績と同様に、この論文は以前にLokadのウェブサイトで公開されたことはありませんでした。今日、その誤りを正すことができてうれしいです。
著者: Matthieu Durut
日付: 2012年9月
要約:
この論文で取り上げられているテーマは、Lokad社が直面する研究問題に触発されています。これらの問題は、クラウドコンピューティングプラットフォーム上でのクラスタリングアルゴリズムの効率的な並列化技術の設計の課題に関連しています。第2章では、クラウドコンピューティング技術について紹介し、特に集中計算に特化した技術について説明します。第3章では、特にMicrosoftのクラウドコンピューティングオファーであるWindows Azureについて詳しく説明します。次の章では、クラウドアプリケーション開発の技術的な側面といくつかのクラウドデザインパターンについて詳細に説明します。第5章では、よく知られたクラスタリングアルゴリズムであるバッチK-Meansの並列化について詳しく説明します。これにより、クラウド上での分散バッチK-Meansの実装効率における通信コストの影響など、いくつかの洞察が得られます。第6章と第7章では、別のクラスタリングアルゴリズムであるベクトル量子化(VQ)の並列化に取り組んでいます。第6章では、VQのさまざまな並列化スキームの分析と、それらが提供する収束までの速度向上について紹介します。第7章では、これらのスキームのクラウド実装を提供します。第5章で紹介された通信コストの削減に大きく貢献しているのは、VQ技術のオンライン性です。
審査員: