Обучение в крупном масштабе: вклад в распределённые асинхронные алгоритмы кластеризации
Первый значительный прорыв компании Lokad состоял в использовании весьма нетрадиционных типов прогнозов для нужд цепей поставок, в частности квантильных прогнозов. В Lokad квантильные прогнозы стали предшественниками вероятностных прогнозов. Квантили ознаменовали первый значительный отход от того, что до сих пор считается «основным» подходом в теории цепей поставок. Этот прорыв был связан с работой первого сотрудника Lokad, Бенуа Патра. (Как генеральный директор и основатель, я сам не поступил в штат своей компании до гораздо более позднего срока.)
Пятнадцать лет спустя, к моему ужасу, я осознал, что рукописи многочисленных докторских диссертаций, проведенных в Lokad, так и не были опубликованы на нашем сайте. Так что, лучше поздно, чем никогда, давайте опубликуем эту рукопись!
Автор: Benoit Patra
Дата: Март 2012


Аннотация:
Темы, рассматриваемые в данной диссертационной рукописи, вдохновлены исследовательскими задачами, с которыми сталкивалась компания Lokad, что обобщено в первой главе. Глава 2 посвящена непараметрическому методу прогнозирования квантилей действительной временной серии. В частности, нами доказана состоятельность этого метода при минимальных предположениях. Остальная часть диссертации посвящена анализу распределённых асинхронных алгоритмов кластеризации (DALVQ). Глава 3 сначала предлагает математическое описание моделей, а затем дает теоретический анализ, в рамках которого доказывается существование асимптотического консенсуса и почти уверенная сходимость к критическим точкам искажения. В следующей главе предлагается подробное обсуждение, а также проведены некоторые эксперименты по схемам параллелизации, предназначенным для практического развёртывания алгоритмов DALVQ. Наконец, Глава 5 содержит эффективную реализацию DALVQ на платформе облачных вычислений Microsoft Windows Azure. Мы изучаем, среди прочего, ускорение, достигаемое за счёт использования большего количества вычислительных ресурсов, и сравниваем этот алгоритм с так называемым методом Ллойда, который также является распределённым и развёрнут на Windows Azure.
Забавный факт: В аннотации упоминается «Windows Azure», что действительно было коммерческим названием Microsoft Azure в первые годы.
Жюри:
