La primera gran disrupción de Lokad, después de su inicio en 2008, fue la aparición de la computación en la nube. La computación en la nube fue un nuevo paradigma que revolucionó la industria. De la noche a la mañana, la antigua HPC (computación de alto rendimiento) quedó obsoleta y Lokad tuvo que adoptar a su sucesora. La computación en la nube representó la primera desviación radical de Lokad de lo que aún se puede considerar ‘software empresarial’ convencional1. Aunque la mayoría de los proveedores de software empresarial ofrecen SaaS en la actualidad, casi ninguno ha adoptado un diseño nativo de la nube1. La adopción de la computación en la nube fue impulsada por el trabajo pionero de Matthieu Durut, el segundo empleado de Lokad (el primer empleado de Lokad también era un doctorado).

Al igual que el trabajo de Benoit Petra, este manuscrito nunca antes había sido publicado en el sitio web de Lokad. Me complace corregir ese error hoy.

Autor: Matthieu Durut

Fecha: septiembre de 2012

Resumen de los algoritmos de clasificación Figura de los algoritmos de clasificación

Resumen:

Los temas abordados en esta tesis están inspirados en los problemas de investigación enfrentados por la empresa Lokad. Estos problemas están relacionados con el desafío de diseñar técnicas de paralelización eficientes de algoritmos de agrupamiento en una plataforma de computación en la nube. El Capítulo 2 proporciona una introducción a las tecnologías de computación en la nube, especialmente aquellas dedicadas a cálculos intensivos. El Capítulo 3 detalla específicamente la oferta de Microsoft Cloud Computing: Windows Azure. El siguiente capítulo detalla los aspectos técnicos del desarrollo de aplicaciones en la nube y proporciona algunos patrones de diseño en la nube. El Capítulo 5 está dedicado a la paralelización de un algoritmo de agrupamiento bien conocido: el Batch K-Means. Proporciona información sobre los desafíos de una implementación en la nube del Batch K-Means distribuido, especialmente el impacto de los costos de comunicación en la eficiencia de la implementación. Los Capítulos 6 y 7 están dedicados a la paralelización de otro algoritmo de agrupamiento, la Vector Quantization (VQ). El Capítulo 6 proporciona un análisis de diferentes esquemas de paralelización de VQ y presenta las diversas aceleraciones de convergencia que proporcionan. El Capítulo 7 proporciona una implementación en la nube de estos esquemas. Destaca que es la naturaleza en línea de la técnica VQ la que permite una implementación asincrónica en la nube, lo que reduce drásticamente los costos de comunicación introducidos en el Capítulo 5.

Jurado:

Jurado de los algoritmos de clasificación

Descargar la tesis (PDF)


  1. Una prueba de fuego para evaluar si un proveedor tiene un diseño nativo de la nube es preguntarle al proveedor si, como cliente, puedes pasar de cero a 10 terabytes en cuestión de horas sin permiso del proveedor. La mayoría de los proveedores de software empresarial no operan con recursos compartidos, por lo que se requiere una negociación previa para asegurar un conjunto de recursos dedicados de tamaño adecuado. ↩︎ ↩︎