¿Qué tipo de modelos de forecasting estás utilizando internamente? Esta es una pregunta que tanto clientes como partners de Lokad hacen con frecuencia.

Abordar esta pregunta es complicado para nosotros por dos razones:

  • Nuestra tecnología es un activo fundamental. Por ello, no tenemos planes de revelar todos los detalles (aunque tampoco somos totalmente secretos).
  • Nuestra tecnología es compleja. Estamos utilizando muchos modelos, y un componente fundamental es precisamente la selección de modelos.

Por lo tanto, en lugar de dar la lista exacta de modelos utilizados en Lokad, voy a listar mi propia lista personal de modelos favoritos. No afirmo que estos modelos representen la lista completa de los modelos utilizados en Lokad ni que todos estos modelos se usen en producción en Lokad; sin embargo, deberían ofrecerte algunas ideas sobre lo que estamos haciendo en Lokad.

Primero están los típicos clásicos: autoregresivo, moving average, (doble, triple) suavizado exponencial, Box-Jenkins, Holt-Winters, ARMA, ARIMA … Esos modelos normalmente no manejan ni multi-series ni tags o events; sin embargo, la simplicidad es clave en muchas situaciones. No descartes moving average solo porque parece demasiado simple para ser bueno.

Luego, para modelos más avanzados, prefiero hablar de enfoques en lugar de modelos. De hecho, cuanto más complejo es el modelo, mayor es la libertad que tiene el matemático para ajustar de formas sutiles el comportamiento del forecasting model.

El enfoque bayesiano: establecer gráficos de relaciones es especialmente útil en el contexto de Lokad, donde explotamos las correlaciones entre time-series. También es útil para manejar tags y events.

El enfoque de amplio margen: Support Vector Machines (SVM) se han vuelto increíblemente populares en estos días. Aunque, en lo que respecta a las time-series, es más bien Support Vector Regression (SVR) lo que nos resulta más útil. Como pequeña desventaja, SVM y SVR suelen ser bastante caros en términos de potencia de procesamiento bruto.

El enfoque de mezcla / boosting: combinar un montón de predictivos simples para mejorar el forecast general funciona bien. La combinación de un gran número de predictores simples puede utilizarse para reflejar comportamientos realmente complejos.

El enfoque metaheurístico: algoritmo genético, redes neuronales, programación genética y otros enfoques evolutivos / adaptativos. Estos enfoques son poderosos, pero también son notoriamente conocidos por su sensibilidad intrínseca a muchos parámetros de tuning.

Como nota final, nuestra tecnología todavía está en una evolución acelerada. Se ponen en producción nuevos modelos cada mes aproximadamente. Esta lista no es definitiva y computación en la nube está creando, de hecho, muchas oportunidades para que lancemos modelos que antes resultaban demasiado caros.