Molti sfide della supply chain possono essere affrontate come problemi di classificazione o regressione. Ad esempio, la previsione della domanda può essere vista come una regressione; mentre decidere se allineare un prezzo al punto di prezzo di un concorrente può essere visto come una classificazione.

Una foresta casuale è una tecnica di apprendimento automatico che può essere utilizzata per apprendere modelli dai dati, tipicamente con l’intento di eseguire una classificazione o una regressione.

Sebbene le foreste casuali non siano più all’avanguardia nell’apprendimento automatico - l’apprendimento profondo le supera in molte, se non nella maggior parte delle situazioni - ci sono ancora distintivi vantaggi pratici associati alle foreste casuali, che sono stati ben riassunti da Ahmed El Deeb in The Unreasonable Effectiveness of Random Forests.

Infatti, quando Ahmed El Deeb sottolinea che È davvero difficile costruire una cattiva Foresta Casuale!, concordo pienamente, e questo rappresenta un significativo vantaggio pratico. Al contrario, i modelli di apprendimento profondo sono, beh, capricciosi, per dir poco, e un tesoro di parametri oscuri può migliorare - o degradare - le prestazioni in modi che non sono sempre molto chiari per lo scienziato dei dati.

Pertanto, le foreste casuali sono ora integrate in Envision. Bonus: le previsioni delle foreste casuali vengono restituite come variabili casuali, il che rappresenta una bella combinazione per gli approcci probabilistici di ottimizzazione della supply chain.

Sotto il cofano, abbiamo implementato la nostra implementazione di foreste casuali altamente ottimizzata. Abbiamo rubato molte intuizioni da xgBoost. La principale intuizione è che stiamo sfruttando una strategia di elaborazione dati columnar - a differenza di approcci precedenti, che erano tabulari. Nel contesto di Envision, questo approccio offre ulteriori vantaggi in termini di prestazioni poiché i dati stessi sono già organizzati in un formato columnar all’interno di Envision. Inoltre, in un contesto di supply chain, le caratteristiche di input sono spesso sparse o di bassa cardinalità - ad esempio, slow movers. L’approccio columnar ci consente di comprimere significativamente i dati, il che porta a ulteriori accelerazioni per quelle foreste casuali.

Foreste casuali più veloci possono sembrare una piccola caratteristica, tuttavia le prestazioni sono una caratteristica. La risorsa più scarsa è di solito lo scienziato della supply chain stesso. Spendere meno tempo ad attendere i risultati numerici significa poter dedicare più tempo a pensare e risolvere la vera sfida della supply chain.