Die erste Herausforderung lag darin, dass für die große Anzahl an Features verhältnismäßig wenige Datenpunkte zur Verfügung standen und daher mittels Dimension Reduction zunächst die wichtigsten Features bestimmt werden mussten. Im Vergleich mit anderen Datenanalyse-Techniken, gelang es mit der Multiple Correspondence Analysis (MCA) ohne Informationsverlust die 400 Features auf insgesamt lediglich 14 zu reduzieren. Daher diente diese anschließend als Basis für das zu entwickelnde Machine Learning-Modell.
Die zweite Herausforderung stellte die Wahl des geeignetsten Regressionsalgorithmus dar, da sich anwendbare Algorithmen in ihrem Grundsatz ähneln. Der Trainingssatz wurde mittels Cross Validation gesplittet. Nach dem Parameter-Tuning des gewählten Algorithmus konnte eine Vorhersage für den ursprünglichen Testdatensatz vorgenommen werden.
Mangels Daten konnten zudem externe Störfaktoren nicht im Machine Learning Modell berücksichtigt werden.