Für jeden zur Verfügung gestellten Datensatz wurde eine gründliche Analyse durchgeführt. Ausreißer innerhalb verschiedener Standorte wurden durch überlappende geographische Daten, Klimainformationen und eine Vielzahl von Events identifiziert. Die Ausreißer wurden dann entfernt.
Der genetische Datensatz wies eine große Schnittmenge auf. Deshalb konnte die Dimensionalität des Datensatzes ohne Informationsverlust signifikant reduziert werden.
Durch die Kombination von verschiedenen Raum-Zeit-Modellen war es möglich, das Wetter mit einer Genauigkeit von 95 % vorherzusagen.
Der reduzierte Datensatz des genetischen Materials, die Wetter-, Boden- und Ertragsdaten wurden in einen Datensatz zusammengefasst und als Trainingssatz für das Model verwendet. Mittels verschiedener Algorithmen wurde die Hybrid-Leistung mit einer Genauigkeit von 75 % vorausgesagt.