{"id":8587,"date":"2021-10-26T09:00:00","date_gmt":"2021-10-26T07:00:00","guid":{"rendered":"urn:uuid:1871863a-4dde-4f67-90d2-b9492faf1d58"},"modified":"2021-10-21T11:45:14","modified_gmt":"2021-10-21T09:45:14","slug":"vorhersage-von-freien-parkplaetzen-mittels-machine-learning","status":"publish","type":"post","link":"https:\/\/blog.fhgr.ch\/blog\/vorhersage-von-freien-parkplaetzen-mittels-machine-learning\/","title":{"rendered":"Vor\u00adher\u00adsa\u00adge von freien Park\u00adpl\u00e4t\u00adzen mittels Machine Learning"},"content":{"rendered":"\n
Die Studierenden des Studiengangs Digital Business Management konnten das Wahlmodul Data Science & Machine Learning besuchen und in die Welt der datengetriebenen Analyse eintauchen.<\/p>\n\n\n\n\n
Mein Name ist Elia Perenzin<\/a> und ich studiere Digital Business Management. Ich hatte das Vergn\u00fcgen das Wahlmodul Data Science & Machine Learning bei Ingmar Baetge zu besuchen. Im Modul erhielten wir einen breiten Einblick in die Techniken, welche f\u00fcr das maschinelle Lernen verwendet werden. Die Themen reichten von \"supervised learning\", \"unsupervised learning\" bis hin zu \"reinforcement learning\" mit neuronalen Netzen. Da die Welt des maschinellen Lernens sehr komplex und zu umfangreich f\u00fcr einen Kurs \u00fcber sechs Tage ist, erhielten wir nur einen oberfl\u00e4chlichen Einblick in die einzelnen Themen. Ebenfalls wurde ein eigenes Semesterprojekt durchgef\u00fchrt, welches ich hier in diesem Blogbeitrag vorstellen m\u00f6chte. <\/p>\n\n\n\n Der Auftrag f\u00fcr das Semesterprojekt war sehr offengehalten. In Teams von zwei bis drei Personen sollte ein kleines Data-Science-Projekt durchgef\u00fchrt werden. Dazu konnten eigenst\u00e4ndig Daten gesucht und analysiert werden. Das Ziel war es anhand der Daten ein passendes Modell zu trainieren. Das Projekt f\u00fchrte ich mit Jessica Nigg<\/a> und Dominic Kunz<\/a> durch.<\/p>\n\n\n\n F\u00fcr das Projekt w\u00e4hlten wir keinen Standartdatensatz aus dem Internet, denn wir wollten nicht etwas analysieren, was bereits zuvor in unz\u00e4hligen Tutorials behandelt wurde. Wir entschieden uns, einen eigenen Datensatz zu verwenden. Ein Skript, welches auf einem Raspberry-Pi l\u00e4uft, sammelte w\u00e4hrend dem Zeitraum von 11 Monaten alle 5 Minuten die freien Parkpl\u00e4tze von allen Parkh\u00e4usern in Z\u00fcrich. Die Idee f\u00fcr das Skript entstand in einem fr\u00fcheren Semester an der Fachhochschule und sammelte seither die Daten. Der Datensatz enthielt \u00fcber drei Millionen Datenpunkte, welche sich perfekt f\u00fcr dieses Projekt eigneten.<\/p>\n\n\n\n Im originalen Datensatz war nur ein Zeitstempel vorhanden. Zu Beginn mussten wir deshalb weitere Felder (Features) berechnen, um ein gutes Modell zu trainieren. Die Features, welche aus dem Zeitstempel berechnet wurden, waren zum Beispiel der Monat, Wochentag, Stunde und Tageszeit.<\/p>\n\n\n\n Aus den Daten wurde eine Grafik generiert, damit wurde versucht zu erkennen, ob \u00fcberhaupt eine Regelm\u00e4ssigkeit in den Daten vorhanden ist. Zus\u00e4tzlich wollten wir \u00fcberpr\u00fcfen, ob die Auswirkungen der Jahreszeiten oder der Einfluss der Corona-Pandemie in den Daten ersichtlich sind. So konnten Parkh\u00e4user identifiziert werden, bei denen es Sinn macht, ein Modell zu trainieren, weil sie eine gewisse Regelm\u00e4ssigkeit aufzeigen.<\/p>\n\n\n\n\n Im Diagramm \"Feldegg\" kann man gut die Regelm\u00e4ssigkeit in den Daten erkennen. Das Parkhaus ist jeweils in der Nacht und am Morgen nicht stark ausgelastet. Am Tag steigt die Auslastung (durch die dunkel schattierten Felder zu erkennen). Im Beispiel \"Accu\" ist keine solche Regelm\u00e4ssigkeit erkennbar, deshalb eignet sich dieses Parkhaus nicht um ein Modell zu trainieren.<\/p>\n\n\n\n\t\n Die Aufgabe<\/span><\/h3>\n \n\n\n
Die Daten<\/span><\/h3>\n \n\n\n
Die Features<\/span><\/h3>\n \n\n\n
Die Analyse<\/span><\/h3>\n \n\n\n