Ziel: Sammeln eines großen Datensatzes von Skin-Preisen mittels automatisiertem Crawler. Anschließende Analyse der Daten und Signifikanzbewertung der Features, welche in ein Machine-Learning-Modell zur Preisvorhersage übergeben werden.
File | Beschreibung |
---|---|
CSGO_Crawler.py | Dieser Code wurd genutzt, um die Daten aus Skinport zu extrahieren - der Output des Codes ist in der Datei allitems.csv einsehbar; Achtung: für allitems.csv wurden nur die richtigen Skins gecrawled. In der py-Datei befindet sich allerdings auch der Code, um alle anderen Items zu crawlen (ist in der Datei selbest beschrieben) - Ausführung des Codes: Beginn am 26.03.2022 um 11:58 Uhr, Ende am 27.03.2022 um 15:01 Uhr |
CSGO_Colorfulness.py | Dieser Code wurde genutzt, um die gesammelten Daten mit dem Feature 'colorfulness' anzureichern - der Output des Codes ist in der Datei allitems_w_colors.csv einsehbar - Ausführung des Codes: Beginn am 13.04.2022 um 9:29 Uhr, Ende am 14.04.2022 um 13:21 Uhr |
CSGO_Analytics.ipynb | Säuberung der Daten und EDA |
CSGO_Significance_Testing.ipynb | Testen der Features auf Signifikanz, inklusive Ergebnistabelle |
CSGO_ML_Model.ipynb | XGBoost-Modell zur Vorhersage der Skin-Preise, inklusive Ergebnistabelle |
Dieser Link führt zum GoogleDrive-Ordner, in welchem die benötigten Daten gespeichert sind.
Darin befinden sich folgenden Dateien:
File | Beschreibung |
---|---|
allitems.csv | Originaldaten aus dem Scraping-Prozess (nachdem CSGO_Crawler.py durchgelaufen ist) |
allitems_w_colors.csv | Originaldaten allitems.csv mit Colorfulness-Feature angereichert (nachdem CSGO_Colorfulness.py durchgelaufen ist) |
allitems_cleaned_1.csv | Speicherpunkt in CSGO_Analytics.ipynb |
allitems_cleaned_2.csv | Speicherpunkt in CSGO_Analytics.ipynb |
allitems_cleaned_3.csv | Speicherpunkt in CSGO_Analytics.ipynb |
allitems_ready_for_model.csv | Entstanden aus CSGO_Significance_Testing.ipynb und verwendet in CSGO_ML_Model.ipynb |