GitHub - yurayli/kaggle-redhat: Red hat dataset in kaggle competition

Code for Red Hat Kaggle competition

Competition page https://www.kaggle.com/c/predicting-red-hat-business-value

features: almost all categorical features, and some with high cardinality; one-hot encoding for categorical features; discard 'char_10' in training data; cross validation set split by 'people_id'

xgboost gbtree

model: performance better without one-hot encoding.

Performance:

	CV score	Public	Private
No leak	0.947468	0.953907	0.953896
With leak	N/A	0.990610	0.990595

xgboost gblinear

model: using sparse data.

Performance:

	CV score	Public	Private
No leak	0.979611	0.980765	0.980584
With leak	N/A	0.990158	0.990171

neural net

model: with embedding layer on 'group_1' + Batch Normalization + Dropout

Performance:

	CV score	Public	Private
No leak	0.985189	0.988611	0.988523
With leak	N/A	0.990979	0.990986

ensembling

average of 6 nn + gbl + 3 gbt

Best performance: (~22% of leaderboard)

	Public	Private
No leak	0.987725	0.987664
With leak	0.991087	0.991075

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
README.md		README.md
redHat_dnn.ipynb		redHat_dnn.ipynb
redHat_dnn_oof_stack.py		redHat_dnn_oof_stack.py
redHat_dnn_pplcv.py		redHat_dnn_pplcv.py
redHat_explore.ipynb		redHat_explore.ipynb
redHat_leak.ipynb		redHat_leak.ipynb
redHat_xgb.ipynb		redHat_xgb.ipynb
redHat_xgb.py		redHat_xgb.py
redHat_xgb_oof_stack.ipynb		redHat_xgb_oof_stack.ipynb
redHat_xgb_pplcv.ipynb		redHat_xgb_pplcv.ipynb
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

redHat_dnn.ipynb

redHat_dnn.ipynb

redHat_dnn_oof_stack.py

redHat_dnn_oof_stack.py

redHat_dnn_pplcv.py

redHat_dnn_pplcv.py

redHat_explore.ipynb

redHat_explore.ipynb

redHat_leak.ipynb

redHat_leak.ipynb

redHat_xgb.ipynb

redHat_xgb.ipynb

redHat_xgb.py

redHat_xgb.py

redHat_xgb_oof_stack.ipynb

redHat_xgb_oof_stack.ipynb

redHat_xgb_pplcv.ipynb

redHat_xgb_pplcv.ipynb

utils.py

utils.py

Repository files navigation

Code for Red Hat Kaggle competition

xgboost gbtree

xgboost gblinear

neural net

ensembling

About

Releases

Packages

Languages

yurayli/kaggle-redhat

Folders and files

Latest commit

History

Repository files navigation

Code for Red Hat Kaggle competition

xgboost gbtree

xgboost gblinear

neural net

ensembling

About

Topics

Resources

Stars

Watchers

Forks

Languages