Super GLUE LLM Benchmark Classification

We selected the SuperGLUE LLM benchmark dataset, focusing on the BoolQ dataset, which involves yes/no questions and corresponding passages. Here's a concise summary of our project:

Project Summary

Initial Exploration and Random Classifier
- Conducted exploratory data analysis.
- Implemented a random classifier achieving ~50% accuracy.
Rules-Based Classifier
- Developed a classifier based on negation terms (e.g., "NOT").
- Attempted passage completeness matching (word overlap between question and passage).
- Achieved better accuracy but still below optimal.
Subset Rule Logic
- Focused on specific question types (comparisons like "is this the same as that").
- Achieved greater than 50% accuracy.
BERT Classifier
- Implemented a BERT model with 32 labels.
- Outperformed rules-based classifiers.
Advanced Techniques
- Employed zero-shot learning, data augmentation, and LLM data (GPT-3 and GPT-4).
- Data augmentation improved performance slightly.
- GPT-4 trained model performed better than GPT-3.
RNN and Data Masking
- Implemented RNN, achieving close to 70% accuracy.
- Incremental data training with BERT showed performance improvements but plateaued.
Model Distillation
- Increased training speed with slight accuracy trade-off (62.25%).
- Considered attention-based distillation for future refinement.

Summary

We explored the SuperGLUE benchmark and BoolQ dataset, implemented various training techniques, and leveraged LLMs for data augmentation. Despite challenges, we achieved significant insights and performance improvements.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
README.md		README.md
adv_nlp_walker_bennett-belka-alvarez.ipynb		adv_nlp_walker_bennett-belka-alvarez.ipynb
executive_summary.pdf		executive_summary.pdf
llm_aug_data.csv		llm_aug_data.csv
soft_labels.csv		soft_labels.csv
train_aug_data.csv		train_aug_data.csv
train_aug_data_full.csv		train_aug_data_full.csv
val_aug_data .csv		val_aug_data .csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

adv_nlp_walker_bennett-belka-alvarez.ipynb

adv_nlp_walker_bennett-belka-alvarez.ipynb

executive_summary.pdf

executive_summary.pdf

llm_aug_data.csv

llm_aug_data.csv

soft_labels.csv

soft_labels.csv

train_aug_data.csv

train_aug_data.csv

train_aug_data_full.csv

train_aug_data_full.csv

val_aug_data .csv

val_aug_data .csv

Repository files navigation

Super GLUE LLM Benchmark Classification

Project Summary

Summary

About

Releases

Packages

Contributors 2

Languages

amberwalker-ds/Advanced_NLP_project

Folders and files

Latest commit

History

Repository files navigation

Super GLUE LLM Benchmark Classification

Project Summary

Summary

About

Topics

Resources

Stars

Watchers

Forks

Languages