GitHub - avramdj/transformers-in-pytorch: My implementation of various popular transformer architectures

Transformers

This repository contains implementations of various transformer models for different natural language processing and computer vision tasks.

BERT

Paper: BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Fill-mask language model pretraining for downstream tasks ✅
Sequence classification ✅
Token classification 💠
Next sentence prediction 💠

GPT-2

Paper: Language Models are Unsupervised Multitask Learners

Semi-supervised training for sequence generation 💠

ViT

Paper: An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

Image inpainting 💠
Image classification 💠

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
base		base
configs		configs
data		data
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
README.md		README.md
finetune_bert_classifier.py		finetune_bert_classifier.py
models.py		models.py
requirements.txt		requirements.txt
test.py		test.py
train_bertmaskedlm.py		train_bertmaskedlm.py
train_gpt2.py		train_gpt2.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

base

base

configs

configs

data

data

.gitignore

.gitignore

.pre-commit-config.yaml

.pre-commit-config.yaml

README.md

README.md

finetune_bert_classifier.py

finetune_bert_classifier.py

models.py

models.py

requirements.txt

requirements.txt

test.py

test.py

train_bertmaskedlm.py

train_bertmaskedlm.py

train_gpt2.py

train_gpt2.py

Repository files navigation

Transformers

BERT

GPT-2

ViT

About

Releases

Packages

Contributors 2

Languages

avramdj/transformers-in-pytorch

Folders and files

Latest commit

History

Repository files navigation

Transformers

BERT

GPT-2

ViT

About

Topics

Resources

Stars

Watchers

Forks

Languages