robot-rlhf

Robot Learning through Human Feedback. Inspired by advancements in NLP, we train a robot policy via reinforcement learning using a reward function learned exclusively from human preferences.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
checkpoints		checkpoints
README.md		README.md
gen_s3_video_links.py		gen_s3_video_links.py
label_videos.py		label_videos.py
loader.py		loader.py
rlhf.py		rlhf.py
rlhf_utils.py		rlhf_utils.py
run_model.py		run_model.py
s3_output_6.csv		s3_output_6.csv
trainer.py		trainer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

checkpoints

checkpoints

README.md

README.md

gen_s3_video_links.py

gen_s3_video_links.py

label_videos.py

label_videos.py

loader.py

loader.py

rlhf.py

rlhf.py

rlhf_utils.py

rlhf_utils.py

run_model.py

run_model.py

s3_output_6.csv

s3_output_6.csv

trainer.py

trainer.py

Repository files navigation

robot-rlhf

About

Releases

Packages

Languages

jeremy-collins/robot-rlhf

Folders and files

Latest commit

History

Repository files navigation

robot-rlhf

About

Topics

Resources

Stars

Watchers

Forks

Languages