CLEVR3D

Xu Yan*, Zhihao Yuan*, Yuhao Du, Yinghong Liao, Yao Guo, Shuguang Cui, and Zhen Li "Comprehensive Visual Question Answering on Point Clouds through Compositional Scene Manipulation " [arxiv].

Our paper is accepted by TVCG (IEEE Transactions on Visualization and Computer Graphics)

If you find our work useful in your research, please consider citing:

@article{yan2023comprehensive,
  title={Comprehensive Visual Question Answering on Point Clouds through Compositional Scene Manipulation},
  author={Yan, Xu and Yuan, Zhihao and Du, Yuhao and Liao, Yinghong and Guo, Yao and Cui, Shuguang and Li, Zhen},
  journal={IEEE Transactions on Visualization \& Computer Graphics},
  number={01},
  pages={1--13},
  year={2023},
  publisher={IEEE Computer Society}
}

Installation

Requirements

pytorch >= 1.8
transformers
PyTorch Lightning

Data Preparation

The VQA3D data can be found in data/CLEVR3D/CLEVR3D-REAL.json. The data has the following structure:

{
"question":[
{
    "scan": "f62fd5fd-9a3f-2f44-883a-1e5cf819608e",
    "image_index": 0,
    "question": "Are there the same number of sofas and wide sinks?",
    "answer": "no",
    "template_filename": "compare_integer.json",
    "question_family_index": 0,
    "question_type": "equal_integer"
},
...
]}

The scan number is the same as 3RScan. Please download the preprocessed 3RScan data from Baidu Netdisk (ifei). And modify the data path in lib/config.py.

Training

cd <root dir of this repo>
python main.py --log_dir {LOGNAME} --use_scene_graph --preloading

Evaluation

You cna download our weights from OneDrive

python main.py --test --ckpt_path <dir for the pytorch checkpoint> --use_scene_graph --preloading

Question Generation

The dataset is semi-automatic generated, where an initiating dataset is generated automatically, and some manual modification is applied.

All the files needed for question generation is in the directory of data_generation.

We will generate questions, functional programs, and answers for the scenes. This step takes as input the single JSON file 3dssg_scenes.json containing all ground-truth scene information and outputs a JSON file questions.json containing questions, answers, and functional programs for the questions.

You can generate initiating questions like this:

cd question_generation
python generate_questions.py

By default, generate_questions.py will generate questions for all scenes in the input file. However, you can generate questions by using other flags like --scene_start_idx.

You can find more details about question generation here.

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
data		data
data_generation		data_generation
dataset		dataset
img		img
lib		lib
models		models
utils		utils
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

data

data

data_generation

data_generation

dataset

dataset

img

img

lib

lib

models

models

utils

utils

.gitattributes

.gitattributes

.gitignore

.gitignore

README.md

README.md

main.py

main.py

Repository files navigation

CLEVR3D

Installation

Requirements

Data Preparation

Training

Evaluation

Question Generation

About

Contributors 2

Languages

yanx27/CLEVR3D

Folders and files

Latest commit

History

Repository files navigation

CLEVR3D

Installation

Requirements

Data Preparation

Training

Evaluation

Question Generation

About

Topics

Resources

Stars

Watchers

Forks

Languages