-
Notifications
You must be signed in to change notification settings - Fork 223
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
clevr数据集的使用 #169
Comments
您好,图像数据都是用的M3IT中提供的。 |
谢谢,看了下M3IT,里面json中image是一长串字符,如何将它们对应到VideoChat2给出的“train/39065.jpg”这样的形式? |
我们是根据M3IT给的标注,根据序列idx生成的idx.jpg |
没太明白...想请教下如何将M3IT中的"image_str"和CLEVR数据集中具体的image名称对应起来呢? |
image_str是base64字符串,可以直接读取。我们是转成了RGB图像,image名称是根据for循环遍历M3IT中的数据,对应的idx生成的,不是根据原始CLEVR数据得到的。 |
明白了!您的idx对应的是使用datasets加载数据后遍历的idx对吧? |
对滴 |
好的,感谢您的解答 |
奇怪,我们这边不是这个图嘞,我让当时处理的小伙伴康康 |
好的,感谢~ |
你好,找小伙伴check了一下,对于某些数据集(如CLEVR),M3IT里给的meta信息里有 |
原来如此,不过好像在CLEVR的metadata里没有看到image_index,代码是:
|
可以了!请问是使用huggingface dataset repo里的train.jsonl对吧(而不是train_2023-10-07.jsonl) |
您好,请问image_reasoning - clevr数据集具体是哪个?我按文章中的引用找到了https://cs.stanford.edu/people/jcjohns/clevr/,下载了[CLEVR v1.0 (18 GB)],解压后发现图片内容和json中的格式不对应。
The text was updated successfully, but these errors were encountered: