MiniRWKV-4

1.工程介绍：
为使RWKV模型能够具有图文描述，对话，推理等多模态图文能力，主要使用了RWKV作为LLM模型，再配合CLIP，VIT等预训练模型，和Two Stage二阶段思维连提示工程技巧，完成工作。

新添加的blip2rwkv工程，则是实现了使用预训练的RWKV Raven（RWKV World模型同理，只是词表和tokenizer不同，而Dlip-RWKV则基于了RWKV World模型）预训练模型，对图片进行编码。

要注意的是，blip2rwkv使用的RWKV Raven模型为HF格式，而非原生Pth，见https://huggingface.co/StarRing2022/RWKV-4-Raven-3B-v11-zh

2.主要聚合模型：
config/minirwkv4.yaml 文件中有详细配置
RWKV-4-Raven-3B、RWKV-4-Raven-7B（原生pth，推荐V11或V12的Eng49%-Chn49%版本）
blip-image-captioning-large、vit-gpt2-image-captioning、blip-vqa-capfilt-large、vilt-b32-finetuned-vqa、vilt-b32-finetuned-vqa（图片-文本链接模型）
EasyNMT（中英文翻译模型）

3.使用：
环境：WIN10+Torch1.31+Cuda11.6
python app.py
一些测试结果在assets文件夹

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
Blip2RWKV		Blip2RWKV
Language		Language
Visual		Visual
assets		assets
config		config
minirwkv4		minirwkv4
prompts		prompts
20B_tokenizer.json		20B_tokenizer.json
LICENSE		LICENSE
README.md		README.md
app.py		app.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Blip2RWKV

Blip2RWKV

Language

Language

Visual

Visual

assets

assets

config

config

minirwkv4

minirwkv4

prompts

prompts

20B_tokenizer.json

20B_tokenizer.json

LICENSE

LICENSE

README.md

README.md

app.py

app.py

Repository files navigation

MiniRWKV-4

About

Releases

Packages

Languages

License

StarRing2022/MiniRWKV-4

Folders and files

Latest commit

History

Repository files navigation

MiniRWKV-4

About

Resources

License

Stars

Watchers

Forks

Languages