Message='BaiChuanTokenizer' object has no attribute 'sp_model' #9

toniedeng · 2024-04-13T16:45:23Z

Message='BaiChuanTokenizer' object has no attribute 'sp_model'
Source=C:\Users\Administrator.cache\huggingface\modules\transformers_modules\Sunsimiao\tokenization_baichuan.py
StackTrace:
File "C:\Users\Administrator.cache\huggingface\modules\transformers_modules\Sunsimiao\tokenization_baichuan.py", line 104, in vocab_size
return self.sp_model.get_piece_size()
File "C:\Users\Administrator.cache\huggingface\modules\transformers_modules\Sunsimiao\tokenization_baichuan.py", line 108, in get_vocab (Current frame)
vocab = {self.convert_ids_to_tokens(i): i for i in range(self.vocab_size)}
File "C:\Users\Administrator.cache\huggingface\modules\transformers_modules\Sunsimiao\tokenization_baichuan.py", line 74, in init
super().init(
File "C:\Users\Administrator.cache\modelscope\modelscope_modules\Sunsimiao\ms_wrapper.py", line 41, in init
self.tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)
File "C:\Users\Administrator.cache\modelscope\modelscope_modules\Sunsimiao\ms_wrapper.py", line 20, in init
model = SunsimiaoTextGeneration(model) if isinstance(model, str) else model
File "C:\Users\Administrator\source\repos\Sunsimiao\scripts\inference_ms.py", line 4, in
pipe = pipeline(task=Tasks.text_generation,

how can i deal?

toniedeng · 2024-04-14T06:02:04Z

deal with change transformers==4.33.1

jingnant · 2024-04-15T12:21:41Z

尝试降级transformers==4.33.3 或者修改tokenization_baichuan.py，super() 修改到最后执行

       self.vocab_file = vocab_file
       self.add_bos_token = add_bos_token
       self.add_eos_token = add_eos_token
       self.sp_model = spm.SentencePieceProcessor(**self.sp_model_kwargs)
       self.sp_model.Load(vocab_file)
       super().__init__(
           bos_token=bos_token,
           eos_token=eos_token,
           unk_token=unk_token,
           pad_token=pad_token,
           add_bos_token=add_bos_token,
           add_eos_token=add_eos_token,
           sp_model_kwargs=self.sp_model_kwargs,
           clean_up_tokenization_spaces=clean_up_tokenization_spaces,
           **kwargs,
       )
       # self.vocab_file = vocab_file
       # self.add_bos_token = add_bos_token
       # self.add_eos_token = add_eos_token
       # self.sp_model = spm.SentencePieceProcessor(**self.sp_model_kwargs)
       # self.sp_model.Load(vocab_file)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Message='BaiChuanTokenizer' object has no attribute 'sp_model' #9

Message='BaiChuanTokenizer' object has no attribute 'sp_model' #9

toniedeng commented Apr 13, 2024

toniedeng commented Apr 14, 2024

jingnant commented Apr 15, 2024

Message='BaiChuanTokenizer' object has no attribute 'sp_model' #9

Message='BaiChuanTokenizer' object has no attribute 'sp_model' #9

Comments

toniedeng commented Apr 13, 2024

toniedeng commented Apr 14, 2024

jingnant commented Apr 15, 2024