Update tokenizer_config.json
This commit is contained in:
parent
5a212480c9
commit
50f9396f75
@ -1,46 +1,4 @@
|
|||||||
{
|
{
|
||||||
"added_tokens_decoder": {
|
|
||||||
"0": {
|
|
||||||
"content": "<s>",
|
|
||||||
"lstrip": false,
|
|
||||||
"normalized": false,
|
|
||||||
"rstrip": false,
|
|
||||||
"single_word": false,
|
|
||||||
"special": true
|
|
||||||
},
|
|
||||||
"1": {
|
|
||||||
"content": "<pad>",
|
|
||||||
"lstrip": false,
|
|
||||||
"normalized": false,
|
|
||||||
"rstrip": false,
|
|
||||||
"single_word": false,
|
|
||||||
"special": true
|
|
||||||
},
|
|
||||||
"2": {
|
|
||||||
"content": "</s>",
|
|
||||||
"lstrip": false,
|
|
||||||
"normalized": false,
|
|
||||||
"rstrip": false,
|
|
||||||
"single_word": false,
|
|
||||||
"special": true
|
|
||||||
},
|
|
||||||
"250001": {
|
|
||||||
"content": "<mask>",
|
|
||||||
"lstrip": true,
|
|
||||||
"normalized": false,
|
|
||||||
"rstrip": false,
|
|
||||||
"single_word": false,
|
|
||||||
"special": true
|
|
||||||
},
|
|
||||||
"3": {
|
|
||||||
"content": "<unk>",
|
|
||||||
"lstrip": false,
|
|
||||||
"normalized": false,
|
|
||||||
"rstrip": false,
|
|
||||||
"single_word": false,
|
|
||||||
"special": true
|
|
||||||
}
|
|
||||||
},
|
|
||||||
"bos_token": "<s>",
|
"bos_token": "<s>",
|
||||||
"clean_up_tokenization_spaces": true,
|
"clean_up_tokenization_spaces": true,
|
||||||
"cls_token": "<s>",
|
"cls_token": "<s>",
|
||||||
|
|||||||
Loading…
Reference in New Issue
Block a user