tkuye commited on
Commit
ea1c59b
·
1 Parent(s): 227724e

Upload tokenizer

Browse files
Files changed (4) hide show
  1. special_tokens_map.json +7 -0
  2. tokenizer.json +1279 -0
  3. tokenizer_config.json +14 -0
  4. vocab.txt +1124 -0
special_tokens_map.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": "[CLS]",
3
+ "mask_token": "[MASK]",
4
+ "pad_token": "[PAD]",
5
+ "sep_token": "[SEP]",
6
+ "unk_token": "[UNK]"
7
+ }
tokenizer.json ADDED
@@ -0,0 +1,1279 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "version": "1.0",
3
+ "truncation": {
4
+ "direction": "Right",
5
+ "max_length": 512,
6
+ "strategy": "LongestFirst",
7
+ "stride": 0
8
+ },
9
+ "padding": null,
10
+ "added_tokens": [
11
+ {
12
+ "id": 0,
13
+ "content": "[PAD]",
14
+ "single_word": false,
15
+ "lstrip": false,
16
+ "rstrip": false,
17
+ "normalized": false,
18
+ "special": true
19
+ },
20
+ {
21
+ "id": 1,
22
+ "content": "[UNK]",
23
+ "single_word": false,
24
+ "lstrip": false,
25
+ "rstrip": false,
26
+ "normalized": false,
27
+ "special": true
28
+ },
29
+ {
30
+ "id": 2,
31
+ "content": "[CLS]",
32
+ "single_word": false,
33
+ "lstrip": false,
34
+ "rstrip": false,
35
+ "normalized": false,
36
+ "special": true
37
+ },
38
+ {
39
+ "id": 3,
40
+ "content": "[SEP]",
41
+ "single_word": false,
42
+ "lstrip": false,
43
+ "rstrip": false,
44
+ "normalized": false,
45
+ "special": true
46
+ },
47
+ {
48
+ "id": 4,
49
+ "content": "[MASK]",
50
+ "single_word": false,
51
+ "lstrip": false,
52
+ "rstrip": false,
53
+ "normalized": false,
54
+ "special": true
55
+ }
56
+ ],
57
+ "normalizer": {
58
+ "type": "BertNormalizer",
59
+ "clean_text": true,
60
+ "handle_chinese_chars": true,
61
+ "strip_accents": null,
62
+ "lowercase": true
63
+ },
64
+ "pre_tokenizer": {
65
+ "type": "BertPreTokenizer"
66
+ },
67
+ "post_processor": {
68
+ "type": "TemplateProcessing",
69
+ "single": [
70
+ {
71
+ "SpecialToken": {
72
+ "id": "[CLS]",
73
+ "type_id": 0
74
+ }
75
+ },
76
+ {
77
+ "Sequence": {
78
+ "id": "A",
79
+ "type_id": 0
80
+ }
81
+ },
82
+ {
83
+ "SpecialToken": {
84
+ "id": "[SEP]",
85
+ "type_id": 0
86
+ }
87
+ }
88
+ ],
89
+ "pair": [
90
+ {
91
+ "SpecialToken": {
92
+ "id": "[CLS]",
93
+ "type_id": 0
94
+ }
95
+ },
96
+ {
97
+ "Sequence": {
98
+ "id": "A",
99
+ "type_id": 0
100
+ }
101
+ },
102
+ {
103
+ "SpecialToken": {
104
+ "id": "[SEP]",
105
+ "type_id": 0
106
+ }
107
+ },
108
+ {
109
+ "Sequence": {
110
+ "id": "B",
111
+ "type_id": 1
112
+ }
113
+ },
114
+ {
115
+ "SpecialToken": {
116
+ "id": "[SEP]",
117
+ "type_id": 1
118
+ }
119
+ }
120
+ ],
121
+ "special_tokens": {
122
+ "[CLS]": {
123
+ "id": "[CLS]",
124
+ "ids": [
125
+ 2
126
+ ],
127
+ "tokens": [
128
+ "[CLS]"
129
+ ]
130
+ },
131
+ "[SEP]": {
132
+ "id": "[SEP]",
133
+ "ids": [
134
+ 3
135
+ ],
136
+ "tokens": [
137
+ "[SEP]"
138
+ ]
139
+ }
140
+ }
141
+ },
142
+ "decoder": {
143
+ "type": "WordPiece",
144
+ "prefix": "##",
145
+ "cleanup": true
146
+ },
147
+ "model": {
148
+ "type": "WordPiece",
149
+ "unk_token": "[UNK]",
150
+ "continuing_subword_prefix": "##",
151
+ "max_input_chars_per_word": 100,
152
+ "vocab": {
153
+ "[PAD]": 0,
154
+ "[UNK]": 1,
155
+ "[CLS]": 2,
156
+ "[SEP]": 3,
157
+ "[MASK]": 4,
158
+ "!": 5,
159
+ "\"": 6,
160
+ "#": 7,
161
+ "$": 8,
162
+ "%": 9,
163
+ "&": 10,
164
+ "'": 11,
165
+ "(": 12,
166
+ ")": 13,
167
+ "*": 14,
168
+ "+": 15,
169
+ ",": 16,
170
+ "-": 17,
171
+ ".": 18,
172
+ "/": 19,
173
+ "0": 20,
174
+ "1": 21,
175
+ "2": 22,
176
+ "3": 23,
177
+ "4": 24,
178
+ "5": 25,
179
+ "6": 26,
180
+ "7": 27,
181
+ "8": 28,
182
+ "9": 29,
183
+ ":": 30,
184
+ ";": 31,
185
+ "<": 32,
186
+ "=": 33,
187
+ ">": 34,
188
+ "?": 35,
189
+ "@": 36,
190
+ "[": 37,
191
+ "\\": 38,
192
+ "]": 39,
193
+ "^": 40,
194
+ "_": 41,
195
+ "`": 42,
196
+ "a": 43,
197
+ "b": 44,
198
+ "c": 45,
199
+ "d": 46,
200
+ "e": 47,
201
+ "f": 48,
202
+ "g": 49,
203
+ "h": 50,
204
+ "i": 51,
205
+ "j": 52,
206
+ "k": 53,
207
+ "l": 54,
208
+ "m": 55,
209
+ "n": 56,
210
+ "o": 57,
211
+ "p": 58,
212
+ "q": 59,
213
+ "r": 60,
214
+ "s": 61,
215
+ "t": 62,
216
+ "u": 63,
217
+ "v": 64,
218
+ "w": 65,
219
+ "x": 66,
220
+ "y": 67,
221
+ "z": 68,
222
+ "|": 69,
223
+ "}": 70,
224
+ "~": 71,
225
+ "¡": 72,
226
+ "¢": 73,
227
+ "£": 74,
228
+ "¥": 75,
229
+ "§": 76,
230
+ "°": 77,
231
+ "±": 78,
232
+ "²": 79,
233
+ "³": 80,
234
+ "´": 81,
235
+ "µ": 82,
236
+ "·": 83,
237
+ "º": 84,
238
+ "½": 85,
239
+ "¿": 86,
240
+ "×": 87,
241
+ "ß": 88,
242
+ "æ": 89,
243
+ "ð": 90,
244
+ "ø": 91,
245
+ "þ": 92,
246
+ "đ": 93,
247
+ "ħ": 94,
248
+ "ı": 95,
249
+ "ł": 96,
250
+ "œ": 97,
251
+ "ɐ": 98,
252
+ "ɑ": 99,
253
+ "ɒ": 100,
254
+ "ɔ": 101,
255
+ "ə": 102,
256
+ "ɛ": 103,
257
+ "ɜ": 104,
258
+ "ɡ": 105,
259
+ "ɢ": 106,
260
+ "ɪ": 107,
261
+ "ɫ": 108,
262
+ "ɳ": 109,
263
+ "ɽ": 110,
264
+ "ɾ": 111,
265
+ "ʁ": 112,
266
+ "ʃ": 113,
267
+ "ʊ": 114,
268
+ "ʋ": 115,
269
+ "ʒ": 116,
270
+ "ʔ": 117,
271
+ "ʕ": 118,
272
+ "ʲ": 119,
273
+ "ʻ": 120,
274
+ "ʼ": 121,
275
+ "ʾ": 122,
276
+ "ʿ": 123,
277
+ "ˈ": 124,
278
+ "ˌ": 125,
279
+ "ː": 126,
280
+ "α": 127,
281
+ "β": 128,
282
+ "γ": 129,
283
+ "δ": 130,
284
+ "ε": 131,
285
+ "η": 132,
286
+ "θ": 133,
287
+ "ι": 134,
288
+ "κ": 135,
289
+ "λ": 136,
290
+ "μ": 137,
291
+ "ν": 138,
292
+ "ξ": 139,
293
+ "ο": 140,
294
+ "π": 141,
295
+ "ρ": 142,
296
+ "ς": 143,
297
+ "σ": 144,
298
+ "τ": 145,
299
+ "υ": 146,
300
+ "φ": 147,
301
+ "χ": 148,
302
+ "ψ": 149,
303
+ "ω": 150,
304
+ "а": 151,
305
+ "б": 152,
306
+ "в": 153,
307
+ "г": 154,
308
+ "д": 155,
309
+ "е": 156,
310
+ "ж": 157,
311
+ "з": 158,
312
+ "и": 159,
313
+ "к": 160,
314
+ "л": 161,
315
+ "м": 162,
316
+ "н": 163,
317
+ "о": 164,
318
+ "п": 165,
319
+ "р": 166,
320
+ "с": 167,
321
+ "т": 168,
322
+ "у": 169,
323
+ "х": 170,
324
+ "ц": 171,
325
+ "ш": 172,
326
+ "ъ": 173,
327
+ "ы": 174,
328
+ "ь": 175,
329
+ "ю": 176,
330
+ "я": 177,
331
+ "є": 178,
332
+ "א": 179,
333
+ "ב": 180,
334
+ "ג": 181,
335
+ "ה": 182,
336
+ "ו": 183,
337
+ "ז": 184,
338
+ "ח": 185,
339
+ "י": 186,
340
+ "ל": 187,
341
+ "ם": 188,
342
+ "מ": 189,
343
+ "ן": 190,
344
+ "נ": 191,
345
+ "ס": 192,
346
+ "ף": 193,
347
+ "פ": 194,
348
+ "צ": 195,
349
+ "ר": 196,
350
+ "ש": 197,
351
+ "ת": 198,
352
+ "ء": 199,
353
+ "ا": 200,
354
+ "ب": 201,
355
+ "ة": 202,
356
+ "ت": 203,
357
+ "ث": 204,
358
+ "ج": 205,
359
+ "ح": 206,
360
+ "خ": 207,
361
+ "د": 208,
362
+ "ذ": 209,
363
+ "ر": 210,
364
+ "س": 211,
365
+ "ش": 212,
366
+ "ص": 213,
367
+ "ع": 214,
368
+ "ف": 215,
369
+ "ق": 216,
370
+ "ك": 217,
371
+ "ل": 218,
372
+ "م": 219,
373
+ "ن": 220,
374
+ "ه": 221,
375
+ "و": 222,
376
+ "ي": 223,
377
+ "ܐ": 224,
378
+ "ܕ": 225,
379
+ "ܗ": 226,
380
+ "ܝ": 227,
381
+ "ܠ": 228,
382
+ "ܢ": 229,
383
+ "ܬ": 230,
384
+ "अ": 231,
385
+ "ई": 232,
386
+ "क": 233,
387
+ "ग": 234,
388
+ "ण": 235,
389
+ "त": 236,
390
+ "द": 237,
391
+ "न": 238,
392
+ "प": 239,
393
+ "ब": 240,
394
+ "म": 241,
395
+ "य": 242,
396
+ "र": 243,
397
+ "ल": 244,
398
+ "व": 245,
399
+ "स": 246,
400
+ "ह": 247,
401
+ "ा": 248,
402
+ "ि": 249,
403
+ "আ": 250,
404
+ "ল": 251,
405
+ "হ": 252,
406
+ "া": 253,
407
+ "ਅ": 254,
408
+ "ਲ": 255,
409
+ "ਹ": 256,
410
+ "ਾ": 257,
411
+ "അ": 258,
412
+ "ള": 259,
413
+ "ഹ": 260,
414
+ "ാ": 261,
415
+ "ก": 262,
416
+ "ค": 263,
417
+ "ง": 264,
418
+ "ช": 265,
419
+ "ซ": 266,
420
+ "ญ": 267,
421
+ "ฐ": 268,
422
+ "ณ": 269,
423
+ "ด": 270,
424
+ "ต": 271,
425
+ "น": 272,
426
+ "บ": 273,
427
+ "ป": 274,
428
+ "พ": 275,
429
+ "ภ": 276,
430
+ "ม": 277,
431
+ "ย": 278,
432
+ "ร": 279,
433
+ "ล": 280,
434
+ "ว": 281,
435
+ "ศ": 282,
436
+ "ษ": 283,
437
+ "ส": 284,
438
+ "ห": 285,
439
+ "อ": 286,
440
+ "ฮ": 287,
441
+ "ะ": 288,
442
+ "า": 289,
443
+ "เ": 290,
444
+ "แ": 291,
445
+ "ไ": 292,
446
+ "ა": 293,
447
+ "ბ": 294,
448
+ "გ": 295,
449
+ "დ": 296,
450
+ "ე": 297,
451
+ "ვ": 298,
452
+ "ზ": 299,
453
+ "თ": 300,
454
+ "ი": 301,
455
+ "კ": 302,
456
+ "ლ": 303,
457
+ "მ": 304,
458
+ "ნ": 305,
459
+ "ო": 306,
460
+ "პ": 307,
461
+ "ჟ": 308,
462
+ "რ": 309,
463
+ "ს": 310,
464
+ "ტ": 311,
465
+ "უ": 312,
466
+ "ფ": 313,
467
+ "ქ": 314,
468
+ "ღ": 315,
469
+ "ყ": 316,
470
+ "შ": 317,
471
+ "ჩ": 318,
472
+ "ც": 319,
473
+ "ძ": 320,
474
+ "წ": 321,
475
+ "ჭ": 322,
476
+ "ხ": 323,
477
+ "ჯ": 324,
478
+ "ჰ": 325,
479
+ "ჱ": 326,
480
+ "ჲ": 327,
481
+ "ჳ": 328,
482
+ "ჴ": 329,
483
+ "ჵ": 330,
484
+ "ჶ": 331,
485
+ "ჷ": 332,
486
+ "ჸ": 333,
487
+ "ჹ": 334,
488
+ "ჺ": 335,
489
+ "჻": 336,
490
+ "ᄃ": 337,
491
+ "ᄅ": 338,
492
+ "ᄇ": 339,
493
+ "ᄋ": 340,
494
+ "ᄌ": 341,
495
+ "ᅡ": 342,
496
+ "ᅢ": 343,
497
+ "ᅦ": 344,
498
+ "ᅧ": 345,
499
+ "ᅩ": 346,
500
+ "ᅮ": 347,
501
+ "ᅵ": 348,
502
+ "ᆨ": 349,
503
+ "ᆫ": 350,
504
+ "ᆯ": 351,
505
+ "ᆸ": 352,
506
+ "ᆼ": 353,
507
+ "ᵻ": 354,
508
+ "‐": 355,
509
+ "‑": 356,
510
+ "–": 357,
511
+ "—": 358,
512
+ "―": 359,
513
+ "‘": 360,
514
+ "’": 361,
515
+ "“": 362,
516
+ "”": 363,
517
+ "„": 364,
518
+ "†": 365,
519
+ "‡": 366,
520
+ "•": 367,
521
+ "…": 368,
522
+ "′": 369,
523
+ "″": 370,
524
+ "⁄": 371,
525
+ "₣": 372,
526
+ "₤": 373,
527
+ "€": 374,
528
+ "₹": 375,
529
+ "⅓": 376,
530
+ "⅔": 377,
531
+ "→": 378,
532
+ "−": 379,
533
+ "≡": 380,
534
+ "≤": 381,
535
+ "①": 382,
536
+ "☉": 383,
537
+ "☫": 384,
538
+ "♀": 385,
539
+ "♭": 386,
540
+ "♯": 387,
541
+ "⚳": 388,
542
+ "ⴀ": 389,
543
+ "ⴂ": 390,
544
+ "ⴃ": 391,
545
+ "ⴈ": 392,
546
+ "ⴌ": 393,
547
+ "ⴕ": 394,
548
+ "ⴟ": 395,
549
+ "〈": 396,
550
+ "〉": 397,
551
+ "〜": 398,
552
+ "あ": 399,
553
+ "い": 400,
554
+ "う": 401,
555
+ "お": 402,
556
+ "か": 403,
557
+ "き": 404,
558
+ "く": 405,
559
+ "け": 406,
560
+ "こ": 407,
561
+ "さ": 408,
562
+ "し": 409,
563
+ "す": 410,
564
+ "せ": 411,
565
+ "た": 412,
566
+ "ち": 413,
567
+ "っ": 414,
568
+ "つ": 415,
569
+ "と": 416,
570
+ "な": 417,
571
+ "に": 418,
572
+ "の": 419,
573
+ "は": 420,
574
+ "ひ": 421,
575
+ "ふ": 422,
576
+ "ほ": 423,
577
+ "ま": 424,
578
+ "み": 425,
579
+ "め": 426,
580
+ "も": 427,
581
+ "ゃ": 428,
582
+ "ゆ": 429,
583
+ "ょ": 430,
584
+ "ら": 431,
585
+ "り": 432,
586
+ "る": 433,
587
+ "れ": 434,
588
+ "わ": 435,
589
+ "を": 436,
590
+ "ん": 437,
591
+ "ァ": 438,
592
+ "ア": 439,
593
+ "ィ": 440,
594
+ "イ": 441,
595
+ "ゥ": 442,
596
+ "ウ": 443,
597
+ "ェ": 444,
598
+ "エ": 445,
599
+ "ォ": 446,
600
+ "オ": 447,
601
+ "カ": 448,
602
+ "キ": 449,
603
+ "ク": 450,
604
+ "ケ": 451,
605
+ "コ": 452,
606
+ "サ": 453,
607
+ "シ": 454,
608
+ "ス": 455,
609
+ "セ": 456,
610
+ "タ": 457,
611
+ "チ": 458,
612
+ "ッ": 459,
613
+ "ツ": 460,
614
+ "テ": 461,
615
+ "ト": 462,
616
+ "ナ": 463,
617
+ "ニ": 464,
618
+ "ネ": 465,
619
+ "ノ": 466,
620
+ "ハ": 467,
621
+ "フ": 468,
622
+ "ヘ": 469,
623
+ "マ": 470,
624
+ "ミ": 471,
625
+ "ム": 472,
626
+ "モ": 473,
627
+ "ャ": 474,
628
+ "ュ": 475,
629
+ "ョ": 476,
630
+ "ラ": 477,
631
+ "リ": 478,
632
+ "ル": 479,
633
+ "レ": 480,
634
+ "ロ": 481,
635
+ "ン": 482,
636
+ "・": 483,
637
+ "ー": 484,
638
+ "一": 485,
639
+ "七": 486,
640
+ "下": 487,
641
+ "世": 488,
642
+ "丙": 489,
643
+ "中": 490,
644
+ "主": 491,
645
+ "乃": 492,
646
+ "之": 493,
647
+ "乙": 494,
648
+ "九": 495,
649
+ "二": 496,
650
+ "云": 497,
651
+ "人": 498,
652
+ "今": 499,
653
+ "付": 500,
654
+ "作": 501,
655
+ "侗": 502,
656
+ "依": 503,
657
+ "信": 504,
658
+ "傳": 505,
659
+ "儚": 506,
660
+ "充": 507,
661
+ "光": 508,
662
+ "全": 509,
663
+ "兵": 510,
664
+ "其": 511,
665
+ "具": 512,
666
+ "円": 513,
667
+ "再": 514,
668
+ "出": 515,
669
+ "判": 516,
670
+ "前": 517,
671
+ "剛": 518,
672
+ "劇": 519,
673
+ "劉": 520,
674
+ "動": 521,
675
+ "化": 522,
676
+ "北": 523,
677
+ "华": 524,
678
+ "厂": 525,
679
+ "去": 526,
680
+ "古": 527,
681
+ "可": 528,
682
+ "台": 529,
683
+ "史": 530,
684
+ "同": 531,
685
+ "名": 532,
686
+ "君": 533,
687
+ "吳": 534,
688
+ "周": 535,
689
+ "命": 536,
690
+ "和": 537,
691
+ "咲": 538,
692
+ "善": 539,
693
+ "四": 540,
694
+ "國": 541,
695
+ "園": 542,
696
+ "圣": 543,
697
+ "在": 544,
698
+ "坂": 545,
699
+ "堤": 546,
700
+ "場": 547,
701
+ "塘": 548,
702
+ "夕": 549,
703
+ "大": 550,
704
+ "天": 551,
705
+ "夫": 552,
706
+ "女": 553,
707
+ "妙": 554,
708
+ "姚": 555,
709
+ "子": 556,
710
+ "孟": 557,
711
+ "守": 558,
712
+ "安": 559,
713
+ "宋": 560,
714
+ "完": 561,
715
+ "宗": 562,
716
+ "宝": 563,
717
+ "宫": 564,
718
+ "寝": 565,
719
+ "寺": 566,
720
+ "小": 567,
721
+ "少": 568,
722
+ "尾": 569,
723
+ "山": 570,
724
+ "岳": 571,
725
+ "川": 572,
726
+ "州": 573,
727
+ "巳": 574,
728
+ "市": 575,
729
+ "師": 576,
730
+ "平": 577,
731
+ "广": 578,
732
+ "庆": 579,
733
+ "府": 580,
734
+ "座": 581,
735
+ "廬": 582,
736
+ "建": 583,
737
+ "式": 584,
738
+ "張": 585,
739
+ "彌": 586,
740
+ "彩": 587,
741
+ "彼": 588,
742
+ "後": 589,
743
+ "御": 590,
744
+ "德": 591,
745
+ "思": 592,
746
+ "愛": 593,
747
+ "憑": 594,
748
+ "憶": 595,
749
+ "應": 596,
750
+ "懷": 597,
751
+ "战": 598,
752
+ "戦": 599,
753
+ "扈": 600,
754
+ "技": 601,
755
+ "拉": 602,
756
+ "拳": 603,
757
+ "挑": 604,
758
+ "揺": 605,
759
+ "攻": 606,
760
+ "放": 607,
761
+ "政": 608,
762
+ "散": 609,
763
+ "斯": 610,
764
+ "方": 611,
765
+ "日": 612,
766
+ "旦": 613,
767
+ "旭": 614,
768
+ "昌": 615,
769
+ "明": 616,
770
+ "星": 617,
771
+ "春": 618,
772
+ "晋": 619,
773
+ "景": 620,
774
+ "曦": 621,
775
+ "月": 622,
776
+ "望": 623,
777
+ "未": 624,
778
+ "本": 625,
779
+ "李": 626,
780
+ "村": 627,
781
+ "杜": 628,
782
+ "束": 629,
783
+ "来": 630,
784
+ "林": 631,
785
+ "桜": 632,
786
+ "梶": 633,
787
+ "棘": 634,
788
+ "椎": 635,
789
+ "楊": 636,
790
+ "楚": 637,
791
+ "榮": 638,
792
+ "橘": 639,
793
+ "機": 640,
794
+ "正": 641,
795
+ "殻": 642,
796
+ "殿": 643,
797
+ "母": 644,
798
+ "水": 645,
799
+ "汉": 646,
800
+ "沂": 647,
801
+ "沙": 648,
802
+ "河": 649,
803
+ "泗": 650,
804
+ "波": 651,
805
+ "泣": 652,
806
+ "洪": 653,
807
+ "淹": 654,
808
+ "清": 655,
809
+ "湯": 656,
810
+ "漢": 657,
811
+ "澄": 658,
812
+ "澤": 659,
813
+ "火": 660,
814
+ "灯": 661,
815
+ "灵": 662,
816
+ "灼": 663,
817
+ "焼": 664,
818
+ "熱": 665,
819
+ "物": 666,
820
+ "狐": 667,
821
+ "狸": 668,
822
+ "玄": 669,
823
+ "王": 670,
824
+ "玩": 671,
825
+ "珂": 672,
826
+ "珙": 673,
827
+ "球": 674,
828
+ "理": 675,
829
+ "琦": 676,
830
+ "琪": 677,
831
+ "瓊": 678,
832
+ "生": 679,
833
+ "田": 680,
834
+ "畢": 681,
835
+ "番": 682,
836
+ "瘡": 683,
837
+ "白": 684,
838
+ "皮": 685,
839
+ "真": 686,
840
+ "砲": 687,
841
+ "礮": 688,
842
+ "祈": 689,
843
+ "神": 690,
844
+ "祠": 691,
845
+ "秋": 692,
846
+ "空": 693,
847
+ "立": 694,
848
+ "精": 695,
849
+ "約": 696,
850
+ "絵": 697,
851
+ "織": 698,
852
+ "義": 699,
853
+ "翠": 700,
854
+ "者": 701,
855
+ "耕": 702,
856
+ "肖": 703,
857
+ "胡": 704,
858
+ "膀": 705,
859
+ "臂": 706,
860
+ "興": 707,
861
+ "良": 708,
862
+ "花": 709,
863
+ "芳": 710,
864
+ "芽": 711,
865
+ "若": 712,
866
+ "英": 713,
867
+ "藕": 714,
868
+ "藥": 715,
869
+ "蘄": 716,
870
+ "蘇": 717,
871
+ "行": 718,
872
+ "裁": 719,
873
+ "規": 720,
874
+ "覺": 721,
875
+ "观": 722,
876
+ "解": 723,
877
+ "記": 724,
878
+ "誓": 725,
879
+ "誡": 726,
880
+ "誰": 727,
881
+ "謎": 728,
882
+ "许": 729,
883
+ "谭": 730,
884
+ "豪": 731,
885
+ "豫": 732,
886
+ "費": 733,
887
+ "贵": 734,
888
+ "赤": 735,
889
+ "趙": 736,
890
+ "足": 737,
891
+ "跡": 738,
892
+ "転": 739,
893
+ "辛": 740,
894
+ "逆": 741,
895
+ "遇": 742,
896
+ "運": 743,
897
+ "過": 744,
898
+ "遠": 745,
899
+ "選": 746,
900
+ "邦": 747,
901
+ "邱": 748,
902
+ "部": 749,
903
+ "郭": 750,
904
+ "都": 751,
905
+ "酈": 752,
906
+ "里": 753,
907
+ "野": 754,
908
+ "金": 755,
909
+ "銃": 756,
910
+ "鋼": 757,
911
+ "錄": 758,
912
+ "錡": 759,
913
+ "鍵": 760,
914
+ "鐵": 761,
915
+ "钱": 762,
916
+ "铁": 763,
917
+ "關": 764,
918
+ "防": 765,
919
+ "阿": 766,
920
+ "陈": 767,
921
+ "陳": 768,
922
+ "陽": 769,
923
+ "隊": 770,
924
+ "階": 771,
925
+ "集": 772,
926
+ "雪": 773,
927
+ "雲": 774,
928
+ "霖": 775,
929
+ "霹": 776,
930
+ "靂": 777,
931
+ "韓": 778,
932
+ "願": 779,
933
+ "顯": 780,
934
+ "颜": 781,
935
+ "马": 782,
936
+ "高": 783,
937
+ "龍": 784,
938
+ "ﷲ": 785,
939
+ "ﻋ": 786,
940
+ "/": 787,
941
+ "3": 788,
942
+ "~": 789,
943
+ "##o": 790,
944
+ "##l": 791,
945
+ "##e": 792,
946
+ "##y": 793,
947
+ "##i": 794,
948
+ "##n": 795,
949
+ "##g": 796,
950
+ "##r": 797,
951
+ "##c": 798,
952
+ "##u": 799,
953
+ "##d": 800,
954
+ "##m": 801,
955
+ "##b": 802,
956
+ "##a": 803,
957
+ "##p": 804,
958
+ "##h": 805,
959
+ "##s": 806,
960
+ "##t": 807,
961
+ "##v": 808,
962
+ "##w": 809,
963
+ "##k": 810,
964
+ "##ı": 811,
965
+ "##z": 812,
966
+ "##f": 813,
967
+ "##x": 814,
968
+ "##η": 815,
969
+ "##μ": 816,
970
+ "##τ": 817,
971
+ "##ρ": 818,
972
+ "##α": 819,
973
+ "##2": 820,
974
+ "##5": 821,
975
+ "##7": 822,
976
+ "##8": 823,
977
+ "##j": 824,
978
+ "##q": 825,
979
+ "##0": 826,
980
+ "##4": 827,
981
+ "##6": 828,
982
+ "##ł": 829,
983
+ "##3": 830,
984
+ "##1": 831,
985
+ "##ل": 832,
986
+ "##ع": 833,
987
+ "##ة": 834,
988
+ "##ɛ": 835,
989
+ "##ß": 836,
990
+ "##ə": 837,
991
+ "##ˈ": 838,
992
+ "##9": 839,
993
+ "##ɪ": 840,
994
+ "##ป": 841,
995
+ "##ย": 842,
996
+ "##о": 843,
997
+ "##ю": 844,
998
+ "##з": 845,
999
+ "##æ": 846,
1000
+ "##の": 847,
1001
+ "##な": 848,
1002
+ "##ら": 849,
1003
+ "##რ": 850,
1004
+ "##ი": 851,
1005
+ "##ს": 852,
1006
+ "##ტ": 853,
1007
+ "##ე": 854,
1008
+ "##ʻ": 855,
1009
+ "##ᄇ": 856,
1010
+ "##ᅮ": 857,
1011
+ "##ᄃ": 858,
1012
+ "##ᅢ": 859,
1013
+ "##お": 860,
1014
+ "##ო": 861,
1015
+ "##მ": 862,
1016
+ "##თ": 863,
1017
+ "##ა": 864,
1018
+ "##ვ": 865,
1019
+ "##უ": 866,
1020
+ "##ლ": 867,
1021
+ "##ث": 868,
1022
+ "##م": 869,
1023
+ "##د": 870,
1024
+ "##ウ": 871,
1025
+ "##ァ": 872,
1026
+ "##ル": 873,
1027
+ "##キ": 874,
1028
+ "##ュ": 875,
1029
+ "##リ": 876,
1030
+ "##ア": 877,
1031
+ "##а": 878,
1032
+ "##т": 879,
1033
+ "##р": 880,
1034
+ "##и": 881,
1035
+ "##ш": 882,
1036
+ "##е": 883,
1037
+ "##с": 884,
1038
+ "##к": 885,
1039
+ "##ʊ": 886,
1040
+ "##ˌ": 887,
1041
+ "##ː": 888,
1042
+ "##つ": 889,
1043
+ "##せ": 890,
1044
+ "##ん": 891,
1045
+ "##ッ": 892,
1046
+ "##ク": 893,
1047
+ "##マ": 894,
1048
+ "##ン": 895,
1049
+ "##ɫ": 896,
1050
+ "##ق": 897,
1051
+ "##ي": 898,
1052
+ "##ش": 899,
1053
+ "##و": 900,
1054
+ "##ب": 901,
1055
+ "##ø": 902,
1056
+ "##ノ": 903,
1057
+ "##ー": 904,
1058
+ "##ล": 905,
1059
+ "##อ": 906,
1060
+ "##ฮ": 907,
1061
+ "##ラ": 908,
1062
+ "##ω": 909,
1063
+ "##ε": 910,
1064
+ "##ι": 911,
1065
+ "##ο": 912,
1066
+ "##ς": 913,
1067
+ "##พ": 914,
1068
+ "##ร": 915,
1069
+ "##ל": 916,
1070
+ "##ה": 917,
1071
+ "##ह": 918,
1072
+ "##ण": 919,
1073
+ "##đ": 920,
1074
+ "##ゆ": 921,
1075
+ "##り": 922,
1076
+ "##ल": 923,
1077
+ "##ν": 924,
1078
+ "##κ": 925,
1079
+ "##ص": 926,
1080
+ "##ن": 927,
1081
+ "##イ": 928,
1082
+ "##ス": 929,
1083
+ "##ा": 930,
1084
+ "##द": 931,
1085
+ "##き": 932,
1086
+ "##こ": 933,
1087
+ "##と": 934,
1088
+ "##あ": 935,
1089
+ "##ɑ": 936,
1090
+ "##セ": 937,
1091
+ "##オ": 938,
1092
+ "##ʿ": 939,
1093
+ "##ᅡ": 940,
1094
+ "##ᆯ": 941,
1095
+ "##ᄅ": 942,
1096
+ "##テ": 943,
1097
+ "##ィ": 944,
1098
+ "##ニ": 945,
1099
+ "##ল": 946,
1100
+ "##º": 947,
1101
+ "##ก": 948,
1102
+ "##ว": 949,
1103
+ "##ɳ": 950,
1104
+ "##β": 951,
1105
+ "##ت": 952,
1106
+ "##פ": 953,
1107
+ "##ხ": 954,
1108
+ "##ษ": 955,
1109
+ "##ฐ": 956,
1110
+ "##ן": 957,
1111
+ "##ɜ": 958,
1112
+ "##ᵻ": 959,
1113
+ "##व": 960,
1114
+ "##ि": 961,
1115
+ "##क": 962,
1116
+ "##υ": 963,
1117
+ "##н": 964,
1118
+ "##わ": 965,
1119
+ "##い": 966,
1120
+ "##ɡ": 967,
1121
+ "##は": 968,
1122
+ "##く": 969,
1123
+ "##ც": 970,
1124
+ "##χ": 971,
1125
+ "##た": 972,
1126
+ "##ð": 973,
1127
+ "##δ": 974,
1128
+ "##ʁ": 975,
1129
+ "##σ": 976,
1130
+ "##ر": 977,
1131
+ "##ナ": 978,
1132
+ "##ミ": 979,
1133
+ "##ב": 980,
1134
+ "##ר": 981,
1135
+ "##ם": 982,
1136
+ "##წ": 983,
1137
+ "##ფ": 984,
1138
+ "##う": 985,
1139
+ "##カ": 986,
1140
+ "##დ": 987,
1141
+ "##ま": 988,
1142
+ "##る": 989,
1143
+ "##λ": 990,
1144
+ "##π": 991,
1145
+ "##ъ": 992,
1146
+ "##в": 993,
1147
+ "##ാ": 994,
1148
+ "##ഹ": 995,
1149
+ "##ا": 996,
1150
+ "##3": 997,
1151
+ "##ハ": 998,
1152
+ "##ト": 999,
1153
+ "##न": 1000,
1154
+ "##ई": 1001,
1155
+ "##י": 1002,
1156
+ "##ש": 1003,
1157
+ "##מ": 1004,
1158
+ "##צ": 1005,
1159
+ "##ะ": 1006,
1160
+ "##ช": 1007,
1161
+ "##น": 1008,
1162
+ "##ロ": 1009,
1163
+ "##ჲ": 1010,
1164
+ "##œ": 1011,
1165
+ "##ɾ": 1012,
1166
+ "##เ": 1013,
1167
+ "##д": 1014,
1168
+ "##ж": 1015,
1169
+ "##л": 1016,
1170
+ "##я": 1017,
1171
+ "##θ": 1018,
1172
+ "##ง": 1019,
1173
+ "##ไ": 1020,
1174
+ "##า": 1021,
1175
+ "##っ": 1022,
1176
+ "##ɒ": 1023,
1177
+ "##か": 1024,
1178
+ "##レ": 1025,
1179
+ "##チ": 1026,
1180
+ "##ы": 1027,
1181
+ "##ォ": 1028,
1182
+ "##ゥ": 1029,
1183
+ "##ツ": 1030,
1184
+ "##ネ": 1031,
1185
+ "##ц": 1032,
1186
+ "##ь": 1033,
1187
+ "##め": 1034,
1188
+ "##ち": 1035,
1189
+ "##ゃ": 1036,
1190
+ "##є": 1037,
1191
+ "##ء": 1038,
1192
+ "##れ": 1039,
1193
+ "##み": 1040,
1194
+ "##п": 1041,
1195
+ "##г": 1042,
1196
+ "##ف": 1043,
1197
+ "##س": 1044,
1198
+ "##サ": 1045,
1199
+ "##ו": 1046,
1200
+ "##נ": 1047,
1201
+ "##у": 1048,
1202
+ "##シ": 1049,
1203
+ "##ョ": 1050,
1204
+ "##ه": 1051,
1205
+ "##ェ": 1052,
1206
+ "##х": 1053,
1207
+ "##し": 1054,
1208
+ "##す": 1055,
1209
+ "##ひ": 1056,
1210
+ "##フ": 1057,
1211
+ "##ャ": 1058,
1212
+ "##モ": 1059,
1213
+ "##ภ": 1060,
1214
+ "##ด": 1061,
1215
+ "##र": 1062,
1216
+ "##ح": 1063,
1217
+ "##ס": 1064,
1218
+ "##א": 1065,
1219
+ "##ɔ": 1066,
1220
+ "##ʃ": 1067,
1221
+ "##ਲ": 1068,
1222
+ "##ਾ": 1069,
1223
+ "##ਹ": 1070,
1224
+ "##ჱ": 1071,
1225
+ "##ʔ": 1072,
1226
+ "##ܕ": 1073,
1227
+ "##ܝ": 1074,
1228
+ "##ܢ": 1075,
1229
+ "##ܬ": 1076,
1230
+ "##エ": 1077,
1231
+ "##タ": 1078,
1232
+ "##ك": 1079,
1233
+ "##خ": 1080,
1234
+ "##ξ": 1081,
1235
+ "##ذ": 1082,
1236
+ "##ქ": 1083,
1237
+ "##ნ": 1084,
1238
+ "##ܠ": 1085,
1239
+ "##ܗ": 1086,
1240
+ "##ܐ": 1087,
1241
+ "##ム": 1088,
1242
+ "##м": 1089,
1243
+ "##γ": 1090,
1244
+ "##ψ": 1091,
1245
+ "##ള": 1092,
1246
+ "##ჳ": 1093,
1247
+ "##แ": 1094,
1248
+ "##स": 1095,
1249
+ "##ת": 1096,
1250
+ "##ค": 1097,
1251
+ "##ต": 1098,
1252
+ "##გ": 1099,
1253
+ "##ʒ": 1100,
1254
+ "##ซ": 1101,
1255
+ "##ʲ": 1102,
1256
+ "##も": 1103,
1257
+ "##ょ": 1104,
1258
+ "##に": 1105,
1259
+ "##া": 1106,
1260
+ "##হ": 1107,
1261
+ "##ɽ": 1108,
1262
+ "##ᅦ": 1109,
1263
+ "##ᅩ": 1110,
1264
+ "##ᆨ": 1111,
1265
+ "##ᅵ": 1112,
1266
+ "##ᆸ": 1113,
1267
+ "##ᅧ": 1114,
1268
+ "##ᆼ": 1115,
1269
+ "##ᄋ": 1116,
1270
+ "##ᆫ": 1117,
1271
+ "##ग": 1118,
1272
+ "##ɐ": 1119,
1273
+ "##を": 1120,
1274
+ "##ף": 1121,
1275
+ "##ณ": 1122,
1276
+ "##ม": 1123
1277
+ }
1278
+ }
1279
+ }
tokenizer_config.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": "[CLS]",
3
+ "do_lower_case": true,
4
+ "mask_token": "[MASK]",
5
+ "model_max_length": 512,
6
+ "name_or_path": "hf-internal-testing/tiny-random-distilbert",
7
+ "pad_token": "[PAD]",
8
+ "sep_token": "[SEP]",
9
+ "special_tokens_map_file": null,
10
+ "strip_accents": null,
11
+ "tokenize_chinese_chars": true,
12
+ "tokenizer_class": "DistilBertTokenizer",
13
+ "unk_token": "[UNK]"
14
+ }
vocab.txt ADDED
@@ -0,0 +1,1124 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [PAD]
2
+ [UNK]
3
+ [CLS]
4
+ [SEP]
5
+ [MASK]
6
+ !
7
+ "
8
+ #
9
+ $
10
+ %
11
+ &
12
+ '
13
+ (
14
+ )
15
+ *
16
+ +
17
+ ,
18
+ -
19
+ .
20
+ /
21
+ 0
22
+ 1
23
+ 2
24
+ 3
25
+ 4
26
+ 5
27
+ 6
28
+ 7
29
+ 8
30
+ 9
31
+ :
32
+ ;
33
+ <
34
+ =
35
+ >
36
+ ?
37
+ @
38
+ [
39
+ \
40
+ ]
41
+ ^
42
+ _
43
+ `
44
+ a
45
+ b
46
+ c
47
+ d
48
+ e
49
+ f
50
+ g
51
+ h
52
+ i
53
+ j
54
+ k
55
+ l
56
+ m
57
+ n
58
+ o
59
+ p
60
+ q
61
+ r
62
+ s
63
+ t
64
+ u
65
+ v
66
+ w
67
+ x
68
+ y
69
+ z
70
+ |
71
+ }
72
+ ~
73
+ ¡
74
+ ¢
75
+ £
76
+ ¥
77
+ §
78
+ °
79
+ ±
80
+ ²
81
+ ³
82
+ ´
83
+ µ
84
+ ·
85
+ º
86
+ ½
87
+ ¿
88
+ ×
89
+ ß
90
+ æ
91
+ ð
92
+ ø
93
+ þ
94
+ đ
95
+ ħ
96
+ ı
97
+ ł
98
+ œ
99
+ ɐ
100
+ ɑ
101
+ ɒ
102
+ ɔ
103
+ ə
104
+ ɛ
105
+ ɜ
106
+ ɡ
107
+ ɢ
108
+ ɪ
109
+ ɫ
110
+ ɳ
111
+ ɽ
112
+ ɾ
113
+ ʁ
114
+ ʃ
115
+ ʊ
116
+ ʋ
117
+ ʒ
118
+ ʔ
119
+ ʕ
120
+ ʲ
121
+ ʻ
122
+ ʼ
123
+ ʾ
124
+ ʿ
125
+ ˈ
126
+ ˌ
127
+ ː
128
+ α
129
+ β
130
+ γ
131
+ δ
132
+ ε
133
+ η
134
+ θ
135
+ ι
136
+ κ
137
+ λ
138
+ μ
139
+ ν
140
+ ξ
141
+ ο
142
+ π
143
+ ρ
144
+ ς
145
+ σ
146
+ τ
147
+ υ
148
+ φ
149
+ χ
150
+ ψ
151
+ ω
152
+ а
153
+ б
154
+ в
155
+ г
156
+ д
157
+ е
158
+ ж
159
+ з
160
+ и
161
+ к
162
+ л
163
+ м
164
+ н
165
+ о
166
+ п
167
+ р
168
+ с
169
+ т
170
+ у
171
+ х
172
+ ц
173
+ ш
174
+ ъ
175
+ ы
176
+ ь
177
+ ю
178
+ я
179
+ є
180
+ א
181
+ ב
182
+ ג
183
+ ה
184
+ ו
185
+ ז
186
+ ח
187
+ י
188
+ ל
189
+ ם
190
+ מ
191
+ ן
192
+ נ
193
+ ס
194
+ ף
195
+ פ
196
+ צ
197
+ ר
198
+ ש
199
+ ת
200
+ ء
201
+ ا
202
+ ب
203
+ ة
204
+ ت
205
+ ث
206
+ ج
207
+ ح
208
+ خ
209
+ د
210
+ ذ
211
+ ر
212
+ س
213
+ ش
214
+ ص
215
+ ع
216
+ ف
217
+ ق
218
+ ك
219
+ ل
220
+ م
221
+ ن
222
+ ه
223
+ و
224
+ ي
225
+ ܐ
226
+ ܕ
227
+ ܗ
228
+ ܝ
229
+ ܠ
230
+ ܢ
231
+ ܬ
232
+
233
+
234
+
235
+
236
+
237
+
238
+
239
+
240
+
241
+
242
+
243
+
244
+
245
+
246
+
247
+
248
+
249
+
250
+ ि
251
+
252
+
253
+
254
+
255
+
256
+
257
+
258
+
259
+
260
+
261
+
262
+
263
+
264
+
265
+
266
+
267
+
268
+
269
+
270
+
271
+
272
+
273
+
274
+
275
+
276
+
277
+
278
+
279
+
280
+
281
+
282
+
283
+
284
+
285
+
286
+
287
+
288
+
289
+
290
+
291
+
292
+
293
+
294
+
295
+
296
+
297
+
298
+
299
+
300
+
301
+
302
+
303
+
304
+
305
+
306
+
307
+
308
+
309
+
310
+
311
+
312
+
313
+
314
+
315
+
316
+
317
+
318
+
319
+
320
+
321
+
322
+
323
+
324
+
325
+
326
+
327
+
328
+
329
+
330
+
331
+
332
+
333
+
334
+
335
+
336
+
337
+
338
+
339
+
340
+
341
+
342
+
343
+
344
+
345
+
346
+
347
+
348
+
349
+
350
+
351
+
352
+
353
+
354
+
355
+
356
+
357
+
358
+
359
+
360
+
361
+
362
+
363
+
364
+
365
+
366
+
367
+
368
+
369
+
370
+
371
+
372
+
373
+
374
+
375
+
376
+
377
+
378
+
379
+
380
+
381
+
382
+
383
+
384
+
385
+
386
+
387
+
388
+
389
+
390
+
391
+
392
+
393
+
394
+
395
+
396
+
397
+
398
+
399
+
400
+
401
+
402
+
403
+
404
+
405
+
406
+
407
+
408
+
409
+
410
+
411
+
412
+
413
+
414
+
415
+
416
+
417
+
418
+
419
+
420
+
421
+
422
+
423
+
424
+
425
+
426
+
427
+
428
+
429
+
430
+
431
+
432
+
433
+
434
+
435
+
436
+
437
+
438
+
439
+
440
+
441
+
442
+
443
+
444
+
445
+
446
+
447
+
448
+
449
+
450
+
451
+
452
+
453
+
454
+
455
+
456
+
457
+
458
+
459
+
460
+
461
+
462
+
463
+
464
+
465
+
466
+
467
+
468
+
469
+
470
+
471
+
472
+
473
+
474
+
475
+
476
+
477
+
478
+
479
+
480
+
481
+
482
+
483
+
484
+
485
+
486
+
487
+
488
+
489
+
490
+
491
+
492
+
493
+
494
+
495
+
496
+
497
+
498
+
499
+
500
+
501
+
502
+
503
+
504
+
505
+
506
+
507
+
508
+
509
+
510
+
511
+
512
+
513
+
514
+
515
+
516
+
517
+
518
+
519
+
520
+
521
+
522
+
523
+
524
+
525
+
526
+
527
+
528
+
529
+
530
+
531
+
532
+
533
+
534
+
535
+
536
+
537
+
538
+
539
+
540
+
541
+
542
+
543
+
544
+
545
+
546
+
547
+
548
+
549
+
550
+
551
+
552
+
553
+
554
+
555
+
556
+
557
+
558
+
559
+
560
+
561
+
562
+
563
+
564
+
565
+
566
+
567
+
568
+
569
+
570
+
571
+
572
+
573
+
574
+
575
+
576
+
577
+
578
+
579
+ 广
580
+
581
+
582
+
583
+
584
+
585
+
586
+
587
+
588
+
589
+
590
+
591
+
592
+
593
+
594
+
595
+
596
+
597
+
598
+
599
+
600
+
601
+
602
+
603
+
604
+
605
+
606
+
607
+
608
+
609
+
610
+
611
+
612
+
613
+
614
+
615
+
616
+
617
+
618
+
619
+
620
+
621
+
622
+
623
+
624
+
625
+
626
+
627
+
628
+
629
+
630
+
631
+
632
+
633
+
634
+
635
+
636
+
637
+
638
+
639
+
640
+
641
+
642
+
643
+
644
+ 殿
645
+
646
+
647
+
648
+
649
+
650
+
651
+
652
+
653
+
654
+
655
+
656
+
657
+
658
+
659
+
660
+
661
+
662
+
663
+
664
+
665
+
666
+
667
+
668
+
669
+
670
+
671
+
672
+
673
+
674
+
675
+
676
+
677
+
678
+
679
+
680
+
681
+
682
+
683
+
684
+
685
+
686
+
687
+
688
+
689
+
690
+
691
+
692
+
693
+
694
+
695
+
696
+
697
+
698
+
699
+
700
+
701
+
702
+
703
+
704
+
705
+
706
+
707
+
708
+
709
+
710
+
711
+
712
+
713
+
714
+
715
+
716
+
717
+
718
+
719
+
720
+
721
+
722
+
723
+
724
+
725
+
726
+
727
+
728
+
729
+
730
+
731
+
732
+
733
+
734
+
735
+
736
+
737
+
738
+
739
+
740
+
741
+
742
+
743
+
744
+
745
+
746
+
747
+
748
+
749
+
750
+
751
+
752
+
753
+
754
+
755
+
756
+
757
+
758
+
759
+
760
+
761
+
762
+
763
+
764
+
765
+
766
+
767
+
768
+
769
+
770
+
771
+
772
+
773
+
774
+
775
+
776
+
777
+
778
+
779
+
780
+
781
+
782
+
783
+
784
+
785
+
786
+
787
+
788
+
789
+
790
+
791
+ ##o
792
+ ##l
793
+ ##e
794
+ ##y
795
+ ##i
796
+ ##n
797
+ ##g
798
+ ##r
799
+ ##c
800
+ ##u
801
+ ##d
802
+ ##m
803
+ ##b
804
+ ##a
805
+ ##p
806
+ ##h
807
+ ##s
808
+ ##t
809
+ ##v
810
+ ##w
811
+ ##k
812
+ ##ı
813
+ ##z
814
+ ##f
815
+ ##x
816
+ ##η
817
+ ##μ
818
+ ##τ
819
+ ##ρ
820
+ ##α
821
+ ##2
822
+ ##5
823
+ ##7
824
+ ##8
825
+ ##j
826
+ ##q
827
+ ##0
828
+ ##4
829
+ ##6
830
+ ##ł
831
+ ##3
832
+ ##1
833
+ ##ل
834
+ ##ع
835
+ ##ة
836
+ ##ɛ
837
+ ##ß
838
+ ##ə
839
+ ##ˈ
840
+ ##9
841
+ ##ɪ
842
+ ##ป
843
+ ##ย
844
+ ##о
845
+ ##ю
846
+ ##з
847
+ ##æ
848
+ ##の
849
+ ##な
850
+ ##ら
851
+ ##რ
852
+ ##ი
853
+ ##ს
854
+ ##ტ
855
+ ##ე
856
+ ##ʻ
857
+ ##ᄇ
858
+ ##ᅮ
859
+ ##ᄃ
860
+ ##ᅢ
861
+ ##お
862
+ ##ო
863
+ ##მ
864
+ ##თ
865
+ ##ა
866
+ ##ვ
867
+ ##უ
868
+ ##ლ
869
+ ##ث
870
+ ##م
871
+ ##د
872
+ ##ウ
873
+ ##ァ
874
+ ##ル
875
+ ##キ
876
+ ##ュ
877
+ ##リ
878
+ ##ア
879
+ ##а
880
+ ##т
881
+ ##р
882
+ ##и
883
+ ##ш
884
+ ##е
885
+ ##с
886
+ ##к
887
+ ##ʊ
888
+ ##ˌ
889
+ ##ː
890
+ ##つ
891
+ ##せ
892
+ ##ん
893
+ ##ッ
894
+ ##ク
895
+ ##マ
896
+ ##ン
897
+ ##ɫ
898
+ ##ق
899
+ ##ي
900
+ ##ش
901
+ ##و
902
+ ##ب
903
+ ##ø
904
+ ##ノ
905
+ ##ー
906
+ ##ล
907
+ ##อ
908
+ ##ฮ
909
+ ##ラ
910
+ ##ω
911
+ ##ε
912
+ ##ι
913
+ ##ο
914
+ ##ς
915
+ ##พ
916
+ ##ร
917
+ ##ל
918
+ ##ה
919
+ ##ह
920
+ ##ण
921
+ ##đ
922
+ ##ゆ
923
+ ##り
924
+ ##ल
925
+ ##ν
926
+ ##κ
927
+ ##ص
928
+ ##ن
929
+ ##イ
930
+ ##ス
931
+ ##ा
932
+ ##द
933
+ ##き
934
+ ##こ
935
+ ##と
936
+ ##あ
937
+ ##ɑ
938
+ ##セ
939
+ ##オ
940
+ ##ʿ
941
+ ##ᅡ
942
+ ##ᆯ
943
+ ##ᄅ
944
+ ##テ
945
+ ##ィ
946
+ ##ニ
947
+ ##ল
948
+ ##º
949
+ ##ก
950
+ ##ว
951
+ ##ɳ
952
+ ##β
953
+ ##ت
954
+ ##פ
955
+ ##ხ
956
+ ##ษ
957
+ ##ฐ
958
+ ##ן
959
+ ##ɜ
960
+ ##ᵻ
961
+ ##व
962
+ ##ि
963
+ ##क
964
+ ##υ
965
+ ##н
966
+ ##わ
967
+ ##い
968
+ ##ɡ
969
+ ##は
970
+ ##く
971
+ ##ც
972
+ ##χ
973
+ ##た
974
+ ##ð
975
+ ##δ
976
+ ##ʁ
977
+ ##σ
978
+ ##ر
979
+ ##ナ
980
+ ##ミ
981
+ ##ב
982
+ ##ר
983
+ ##ם
984
+ ##წ
985
+ ##ფ
986
+ ##う
987
+ ##カ
988
+ ##დ
989
+ ##ま
990
+ ##る
991
+ ##λ
992
+ ##π
993
+ ##ъ
994
+ ##в
995
+ ##ാ
996
+ ##ഹ
997
+ ##ا
998
+ ##3
999
+ ##ハ
1000
+ ##ト
1001
+ ##न
1002
+ ##ई
1003
+ ##י
1004
+ ##ש
1005
+ ##מ
1006
+ ##צ
1007
+ ##ะ
1008
+ ##ช
1009
+ ##น
1010
+ ##ロ
1011
+ ##ჲ
1012
+ ##œ
1013
+ ##ɾ
1014
+ ##เ
1015
+ ##д
1016
+ ##ж
1017
+ ##л
1018
+ ##��
1019
+ ##θ
1020
+ ##ง
1021
+ ##ไ
1022
+ ##า
1023
+ ##っ
1024
+ ##ɒ
1025
+ ##か
1026
+ ##レ
1027
+ ##チ
1028
+ ##ы
1029
+ ##ォ
1030
+ ##ゥ
1031
+ ##ツ
1032
+ ##ネ
1033
+ ##ц
1034
+ ##ь
1035
+ ##め
1036
+ ##ち
1037
+ ##ゃ
1038
+ ##є
1039
+ ##ء
1040
+ ##れ
1041
+ ##み
1042
+ ##п
1043
+ ##г
1044
+ ##ف
1045
+ ##س
1046
+ ##サ
1047
+ ##ו
1048
+ ##נ
1049
+ ##у
1050
+ ##シ
1051
+ ##ョ
1052
+ ##ه
1053
+ ##ェ
1054
+ ##х
1055
+ ##し
1056
+ ##す
1057
+ ##ひ
1058
+ ##フ
1059
+ ##ャ
1060
+ ##モ
1061
+ ##ภ
1062
+ ##ด
1063
+ ##र
1064
+ ##ح
1065
+ ##ס
1066
+ ##א
1067
+ ##ɔ
1068
+ ##ʃ
1069
+ ##ਲ
1070
+ ##ਾ
1071
+ ##ਹ
1072
+ ##ჱ
1073
+ ##ʔ
1074
+ ##ܕ
1075
+ ##ܝ
1076
+ ##ܢ
1077
+ ##ܬ
1078
+ ##エ
1079
+ ##タ
1080
+ ##ك
1081
+ ##خ
1082
+ ##ξ
1083
+ ##ذ
1084
+ ##ქ
1085
+ ##ნ
1086
+ ##ܠ
1087
+ ##ܗ
1088
+ ##ܐ
1089
+ ##ム
1090
+ ##м
1091
+ ##γ
1092
+ ##ψ
1093
+ ##ള
1094
+ ##ჳ
1095
+ ##แ
1096
+ ##स
1097
+ ##ת
1098
+ ##ค
1099
+ ##ต
1100
+ ##გ
1101
+ ##ʒ
1102
+ ##ซ
1103
+ ##ʲ
1104
+ ##も
1105
+ ##ょ
1106
+ ##に
1107
+ ##া
1108
+ ##হ
1109
+ ##ɽ
1110
+ ##ᅦ
1111
+ ##ᅩ
1112
+ ##ᆨ
1113
+ ##ᅵ
1114
+ ##ᆸ
1115
+ ##ᅧ
1116
+ ##ᆼ
1117
+ ##ᄋ
1118
+ ##ᆫ
1119
+ ##ग
1120
+ ##ɐ
1121
+ ##を
1122
+ ##ף
1123
+ ##ณ
1124
+ ##ม