davidguzmanr commited on
Commit
0ab5800
·
verified ·
1 Parent(s): f149429

Add config/everyvoice-shared-text.yaml for Chhattisgarhi

Browse files
Files changed (1) hide show
  1. config/everyvoice-shared-text.yaml +46 -0
config/everyvoice-shared-text.yaml ADDED
@@ -0,0 +1,46 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ cleaners: [everyvoice.utils.collapse_whitespace, everyvoice.utils.strip_text]
2
+ g2p_engines: {}
3
+ symbols:
4
+ open-bible-chhattisgarhi_characters: [+, '0', '1', '2', '3', '4', '5', '6', '7',
5
+ '8', '9', \, d, e, p, s, t, u, x, ב, ג, ד, ה, ו, ח, ט, י, ל, מ, נ, ס, ע, פ, צ,
6
+ ק, ר, ש, ת, अ, अं, आ, आं, इ, इं, ई, ईं, उ, उं, ऊ, ऊं, ए, एं, ऐ, ओ, ओं, औ, क, कं,
7
+ का, कां, कि, किं, की, कु, कुं, कू, के, कें, कै, को, कों, कौ, कौं, क्, ख, खं, खा,
8
+ खां, खि, खी, खीं, खु, खुं, खू, खूं, खे, खें, खै, खो, खों, ख्, ग, गं, गा, गां,
9
+ गि, गिं, गी, गु, गुं, गू, गूं, गे, गें, गै, गैं, गो, गों, गौ, ग्, घ, घं, घा, घां,
10
+ घि, घी, घु, घुं, घू, घूं, घे, घें, घो, घों, च, चं, चा, चां, चि, चिं, ची, चु, चुं,
11
+ चू, चे, चें, चै, चो, चों, चौ, चौं, च्, छ, छं, छा, छां, छि, छिं, छी, छीं, छु, छू,
12
+ छे, छें, छै, छो, छों, छौ, ज, जं, जा, जां, जि, जिं, जी, जु, जू, जे, जें, जै, जो,
13
+ जों, जौ, ज्, ज्‍, झ, झं, झा, झां, झि, झिं, झी, झु, झुं, झू, झे, झें, झो, झों,
14
+ झौ, ट, टं, टा, टां, टि, टी, टु, टू, टे, टें, टो, टों, ट्, ठ, ठं, ठा, ठां, ठि,
15
+ ठी, ठु, ठूं, ठे, ठें, ठो, ठों, ड, डं, ड़, ड़ं, ड़ा, ड़ां, ड़ि, ड़ी, ड़ु, ड़े,
16
+ ड़ें, ड़ो, ड़ों, ड़ौ, डा, डां, डि, डी, डीं, डु, डू, डे, डो, डों, डौ, ड्, ढ, ढं,
17
+ ढ़, ढ़ं, ढ़ा, ढ़ां, ढ़ि, ढ़ी, ढ़े, ढ़ें, ढ़ो, ढा, ढां, ढि, ढी, ढु, ढे, ढो, ढों,
18
+ त, तं, तः, ता, तां, ति, ती, तु, तू, ते, तें, तै, तैं, तो, तों, तौ, त्, थ, थं,
19
+ था, थि, थी, थु, थू, थे, थें, थै, थो, थौ, द, दं, दा, दां, दि, दी, दु, दू, दृ, दे,
20
+ दें, दै, दो, दौ, द्, ध, धं, धा, धि, धी, धु, धुं, धू, धे, धो, ध्, न, नं, ना, नां,
21
+ नि, निं, नी, नीं, नु, नू, ने, नें, नै, नो, नों, नौ, न्, न्‍, प, पं, पा, पां, पि,
22
+ पिं, पी, पु, पुं, पू, पूं, पे, पें, पै, पैं, पो, पों, पौ, प्, फ, फं, फा, फां,
23
+ फि, फी, फु, फुं, फू, फूं, फे, फें, फै, फो, फ्, फ्‍, ब, बं, बा, बां, बि, बिं, बी,
24
+ बु, बू, बूं, बे, बै, बैं, बो, बौ, ब्, भ, भं, भा, भां, भि, भी, भु, भुं, भू, भूं,
25
+ भे, भें, भैं, भो, भों, भौ, भ्, म, मं, मा, मां, मि, मिं, मी, मीं, मु, मुं, मू,
26
+ मूं, मे, में, मै, मो, मौ, म्, म्‍, य, यं, या, यां, यि, यी, यु, यू, ये, यें, यो,
27
+ य्, र, रं, रा, रां, रि, री, रु, रू, रूं, रे, रें, रै, रो, रों, रौ, रौं, र्, ल,
28
+ लं, ला, लां, लि, लिं, ली, लु, लू, ले, लें, लै, लो, लों, लौ, ल्, ल्‍, व, वं, वा,
29
+ वां, वि, वी, वे, वै, वो, व्, स, सं, सा, सां, सि, सिं, सी, सीं, सु, सुं, सू, सूं,
30
+ से, सें, सै, सैं, सो, सों, सौ, स्, स्‍, ह, हं, हा, हां, हि, हिं, ही, हीं, हु,
31
+ हुं, हू, हूं, हे, हें, है, हो, हों, हौ, ।, ‑, –, ‘, ’, ⁄]
32
+ open-bible-chhattisgarhi_phones: [a, b, d, e, h, i, j, k, l, m, n, o, p, q, r, s,
33
+ t, t͡ʃ, u, v, x, ɡ, ʒ, ʔ]
34
+ punctuation:
35
+ colons: [':']
36
+ commas: [',']
37
+ ellipses: […]
38
+ exclamations: ['!', ¡]
39
+ hyphens: ['-', —, '*']
40
+ parentheses: [(, ), '[', ']', '{', '}']
41
+ periods: [.]
42
+ question_symbols: ['?', ¿]
43
+ quotemarks: ['"', '''', “, ”, «, »]
44
+ semi_colons: [;]
45
+ silence: [<SIL>]
46
+ to_replace: {}