Add config/everyvoice-shared-text.yaml for Chhattisgarhi
Browse files
config/everyvoice-shared-text.yaml
ADDED
|
@@ -0,0 +1,46 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
cleaners: [everyvoice.utils.collapse_whitespace, everyvoice.utils.strip_text]
|
| 2 |
+
g2p_engines: {}
|
| 3 |
+
symbols:
|
| 4 |
+
open-bible-chhattisgarhi_characters: [+, '0', '1', '2', '3', '4', '5', '6', '7',
|
| 5 |
+
'8', '9', \, d, e, p, s, t, u, x, ב, ג, ד, ה, ו, ח, ט, י, ל, מ, נ, ס, ע, פ, צ,
|
| 6 |
+
ק, ר, ש, ת, अ, अं, आ, आं, इ, इं, ई, ईं, उ, उं, ऊ, ऊं, ए, एं, ऐ, ओ, ओं, औ, क, कं,
|
| 7 |
+
का, कां, कि, किं, की, कु, कुं, कू, के, कें, कै, को, कों, कौ, कौं, क्, ख, खं, खा,
|
| 8 |
+
खां, खि, खी, खीं, खु, खुं, खू, खूं, खे, खें, खै, खो, खों, ख्, ग, गं, गा, गां,
|
| 9 |
+
गि, गिं, गी, गु, गुं, गू, गूं, गे, गें, गै, गैं, गो, गों, गौ, ग्, घ, घं, घा, घां,
|
| 10 |
+
घि, घी, घु, घुं, घू, घूं, घे, घें, घो, घों, च, चं, चा, चां, चि, चिं, ची, चु, चुं,
|
| 11 |
+
चू, चे, चें, चै, चो, चों, चौ, चौं, च्, छ, छं, छा, छां, छि, छिं, छी, छीं, छु, छू,
|
| 12 |
+
छे, छें, छै, छो, छों, छौ, ज, जं, जा, जां, जि, जिं, जी, जु, जू, जे, जें, जै, जो,
|
| 13 |
+
जों, जौ, ज्, ज्, झ, झं, झा, झां, झि, झिं, झी, झु, झुं, झू, झे, झें, झो, झों,
|
| 14 |
+
झौ, ट, टं, टा, टां, टि, टी, टु, टू, टे, टें, टो, टों, ट्, ठ, ठं, ठा, ठां, ठि,
|
| 15 |
+
ठी, ठु, ठूं, ठे, ठें, ठो, ठों, ड, डं, ड़, ड़ं, ड़ा, ड़ां, ड़ि, ड़ी, ड़ु, ड़े,
|
| 16 |
+
ड़ें, ड़ो, ड़ों, ड़ौ, डा, डां, डि, डी, डीं, डु, डू, डे, डो, डों, डौ, ड्, ढ, ढं,
|
| 17 |
+
ढ़, ढ़ं, ढ़ा, ढ़ां, ढ़ि, ढ़ी, ढ़े, ढ़ें, ढ़ो, ढा, ढां, ढि, ढी, ढु, ढे, ढो, ढों,
|
| 18 |
+
त, तं, तः, ता, तां, ति, ती, तु, तू, ते, तें, तै, तैं, तो, तों, तौ, त्, थ, थं,
|
| 19 |
+
था, थि, थी, थु, थू, थे, थें, थै, थो, थौ, द, दं, दा, दां, दि, दी, दु, दू, दृ, दे,
|
| 20 |
+
दें, दै, दो, दौ, द्, ध, धं, धा, धि, धी, धु, धुं, धू, धे, धो, ध्, न, नं, ना, नां,
|
| 21 |
+
नि, निं, नी, नीं, नु, नू, ने, नें, नै, नो, नों, नौ, न्, न्, प, पं, पा, पां, पि,
|
| 22 |
+
पिं, पी, पु, पुं, पू, पूं, पे, पें, पै, पैं, पो, पों, पौ, प्, फ, फं, फा, फां,
|
| 23 |
+
फि, फी, फु, फुं, फू, फूं, फे, फें, फै, फो, फ्, फ्, ब, बं, बा, बां, बि, बिं, बी,
|
| 24 |
+
बु, बू, बूं, बे, बै, बैं, बो, बौ, ब्, भ, भं, भा, भां, भि, भी, भु, भुं, भू, भूं,
|
| 25 |
+
भे, भें, भैं, भो, भों, भौ, भ्, म, मं, मा, मां, मि, मिं, मी, मीं, मु, मुं, मू,
|
| 26 |
+
मूं, मे, में, मै, मो, मौ, म्, म्, य, यं, या, यां, यि, यी, यु, यू, ये, यें, यो,
|
| 27 |
+
य्, र, रं, रा, रां, रि, री, रु, रू, रूं, रे, रें, रै, रो, रों, रौ, रौं, र्, ल,
|
| 28 |
+
लं, ला, लां, लि, लिं, ली, लु, लू, ले, लें, लै, लो, लों, लौ, ल्, ल्, व, वं, वा,
|
| 29 |
+
वां, वि, वी, वे, वै, वो, व्, स, सं, सा, सां, सि, सिं, सी, सीं, सु, सुं, सू, सूं,
|
| 30 |
+
से, सें, सै, सैं, सो, सों, सौ, स्, स्, ह, हं, हा, हां, हि, हिं, ही, हीं, हु,
|
| 31 |
+
हुं, हू, हूं, हे, हें, है, हो, हों, हौ, ।, ‑, –, ‘, ’, ⁄]
|
| 32 |
+
open-bible-chhattisgarhi_phones: [a, b, d, e, h, i, j, k, l, m, n, o, p, q, r, s,
|
| 33 |
+
t, t͡ʃ, u, v, x, ɡ, ʒ, ʔ]
|
| 34 |
+
punctuation:
|
| 35 |
+
colons: [':']
|
| 36 |
+
commas: [',']
|
| 37 |
+
ellipses: […]
|
| 38 |
+
exclamations: ['!', ¡]
|
| 39 |
+
hyphens: ['-', —, '*']
|
| 40 |
+
parentheses: [(, ), '[', ']', '{', '}']
|
| 41 |
+
periods: [.]
|
| 42 |
+
question_symbols: ['?', ¿]
|
| 43 |
+
quotemarks: ['"', '''', “, ”, «, »]
|
| 44 |
+
semi_colons: [;]
|
| 45 |
+
silence: [<SIL>]
|
| 46 |
+
to_replace: {}
|