Skip to content

Commit

Permalink
Add ca test
Browse files Browse the repository at this point in the history
  • Loading branch information
synesthesiam committed Jul 3, 2024
1 parent 948f8ff commit df86aa8
Showing 1 changed file with 58 additions and 10 deletions.
68 changes: 58 additions & 10 deletions tests/test_sqlite_phonemizer.py
Original file line number Diff line number Diff line change
Expand Up @@ -17,7 +17,28 @@ def test_ar(self):
get_phonemes("حَوّامتي مُمْتِلئة", "ar"),
[
("حَوَّامَتُي", ["ħ", "a", "u", "aː", "m", "t", "iː"]),
("مُمْتِلِئَة", ["m", "u", "m", "t", "i", "l", "i", "ʔ", "i"],),
(
"مُمْتِلِئَة",
["m", "u", "m", "t", "i", "l", "i", "ʔ", "i"],
),
],
)

def test_ca(self):
"""Catalan tests"""
self.assertEqual(
get_phonemes("El meu aerolliscador està ple d'anguiles.", "ca-ce"),
[
("el", ["ə", "l"]),
("meu", ["m", "'e", "uw"]),
(
"aerolliscadór",
["ə", "ə", "ɾ", "u", "ʎ", "i", "s", "k", "ə", "ð", "'o"],
),
("està", ["s", "t", "'a"]),
("plè", ["p", "l", "'ɛ"]),
("danguíles", ["d", "ə", "ŋ", "g", "'i", "l", "ə", "s"]),
(".", ["‖"]),
],
)

Expand Down Expand Up @@ -77,7 +98,10 @@ def test_en_us(self):
get_phonemes("My hovercraft is full of eels.", "en_US"),
[
("My", ["m", "ˈaɪ"]),
("hovercraft", ["h", "ˈʌ", "v", "ɚ", "k", "ɹ", "ˌæ", "f", "t"],),
(
"hovercraft",
["h", "ˈʌ", "v", "ɚ", "k", "ɹ", "ˌæ", "f", "t"],
),
("is", ["ˈɪ", "z"]),
("full", ["f", "ˈʊ", "l"]),
("of", ["ə", "v"]),
Expand Down Expand Up @@ -128,7 +152,10 @@ def test_fa(self):
"هاورکرافت",
["h", "ɒː", "v", "æ", "ɾ", "k", "æ", "ɾ", "ɒː", "f", "t", "e̞"],
),
("من", ["m", "æ", "n"],),
(
"من",
["m", "æ", "n"],
),
("پر", ["p", "o", "ɾ"]),
("مارماهى", ["m", "ɒː", "ɾ", "æ", "m", "ɒː", "h", "e̞", "l"]),
("است", ["æ", "s", "t"]),
Expand All @@ -141,7 +168,10 @@ def test_fr(self):
get_phonemes("Mon aéroglisseur est plein d'anguilles.", "fr_FR"),
[
("Mon", ["m", "ɔ̃", "n"]),
("aéroglisseur", ["a", "e", "ʁ", "ɔ", "ɡ", "l", "i", "s", "œ", "ʁ"],),
(
"aéroglisseur",
["a", "e", "ʁ", "ɔ", "ɡ", "l", "i", "s", "œ", "ʁ"],
),
("est", ["ɛ"]),
("plein", ["p", "l", "ɛ̃"]),
("d'anguilles", ["d", "ɑ̃", "ɡ", "i", "j"]),
Expand All @@ -155,7 +185,10 @@ def test_it(self):
get_phonemes("Il mio hovercraft è pieno di anguille.", "it_IT"),
[
("Il", ["i", "l"]),
("mio", ["ˈm", "i", "o"],),
(
"mio",
["ˈm", "i", "o"],
),
("hovercraft", ["o", "v", "e", "r", "k", "r", "a", "f", "t"]),
("è", ["ɛ"]),
("pieno", ["ˈp", "j", "ɛ", "n", "o"]),
Expand All @@ -173,7 +206,10 @@ def test_lb(self):
),
[
("An", ["ɑ", "n"]),
("der", ["d", "ɐ"],),
(
"der",
["d", "ɐ"],
),
("Zäit", ["ʦ", "æːɪ", "t"]),
("hunn", ["h", "u", "n"]),
("sech", ["z", "ə", "ɕ"]),
Expand Down Expand Up @@ -209,7 +245,10 @@ def test_pt(self):
get_phonemes("O meu hovercraft está cheio de enguias.", "pt"),
[
("O", ["u"]),
("meu", ["m", "ew"],),
(
"meu",
["m", "ew"],
),
("hovercraft", ["o", "v", "e", "ɹ", "k", "ɾ", "ɐ", "f", "t", "ʃ"]),
("está", ["e", "s", "t", "ɐ"]),
("cheio", ["ʃ", "ej", "u"]),
Expand All @@ -225,7 +264,10 @@ def test_ru(self):
get_phonemes("Моё судно на воздушной подушке полно угрей.", "ru_RU"),
[
("Моё", ["m", "o", "j", "oː"]),
("судно", ["s", "uː", "d", "n", "o"],),
(
"судно",
["s", "uː", "d", "n", "o"],
),
("на", ["n", "aː"]),
("воздушной", ["v", "o", "z", "d", "uː", "ʂ", "n", "o", "j"]),
("подушке", ["p", "o", "d", "uː", "ʂ", "kʲ", "e"]),
Expand All @@ -241,7 +283,10 @@ def test_sv(self):
get_phonemes("Min svävare är full med ål.", "sv_SE"),
[
("Min", ["m", "iː", "n"]),
("svävare", ["²s", "v", "'ɛː", "v", "a", "r", "ɛ"],),
(
"svävare",
["²s", "v", "'ɛː", "v", "a", "r", "ɛ"],
),
("är", ["ɛː", "r"]),
("full", ["f", "ɵ", "l"]),
("med", ["m", "eː", "d"]),
Expand All @@ -256,7 +301,10 @@ def test_sw(self):
get_phonemes("Gari langu linaloangama limejaa na mikunga.", "sw"),
[
("Gari", ["ɠ", "ɑ", "ɾ", "i"]),
("langu", ["l", "ɑ", "ᵑg", "u"],),
(
"langu",
["l", "ɑ", "ᵑg", "u"],
),
(
"linaloangama",
["l", "i", "n", "ɑ", "l", "ɔ", "ɑ", "ᵑg", "ɑ", "m", "ɑ"],
Expand Down

0 comments on commit df86aa8

Please sign in to comment.