snowballstem · khemarato · Apr 28, 2024 · ojwb · May 1, 2024 · ojwb
diff --git a/algorithms/pali.sbl b/algorithms/pali.sbl
@@ -0,0 +1,20 @@
+externals ( stem )
+
+stringescapes {}
+
+stringdef a-   '{U+0101}'  // ā
+stringdef i-   '{U+012B}'  // ī
+stringdef u-   '{U+016B}'  // ū
+stringdef m1   '{U+1E41}'  // ṁ
+stringdef m2   '{U+1E43}'  // ṃ
+
+define stem as (
+  backwards (
+    [substring] delete among (
+        'm{a-}na' 'anta' 'onta' 'unta' 'enta' 'issa'
+        'ati' '{a-}ti' 'ant' 'esi' '{a-}si' 'eti'
+        'a{m1}' 'a{m2}' 'u{m1}' 'u{m2}' 'i{m1}' 'i{m2}'
+        'i' '{i-}' 'a' '{a-}' 'o' 'u' '{u-}'
+    )
+  )
+)
diff --git a/libstemmer/modules.txt b/libstemmer/modules.txt
@@ -29,6 +29,7 @@ italian         UTF_8,ISO_8859_1        italian,it,ita
 lithuanian      UTF_8                   lithuanian,lt,lit
 nepali          UTF_8                   nepali,ne,nep
 norwegian       UTF_8,ISO_8859_1        norwegian,no,nor
+pali            UTF_8                   pali,pi,pli
 portuguese      UTF_8,ISO_8859_1        portuguese,pt,por
 romanian        UTF_8                   romanian,ro,rum,ron
 russian         UTF_8,KOI8_R            russian,ru,rus