Множество "инфраструктурных" программ (MySQL, Perl, Lucene...) используют одну и ту же свободную/открытую реализацию стеммера Snowball, так как он бесплатный, многоязычный, достаточно известный. Поэтому большинство особенностей "морфологического разбора" повторяются от программы к программе.
Вот описание русского стеммера от Snowball, оно достаточно простое:
no subject
Date: 2008-03-04 09:39 am (UTC)Вот описание русского стеммера от Snowball, оно достаточно простое:
http://snowball.tartarus.org/algorithms/russian/stemmer.html