mitrius: (Default)
mitrius ([personal profile] mitrius) wrote2008-03-04 09:29 am

между двумя триполи

Один знакомый морфолог несколько лет назад предпочитал Гугль Яндексу, потому что "у Яндекса слишком умная морфология" -- а ему точные формы были нужны.

Сейчас Гугль сделал довольно хитроумную лингвистику. На запрос Ливия находится не только ливийский, но и, что характерно, Ливан!

Напоминает анекдоты о Елизавете Петровне или Джордже W. Буше.

[identity profile] laopo.livejournal.com 2008-03-04 08:46 am (UTC)(link)
А вот некоторые поискухи на запрос "день" выдавали "дело" и "деть". Сейчас, вроде, поправили. Но "Ливан" на "Ливия" все же круче.

[identity profile] ajvol2.livejournal.com 2008-03-04 09:39 am (UTC)(link)
Множество "инфраструктурных" программ (MySQL, Perl, Lucene...) используют одну и ту же свободную/открытую реализацию стеммера Snowball, так как он бесплатный, многоязычный, достаточно известный. Поэтому большинство особенностей "морфологического разбора" повторяются от программы к программе.

Вот описание русского стеммера от Snowball, оно достаточно простое:

http://snowball.tartarus.org/algorithms/russian/stemmer.html

[identity profile] kcmamu.livejournal.com 2008-03-04 10:13 am (UTC)(link)
А вообще много ли однокоренных пар слов ZZZий и ZZZан? Кроме довольно скользких вроде калужий/калужан, винничий/винничан что-то ничего в голову не приходит.

[identity profile] konstkaras.livejournal.com 2008-03-04 09:19 pm (UTC)(link)
Разговорный ничего особо не значащий суффикса -ан вроде должен дать некоторое количество пар типа жлобан-жлобий.

[identity profile] mitrius.livejournal.com 2008-03-04 10:30 pm (UTC)(link)
Так что с "дело--деть--день" (всё вполне законно) сопоставлять это нельзя.

А вот сопоставимое отчасти: пока в Яндексе не было имён собственных, на "Ева" искалось, конечно же, "Ин".

[identity profile] verych.livejournal.com 2008-03-04 02:22 pm (UTC)(link)
Я тоже раньше шла в Гугл, когда нужна была точная форма. А сейчас вот что скажу - лучше бы они сделали арабскую морфологию вместо русской. Арабской пока нет.
(deleted comment)

[identity profile] zhenyach.livejournal.com 2008-03-04 06:13 pm (UTC)(link)
Если в Гугле слово набрать в кавычках, будет искаться только эта форма.

[identity profile] mvs.livejournal.com 2008-03-04 10:28 pm (UTC)(link)
в последнее время впечатление, что и это не всегда помогает

[identity profile] zhenyach.livejournal.com 2008-03-04 11:50 pm (UTC)(link)
А вот ещё в их Хелпе пишут: "if you want to ensure a word is included exactly as you enter it, add a "+" sign immediately in front of it in the search box"

[identity profile] cema.livejournal.com 2008-03-04 10:58 pm (UTC)(link)
Для точной формы значок специальный есть. Не помню уже подробностей.

[identity profile] niekas33.livejournal.com 2008-03-12 04:52 pm (UTC)(link)
А ещё есть языковые версии гугля без примочек. Я всегда хожу на google.com.uz.