mitrius: (Default)
[personal profile] mitrius
Один знакомый морфолог несколько лет назад предпочитал Гугль Яндексу, потому что "у Яндекса слишком умная морфология" -- а ему точные формы были нужны.

Сейчас Гугль сделал довольно хитроумную лингвистику. На запрос Ливия находится не только ливийский, но и, что характерно, Ливан!

Напоминает анекдоты о Елизавете Петровне или Джордже W. Буше.

Date: 2008-03-04 08:46 am (UTC)
From: [identity profile] laopo.livejournal.com
А вот некоторые поискухи на запрос "день" выдавали "дело" и "деть". Сейчас, вроде, поправили. Но "Ливан" на "Ливия" все же круче.

Date: 2008-03-04 09:39 am (UTC)
From: [identity profile] ajvol2.livejournal.com
Множество "инфраструктурных" программ (MySQL, Perl, Lucene...) используют одну и ту же свободную/открытую реализацию стеммера Snowball, так как он бесплатный, многоязычный, достаточно известный. Поэтому большинство особенностей "морфологического разбора" повторяются от программы к программе.

Вот описание русского стеммера от Snowball, оно достаточно простое:

http://snowball.tartarus.org/algorithms/russian/stemmer.html

Date: 2008-03-04 10:13 am (UTC)
From: [identity profile] kcmamu.livejournal.com
А вообще много ли однокоренных пар слов ZZZий и ZZZан? Кроме довольно скользких вроде калужий/калужан, винничий/винничан что-то ничего в голову не приходит.

Date: 2008-03-04 09:19 pm (UTC)
From: [identity profile] konstkaras.livejournal.com
Разговорный ничего особо не значащий суффикса -ан вроде должен дать некоторое количество пар типа жлобан-жлобий.

Date: 2008-03-04 10:30 pm (UTC)
From: [identity profile] mitrius.livejournal.com
Так что с "дело--деть--день" (всё вполне законно) сопоставлять это нельзя.

А вот сопоставимое отчасти: пока в Яндексе не было имён собственных, на "Ева" искалось, конечно же, "Ин".

Date: 2008-03-04 02:22 pm (UTC)
From: [identity profile] verych.livejournal.com
Я тоже раньше шла в Гугл, когда нужна была точная форма. А сейчас вот что скажу - лучше бы они сделали арабскую морфологию вместо русской. Арабской пока нет.
(deleted comment)

Date: 2008-03-04 06:13 pm (UTC)
From: [identity profile] zhenyach.livejournal.com
Если в Гугле слово набрать в кавычках, будет искаться только эта форма.

Date: 2008-03-04 10:28 pm (UTC)
From: [identity profile] mvs.livejournal.com
в последнее время впечатление, что и это не всегда помогает

Date: 2008-03-04 11:50 pm (UTC)
From: [identity profile] zhenyach.livejournal.com
А вот ещё в их Хелпе пишут: "if you want to ensure a word is included exactly as you enter it, add a "+" sign immediately in front of it in the search box"

Date: 2008-03-04 10:58 pm (UTC)
From: [identity profile] cema.livejournal.com
Для точной формы значок специальный есть. Не помню уже подробностей.

Date: 2008-03-12 04:52 pm (UTC)
From: [identity profile] niekas33.livejournal.com
А ещё есть языковые версии гугля без примочек. Я всегда хожу на google.com.uz.

January 2021

S M T W T F S
     12
3456789
10111213141516
17181920212223
242526 27 28 2930
31      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 1st, 2026 06:36 pm
Powered by Dreamwidth Studios