mitrius: (Default)
mitrius ([personal profile] mitrius) wrote2008-10-16 09:27 am

кому нужны стихи на сербском языке?

Прочёл:

Вот думаю: кому сейчас нужна славянская поэзия тиражом 2000 экз., чтобы сидеть на всем тираже?

И неизбежно вспомнил историю, которую работники Корпуса рассказывают разным людям: как-то перед показом Корпуса ответственным людям для примера поискали в нём запрос "название народа + язык".

И первый пример был этот из Натальи Медведевой (в виде одного предложения, -- того, в котором встречаются слова "сербский язык")

Замазывать "такие слова" в Корпусе белым мы стали как раз после этого события (и некоторых других, более важных). Тогда ещё замазано не было.

[identity profile] kontin.livejournal.com 2008-10-16 06:04 am (UTC)(link)
Замазать-то замазали, а ошибку в "аккомпанементе" исправить?

[identity profile] mitrius.livejournal.com 2008-10-16 09:03 am (UTC)(link)
Не имеем права: как написала песательница, так и будет.

[identity profile] computer-bug.livejournal.com 2008-10-16 09:37 am (UTC)(link)
А почему решили замазывать? Это же все-таки научный инструмент.

[identity profile] sereglond.livejournal.com 2008-10-16 09:55 am (UTC)(link)
Потому что не всякий человек, ищущий сербскую поэзию, будет рад видеть в выдаче обсценную лексику.
В случае же если вы прямо запросите осбценное слово оно выбеляться не будет.
Примеров, с вашего позволения, приводить не буду.

[identity profile] computer-bug.livejournal.com 2008-10-16 10:08 am (UTC)(link)
Ну не знаю, с одной стороны ошибку в слове нельзя исправить ("Не имеем права: как написала песательница, так и будет.") - а замызывать слова можно. Мне не очень понятен этот подход, особенно в свете того, что и книги печатаются с матом и там мат не замазывается, если автор этого не хочет.

Замазывают не совсем

[identity profile] almony.livejournal.com 2008-10-16 10:13 am (UTC)(link)
Наведи на выбеленное по Митиной ссылке курсор и будет тебе хуй счастье. :)

Re: Замазывают не совсем

[identity profile] computer-bug.livejournal.com 2008-10-16 10:21 am (UTC)(link)
Да, но это же знать надо! А так выглядит просто как дырка в тексте. Вообще по отношению к авторам это мне кажется неэтично.

"Замазывать "такие слова" в Корпусе белым мы стали как раз после этого события (и некоторых других, более важных)"

Интересно после каких других событий стали замызывать слова?

[identity profile] mitrius.livejournal.com 2008-10-16 11:00 am (UTC)(link)
Наткнулись на возражения в академических инстанциях :)

[identity profile] computer-bug.livejournal.com 2008-10-16 11:01 am (UTC)(link)
Ясно, спасибо

Re: Замазывают не совсем

[identity profile] sesili.livejournal.com 2008-10-17 03:43 am (UTC)(link)
Когда я в первый раз увидела текст с дыркой, мне было очень интересно исследовать, что за ней скрывается. Я, помнится, тогда была благодарна разработчикам корпуса за такое развлечение.

Re: Замазывают не совсем

[identity profile] mitrius.livejournal.com 2008-10-17 08:07 am (UTC)(link)
Особенно забавно, когда в дырке скрывается приличное слово, которое парсер по окончанию принял за ругательство.

[identity profile] sereglond.livejournal.com 2008-10-16 12:23 pm (UTC)(link)
Не совсем так.
Мы не скрываем слово совсем - если вы подведёте мышку к этому забеленному слову оно покажется.
К тому же когда человек покупает книгу он более менее представляет с какой лексикой он там столкнётся, что, как показывает приведённый Митей пример, не верно в отношении поиска по корпусу.

[identity profile] menelik3.livejournal.com 2008-10-16 09:51 am (UTC)(link)
Эх, интересно бы узнать, как в процентах распределяются ошибки в сербском языке между Натальей Медведевой и Корпусом... :)

[identity profile] mitrius.livejournal.com 2008-10-16 10:56 am (UTC)(link)
Корпус -- 0%, а как они распределяются между Натальей Медведевой и Вагриусом, сего не вем.