mitrius: (Default)
[personal profile] mitrius
Почему-то всё время сталкиваюсь с таким приёмом: при подсчётах отбираются только какие-то вхождения по совершенно странным принципам (причём не произвольная 1000 из выборки, скажем, а фиксируются параметры, которые вполне могут быть релевантными, да даже, скорее всего, и есть, но об этом ничего не говорится). "Кластеры согласных в начале и конце считаем, а в середине нет". "Первую стопу строки анализируем, а вторую нет". Почему? Богу ведомо. Об этом честно объявляется, впрочем. А потом, разумеется, мы уже без оговорок читаем, что в данных языках или данных текстах явления Х нет вообще, что это уже представительствует и за среднюю позицию, и за стих вообще, и за язык вообще.

"Единственное, чем такая статистика лучше нормальной -- тем, что так легче считать" (с) ААЗ. Кстати, не факт, что даже легче...

Date: 2009-03-04 07:18 am (UTC)
From: [identity profile] mura-vey.livejournal.com
Ну кластре в начале и в конце считать значительно легче, и к тому же можно предполагать, и про многие языки это, кажется, будет верно, что в середине бывает только соединение того, что бывает в начале и что бывает в конце.

Date: 2009-03-04 03:18 pm (UTC)
From: [identity profile] fbmk.livejournal.com
По моему (небольшому, конечно), опыту, выделение формальных критериев совершенно неизвестной релевантности необходимо для того, чтобы сформировать некоторый (на глазок) однородный материал (т.е. не потому, что легче, а чтобы не следить сразу за большим количеством параметров). Потом, конечно, копаться в отброшенном страшно ломает, если красивая картинка в "основном" материале.

January 2021

S M T W T F S
     12
3456789
10111213141516
17181920212223
242526 27 28 2930
31      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 1st, 2026 06:43 pm
Powered by Dreamwidth Studios