Сильные обновления.
В корпусе со снятой грамматической омонимией появилась семантика. Появилась форма поиска по ней. Полисемия при этом не снята. Наиболее одиозные случаи ("мальчик", "девочка" и "мать" -- животные, "организм" -- сверхъестественное существо) мы выкинули, остальное живет. Hint: используйте вместе с семантикой грамматическую одушевленность.
Вот интересный запросик для примера.
Там же (в корпусе со снятой грамм. омонимией) теперь живет (нет, не так: живЁт), наряду с ударением, еще и буква Ё.
Появилась статистика по типу текстов и частям речи в вычищенном "золотом миллионе".
Неснятый корпус пополнился. Теперь у нас есть, в частности, транскрипты устной речи (пока немного, будет больше).
В корпусе со снятой грамматической омонимией появилась семантика. Появилась форма поиска по ней. Полисемия при этом не снята. Наиболее одиозные случаи ("мальчик", "девочка" и "мать" -- животные, "организм" -- сверхъестественное существо) мы выкинули, остальное живет. Hint: используйте вместе с семантикой грамматическую одушевленность.
Вот интересный запросик для примера.
Там же (в корпусе со снятой грамм. омонимией) теперь живет (нет, не так: живЁт), наряду с ударением, еще и буква Ё.
Появилась статистика по типу текстов и частям речи в вычищенном "золотом миллионе".
Неснятый корпус пополнился. Теперь у нас есть, в частности, транскрипты устной речи (пока немного, будет больше).
no subject
Date: 2004-10-17 12:52 pm (UTC)no subject
Date: 2004-10-17 12:57 pm (UTC)http://ruscorpora.ru:17000/testing?text=lexgramm&t=1000&mycorp=&lex1=&grm1=S&sem1=r%3Aconcr+%26+t%3Aanimal&min2=1&max2=1&lex2=&grm2=S&sem2=r%3Aconcr+%26+t%3Aanimal&min3=1&max3=1&lex3=&grm3=S&sem3=r%3Aconcr+%26+t%3Aanimal