корпус
Сильные обновления.
В корпусе со снятой грамматической омонимией появилась семантика. Появилась форма поиска по ней. Полисемия при этом не снята. Наиболее одиозные случаи ("мальчик", "девочка" и "мать" -- животные, "организм" -- сверхъестественное существо) мы выкинули, остальное живет. Hint: используйте вместе с семантикой грамматическую одушевленность.
Вот интересный запросик для примера.
Там же (в корпусе со снятой грамм. омонимией) теперь живет (нет, не так: живЁт), наряду с ударением, еще и буква Ё.
Появилась статистика по типу текстов и частям речи в вычищенном "золотом миллионе".
Неснятый корпус пополнился. Теперь у нас есть, в частности, транскрипты устной речи (пока немного, будет больше).
В корпусе со снятой грамматической омонимией появилась семантика. Появилась форма поиска по ней. Полисемия при этом не снята. Наиболее одиозные случаи ("мальчик", "девочка" и "мать" -- животные, "организм" -- сверхъестественное существо) мы выкинули, остальное живет. Hint: используйте вместе с семантикой грамматическую одушевленность.
Вот интересный запросик для примера.
Там же (в корпусе со снятой грамм. омонимией) теперь живет (нет, не так: живЁт), наряду с ударением, еще и буква Ё.
Появилась статистика по типу текстов и частям речи в вычищенном "золотом миллионе".
Неснятый корпус пополнился. Теперь у нас есть, в частности, транскрипты устной речи (пока немного, будет больше).
