Данилов и Данилюк: проблемы текстологии
К сегодняшней презентации пополнения Корпуса (теперь 120 млн слов! слава
uht!). Думаю, это уже можно рассказать.
Позавчера
ormer_fidler искал в Корпусе нечто (а там всё выдаётся по одному предложению) и наткнулся на изумительный факт. После чего он послал мне такое письмо:
Открыл файлы при помощи встроенного в Windows Commander сравнивальщика текстов -- элегантного средства, недоступного Лихачёву или Рейсеру (и даже такие светила точной и методологически безупречной (тм) научной (тм) филологии, как Шапир и Пильщиков, не очень, кажется, им пользуются; впрочем, Пильщикова, может быть, коллеги по feb-web уже научили).
Это несомненно две редакции одного и того же романа. В обоих романах одинаковое количество глав, и главы эти одинаково называются. Тем не менее скрупулёзная машина даёт целых 704 разночтения. Часто они сводятся к тому, что некоторые эпизоды, наличествующие у Данилюка, у Данилова отсутствуют. (В целом "Рублёвая зона" на 132 КБ, почти на 20%, длиннее "Банка"). С другой стороны, в тексте Данилюка отсутствуют некоторые неудачные даниловские тропы и образы (например, герой Данилова "перелистал рукой пачку", его homologue у Данилюка листает пачку без упоминания руки; затем на его лице появляется "понимающее выражение", элегантно сжатое Данилюком до "понимания").
Является ли Данилов сокращённым изводом Данилюка, опубликованным на четыре года раньше, или, напротив, Данилюк представляет собой отредактированное расширение (амплификацию) Данилова -- сложная задача, сопоставимая с филиацией списков Задонщины. Оставим эту проблему будущим исследователям русско-украинских литературных связей.
Книги вышли в одном и том же издательстве -- уважаемом "Вагриусе" (думаю, на него это тени ни в коей мере не бросает -- всех аффтаров по байтам сличать не будешь).
Upd. Благодаря гениальной интуиции
graf_g загадка разрешена: http://mitrius.livejournal.com/421252.html?thread=3888516#t3888516
Позавчера
Величайшая загадка постсоветской литературы.Получив письмо, я обратился к полным текстам романов (у меня-то они есть).
Вот есть такая фраза: "Что глазками-то буровишь, чистоплюй?"
Согласно нашему НКРЯ, она встречается в ДВУХ произведениях:
1) Семен Данилюк. Рублевая зона (2004)
и
2) Всеволод Данилов. Банк (2000)
Как такое может быть?!
Открыл файлы при помощи встроенного в Windows Commander сравнивальщика текстов -- элегантного средства, недоступного Лихачёву или Рейсеру (и даже такие светила точной и методологически безупречной (тм) научной (тм) филологии, как Шапир и Пильщиков, не очень, кажется, им пользуются; впрочем, Пильщикова, может быть, коллеги по feb-web уже научили).
Это несомненно две редакции одного и того же романа. В обоих романах одинаковое количество глав, и главы эти одинаково называются. Тем не менее скрупулёзная машина даёт целых 704 разночтения. Часто они сводятся к тому, что некоторые эпизоды, наличествующие у Данилюка, у Данилова отсутствуют. (В целом "Рублёвая зона" на 132 КБ, почти на 20%, длиннее "Банка"). С другой стороны, в тексте Данилюка отсутствуют некоторые неудачные даниловские тропы и образы (например, герой Данилова "перелистал рукой пачку", его homologue у Данилюка листает пачку без упоминания руки; затем на его лице появляется "понимающее выражение", элегантно сжатое Данилюком до "понимания").
Является ли Данилов сокращённым изводом Данилюка, опубликованным на четыре года раньше, или, напротив, Данилюк представляет собой отредактированное расширение (амплификацию) Данилова -- сложная задача, сопоставимая с филиацией списков Задонщины. Оставим эту проблему будущим исследователям русско-украинских литературных связей.
Книги вышли в одном и том же издательстве -- уважаемом "Вагриусе" (думаю, на него это тени ни в коей мере не бросает -- всех аффтаров по байтам сличать не будешь).
Upd. Благодаря гениальной интуиции
no subject
no subject
no subject
/offtop/
> и даже такие светила точной и методологически безупречной (тм) научной (тм) филологии,
> как Шапир и Пильщиков, не очень, кажется, им пользуются; впрочем, Пильщикова, может быть,
> коллеги по feb-web уже научили
Можно спросить, почему у вас такое мнение? Компьютерным инструментарием Ш.&П. пользуются уж не хуже других, это точно.
no subject
no subject
P.S. Такая функция как Compare by Content, насколько я знаю, является весьма популярной и в филологической среде.
P.P.S. Кстати Windows Commander уже несколько лет называется Total Commander! Когда этот файловый менеджер стал набирать популярность, Билл Гейтс спохватился, чего это еще один Windows командир выискался. Подал в суд. Пришлось программу переименовывать.
no subject
У меня и Ворд 97-й стоит :)
no subject
Кстати настоящие джедаи до сих пор работают в WW2 (лучший редактор IMHO).
no subject
no subject
Конвертация между версиями вордов, конечно, не очень проста, но тоже решаемый вопрос.
P.S. Юникод в принципе вещь хорошая, но конкретная сегодняшняя реализации вызывает много нареканий (мы это несколько раз обсуждали на форуме www.prodtp.ru).
no subject
А конвертировать туда-сюда да макросы ставить — это на любителя, не все столь продвинуты, не каждый захочет возиться.
no subject
Я имел в виду, что геморрой с перелопачиванием старых макросов и переучиванием себя больше, чем неудобства совместимости. Это конкретно моя ситуация и еще ряда пользователей.
Да кроме того, WW2 не имеет кучи дурацких фич, типа принудительной нумерации абзацев (если первый абзац начинался с цифры) и под., которых и отключить-то не всегда можно. И работает с большими документами WW2 намного стабильнее. Документ, который держит без глюков WW2, раз в 5 превышает по объему документ, который корректно обслуживается, скажем, WW XP.
no subject
no subject
Переносы -- только мягкие сплошняком. И если прикручен модуль Орфы (а его еще поискать надо). То же касается и орфографии.
У меня стоят в линейку WW2, WW6, WW7/95, WW8/97, WWXP/2002. Все работает.
Шрифты t1 поддерживаются. Но есть общее ограничение на кол-во шрифтов -- ок. 400 штук.
В общем, не уверен, что оно вам понравится и стоит тратить на это время.
no subject
no subject
http://webfile.ru/805881
12mb.
Но для конвертации из юникодного формата в однобайтовый потребуется еще и WW6.
no subject
no subject
У меня подруга в "Вагриусе" работает, надо ей рассказать. Интересно, что скажет :)
no subject
В этом свете интересно, в какое время происходит действие. Потому что если в совсем-совсем современное читателю, то все-таки реалии 2000 и 2004 (ну, или 1999 и 2003, когда там писалось теоретически) годов хоть чем-то должны отличаться. Впрочем, может, и не должны...
no subject
no subject
no subject
Стоял жаркий январь 2004 года. На Сиднейском научно-практическом симпозиуме...
и не менее блистательно кончается:
Забелин вслушивался в затухающие звуки, а в ушах у него все сильнее звучал совсем иной перезвон, далекого теперь девяносто восьмого года.
После чего идёт текст, совпадающий с Даниловым.
Остроумные люди.
no subject
Тут, кстати, вопрос: а как вы вообще планируете поступать с подобными историям (вон, я вижу, тебе в комментах уже намекают на аналогичные случаи)? Нет ли основания подключать этот самый сравниватель текстов к корпусу на момент забивания нового текста - с тем, чтобы не возникало таких повторов? Или проблемы этой нет?
no subject
Был еще забавный случай -- статья из владивостокской газеты летом 2003, через неск. дней, перепечатана в Красноярске под слегка изменённым названием (но говорить, плагиат это или нет, я бы поостерёгся -- из электронной базы данных неясно, какое было указано авторство и была ли сноска о перепечатке).
Думаю, случаи эти не массовые и легко ловятся пользователями, так что автоматический plagiarism checker тут не нужен.
no subject
no subject
no subject
Офф: да, теперь корпус настолько большой, что ему мало на что хватает памяти. Зато устная речь, наконец, ура!
no subject
данилюк свалился в люк --
не пугайтесь, это глюк!
оба были в корпусе со вчерашнего дня с 14:57.
no subject
А ты не знаешь, почему яма - это сверхестественное существо?
no subject
S;яма;2;propn;hum:supernat;;;;;persn:миф
Взялся он там из последнего издания Зализняка. Индийский бог какой-то.
no subject
Бог смерти.
no subject
no subject
no subject
no subject
("Excorporatio" quoque significationem ecclesiasticam habet, obiter dictu ;-) )
no subject
В смысле, как-то более естественно переделывать Данилова в Данилюка, чем наоборот. Что, в принципе, говорит скорее о том, что , что и вообще более естественно, если более поздняя версия по тексту чуть более, как ты показываешь, причесанная.
no subject
no subject
no subject
no subject
no subject
no subject
no subject
no subject
no subject
А Латынина некоторое (первое) время издавала свои романы под псевдонимом Климович. А потом переиздавала их, тоже, по-моему, слегка причесывая, уже под своей собственной фамилией.
no subject
no subject
Киз свои "Цветы для Элджернона" как только не писал - и никто ему этого не вменяет.
no subject