Интернет Поиск — 1

Эффективный поиск по archive.org

Обычно archive.org воспринимается как большая электронная библиотека редких изданий: интересная, но не слишком полезная для частных родословных поисков. Так думала и я, пока не обнаружила там длинный фрагмент, посвящённый имению моих предков, с подробностями одного из дел, о которых я даже не подозревала.

Оказалось, что на сайте скрыто множество русскоязычных материалов, которых нет в других открытых источниках: подробные сенатские объявления (1825–1853 гг.), губернские и уездные ведомости, редкие газеты и журналы. Поиск по фамилиям помещиков, названиям населённых пунктов и редким ключевым словам нередко даёт поразительные результаты.

Да, распознавание кириллического текста там далеко не идеально, а поиск кажется запутанным, но поверьте — потраченное время стоит того. Ниже я покажу, как именно искать, чтобы находить максимум возможного в старой прессе и официальных объявлениях. В примерах будут использоваться фамилии фон Штральборн и Дерионзини, а также деревня (сельцо) Ершники.


С чего начать: выбор коллекции

Чтобы отсеять иностранные издания и сразу работать с российскими материалами, начните поиск со специальной базы. Если вам нужно расширить охват на зарубежные архивы, используйте шаблоны. В самой ссылке после слова collection: указывается название коллекции, а далее — искомое слово.

Полезные ссылки для старта:

Важный совет: Название коллекции всегда можно найти внизу под любым изданием. Коллекцию приходится выбирать вручную, так как общий поиск с главной страницы почему-то не позволяет искать по части слова (находит только урезанные варианты). Обязательно выбирайте опцию «Search text contents» — именно она включает поиск по распознанному тексту!


Основные способы поиска

Далее методы поиска можно условно разделить на несколько категорий в зависимости от того, как именно вы вводите запрос.

В том случае если вы хотите все же искать по иностранной коллекции, используйте такой шаблон и подставьте название нужной коллекции:

коллекция — это розовый маркер, голубой маркер — то слово, которое ищем.

Название коллекции можно найти внизу под любым изданием:

Поиск по части слова со звездочкой:

1. Поиск по полному слову и его вариантам

В отличие от поисковиков вроде Яндекса, где система сама «догадывается» о формах слова по корню, на archive.org этого нет. Вводить слово нужно именно в том виде, как оно могло быть напечатано в оригинале — включая твёрдые знаки («ъ») и дореформенные написания. В случае с приставками (например, «фон») лучше искать саму фамилию без них.

Примеры поиска:

Подсказка: чтобы не открывать каждую ссылку, наведите курсор на описание в выдаче — появится больше текста с контекстом.

2. Поиск с учётом ошибок распознавания (OCR)

Ошибки оцифровки нередки, но они подчиняются определенным закономерностям. Если их учитывать, результатов будет гораздо больше:

  • Твёрдый знак («ъ») в конце слова часто распознаётся как мягкий знак «ь», «з» или «г» (Штральборнь, Штральборнз, Штральборнг).
  • ⚜️ Штральборнь
    ⚜️ Штральборнз
    ⚜️ Штральборнг
  • Буква «н» в конце слова может читаться как «и» (Штральбориъ) — ⚜️ Штральбориъ
  • Сочетание «іо» в дореформенных текстах иногда распознаётся как «ю» или «о». Для фамилии Дерионзини проверяем: Дерюнзини, Деронзини — ⚜️ Дерюнзини⚜️ Деронзини
  • Не забывайте про падежные формы: Штральборна, Штральборну, Штральборномъ.

С названиями деревень ситуация аналогичная. Для Ершников стоит пробовать: Ершникахъ, Ершниковъ, Ершниковой (д-ни), а также варианты с заменой «ъ» на «ь», «з», «г».

3. Поиск по частям слова и комбинациям

Если слово «разорвано» переносом строки или ошибок слишком много, помогает поиск со звёздочкой (*) и сочетаниями (оператор AND). Звёздочка добавляется без пробела прямо к части слова. Слово AND пишется только заглавными буквами и отделяется пробелами.

Оператор AND не всегда работает идеально (иногда выдает страницы только с одним из слов), но это всё равно даёт больше совпадений. Если ищете 3 и более слов, добавляйте новый AND перед каждым.

Если вы ищите делаете поиск по одной части слова, достаточно такой комбинации:

Добавка AND помогает находить оба слова в одном тексте, однако работает она не всегда стабильно: среди результатов встречаются как страницы, где есть оба слова, так и те, где найдено только одно из них.
Тем не менее, такой способ всё же даёт больше полезных совпадений, чем поиск по одному слову, и в моём случае позволил быстрее выйти на нужные документы.


Как искать внутри самой книги:

Если при поиске по полному слову система сразу открывает нужный фрагмент, то при поиске со звёздочкой вас может перебросить в любую часть книги. В таком случае посмотрите на превью в результатах поиска, скопируйте искажённый вариант вашего слова (или любое соседнее слово, например «Порузикъ») и введите его во внутренний поиск по книге. Это приведет вас точно к цели.

Чтобы найти нужный фрагмент внутри книги, посмотрите на превью с результатом поиска и скопируйте искажённый вариант слова прямо оттуда.

Можно скопировать не само искомое слово, а любое соседнее, например — «Порузикъ», главное — попасть в нужный участок текста. Это позволит быстро найти место, где действительно встречается нужное упоминание, даже если распознавание сильно искажено.

И затем ввести это слово в поиск по книге:

4. Поиск точных фраз и поиск при переносах

Вы можете искать точные совпадения, взяв слова в кавычки

Или искать отдельные слоги, если предполагаете, что слово было перенесено на другую строку (например: Штраль- борн).


Примеры нестандартных запросов:


Дополнительные советы

Расширяйте базы. Русскоязычные материалы лежат не только в russianempiregenealogyresources. Вы можете подставлять в шаблоны поиска названия других полезных коллекций:

Анализируйте искажения. Если вам удалось найти искомое слово, проверьте, встречается ли оно в тексте повторно. Часто оно дублируется уже в искажённом виде. Скопируйте эти «ошибочные» варианты и сделайте новый поиск по ним. Закономерности ошибок OCR часто повторяются из книги в книгу.

Приведу несколько особенно запомнившихся примеров.

Одно из самых трогательных и необычных — дело 1842 года из сенатских объявлений во Владимирскую палату гражданского суда:

30545. Поручица Прасковья Иванова фон-Штральборнь, а в случае смерти ея, наследники или их поверенные, по делу о взыскиваемых с нее фон-Штральборн Владимирекою мещанкою Прасковьею Федоровою Друговою деньгах 240 р. асс. за обучение дворовой ея фон-Штральборнь девки Прасковьи Ефимовой шитью в пяльцах.

Одно из самых ценных для меня — дело о моих предках и их трудном положении, постановление 1862 года о количестве и составе оброка, включая женщин. Это редкий случай, когда суд справедливо защитил права крестьян.

V. Читано было прошение помещицы ротмистрши Ирины Ивановой Штральборн, в коем объясняет, что за крестьянами, поселенными на её земле и деревнях: Ершниках, Уставской и Сумарокове, состоит оброчная недоимка: Родионом Васильевым за прежнее время 15 руб., обще с братьями Федором и Иваном за 1861 год 50 руб., за последним корчемные за землю 7 руб., за Тихоном Афанасьевым за прежнее время 5 руб. и за 1861 год 20 руб., за Иваном Михайловым за 1860 год 20 руб. и за Петром Максимовым с отцом 25 руб., за Григорием Лаврентьевым за 1861 год 20 руб. и за Алексеем за 1861 год 10 руб., всего 192 руб. серебром — все они пользуются землею. Кроме того, не внесли холщового оброка за 1860 год — по 20 аршин женщины. О взыскании с означенных крестьян как оброчных, так и за холст денег она обращалась к г. мировому посреднику 2 участка, который уведомил её, что деньги с некоторых крестьян будут взысканы, но между тем до сего времени не получает их, тогда как срок платежа долга Опекунскому Совету (внесение платежа по кредиту самой помещицы) за 1861 год истекает, почему и просит сделать распоряжение о взыскании с крестьян оброка и ей, по месту жительства, объявить. При чём мировой посредник г. Полубояринов объявил, что для уплаты состоящей на крестьянах недоимки, хотя им и вручено Ростовскому Земскому Суду описать у них имение, но при описи оказалось, что описанное имущество недостаточно для покрытия недоимки, а что отдача в заработки некоторых недоимщиков невозможна — за старостью, совершенной неспособностью к работе, по причине слепоты (!). Мировой Съезд необходимым нашёл рассмотреть по ревизской сказке лета крестьян, за которыми состоит недоимка, и оказалось, что из 22 душ могут платить оброк только 7 душ. И что недоимка большей частью состоит за стариками, а потому ОПРЕДЕЛИЛ: пригласить помещицу Штральборн исключить из недоимки оброк, состоящий за такими крестьянами, которые не в состоянии уплатить оный по старости и совершенной невозможности к работе; с прочих же предоставить г. мировому посреднику принять законные меры взыскания. Что же касается до сбора холста за 1860 год, то объявить ей, что таковой сбор, по силе 5 ст. Правил о порядке приведения в действие Положения, не может быть произведён, как отменённый.

Желаю всем удачи!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *