Яндекс Поиске по архивам

Интернет Поиск — 2. Секретный прием: как увеличить результаты в «Яндекс Поиске по архивам» в десятки раз!

Хочу поделиться маленьким, но очень мощным секретом, как увеличить количество результатов по нужным вам ключевым словам в Яндекс Поиск по архивам буквально в десятки раз!

Недавно на этом замечательном ресурсе появилась функция поиска, добавляющая в выдачу похожие слова, которые получились в результате искажений распознанного текста или из-за разных вариантов написания имен, фамилий и топонимов. Этот инструмент сложно не заметить, и он дает великолепные результаты!

Но есть еще один дополнительный способ. Иногда довольно редкие слова искажены настолько сильно, что не помогает даже переключатель похожих вариантов. Стоило мне воспользоваться этим скрытым инструментом, и у меня выстроилась целая цепочка невероятных открытий.

📌 Важное уточнение (Дисклеймер) перед тем, как мы начнем:

Этот метод — настоящая палочка-выручалочка в ситуациях, когда результатов критически мало. Он идеально работает для сложных, редких, ключевых слов.

Но давайте будем реалистами: если вы ищете распространенную фамилию (например, Жуков или Иванов), поиск просто по усеченному слову со звездочкой Жуков* только усугубит масштаб бедствия. Вы получите сотни тысяч результатов, включая всех «Жуковских» и «Жуковичей»

Если вас интересуют более распространенные ключевые слова, а не редкие иностранные фамилии, дочитайте или пролистайте статью до конца, я опишу случаи с более типичными именами, фамилиями, топографическими названиями и прочими терминами.

Шаг 1: Ввожу фамилию без искажений, не использую переключатель похожих вариантов. Получаю всего 6 результатов. Негусто.

Шаг 2: Включаю переключатель похожих вариантов. Уже гораздо лучше — 13 результатов, часть из них перекидывается на вторую страницу.

Шаг 3: Использую продвинутые способы, описанные ниже, и получаю около 100 результатов и 10 страниц закладок. Впечатляет, правда?

Как работает магия одной звездочки (*)? Поехали:

Если среди ключевых слов вашего поиска есть редкие имена, географические названия или сложные фамилии, которые редко писали одинаково, а автоматическое распознавание текста трактует их неправильно — лучше всего делать поиск по части слова, добавляя звездочку (*) в конце.

Приведу примеры из собственной практики:

В саге о помещиках Штральборнах и Дерионзини их фамилии как только не коверкали. Правильные варианты написания встречаются лишь в единичных случаях. Сначала я нашла много нового, когда стала вводить усеченные варианты: фон Штраль, фон Штрал или даже фон Шта, фон Шра.

Но когда я попробовала использовать эти варианты со звездочкой — Штраль*, Штрал*, фон Шта*, фон Шра* — это просто в корне изменило результаты поиска! Когда в фамилии верно написаны только 3-4 буквы, а сочетание этих букв довольно уникально, одного встроенного движка мало, нужна звездочка.

Важное замечание: при использовании поиска со звездочкой переключатель «похожих вариантов» Яндекса лучше отключить. Если вы ищите по комбинации всего нескольких букв, то придется искать иголку в стоге сена.

Поиск нестандартных искажений

Другой пример, из-за которого я чуть не упала со стула от удивления и решила написать этот пост — фамилия Дерионзини. Стоило ввести в поиск Дерион* или Дерио* — и вся родословная этого редкого рода оказалась как на ладони!

Но и это еще не все. Иногда некоторые заглавные буквы распознаются алгоритмом как другие, или их очень сильно искажали сами писцы. Здесь можно поиграть с вариантами: Вериоз*, Дероз*, Дироз* и т. д.

А как часто (и в прошлом, и сейчас) путают буквы Е и И, А и О, К и Г! Если таких ошибок в слове несколько, все эти варианты стоит попробовать, подставив вместо окончания звездочку (например, Дирио*). Результаты просто потрясающие!

Пример успешной находки, когда обычный поиск и поиск с переключателем похожих вариантов не работает.

Переносы и контекстные комбинации

Еще один нюанс — всегда учитывайте переносы. Это значит, что можно искать по второй части слова, если его перенесли на другую строку. Например, в случае с двойным написанием Штраль-Борн — можно искать и по Штраль*, и отдельно по Борн*.

Дополнительно вводите другие ключевые слова, жестко связанные с объектом поиска, чтобы отфильтровать выдачу. Например:

  • граф Дерион*
  • Гаврила Дерион*
  • поручик Штрал*
  • денег Штрал*

ИЛИ попробуйте два слова со звездочкой!

  • граф* Дерион*
  • Гаврил* Дерион*
  • Суздал* Штрал*
  • Людв* Штрал*
  • фон Штрал*
  • Карлов Штрал*
  • поруч* Штрал*
  • денег* Штрал* — Это могут быть комбинации имени и фамилии, населенного пункта и фамилии, отчества и фамилии, попробуйте использовать только неизменяемую часть слова, а в окончания и суффиксы вставлять звездочку.

Иногда такие комбинации отлично помогают поиску, иногда слишком его сужают — тут нужно пробовать и экспериментировать.

А как быть с русскими фамилиями и крестьянскими родами?

Резонный вопрос: «Звездочка хороша для немцев и итальянцев, а как же Ивановы, Жуковы или крестьяне, у которых вообще не было фамилий?». Если вы просто введете Жуков*, система выдаст вам сотни тысяч результатов, подтянув всех Жуковских, Жуковичей и Жуковых со всей страны. С этим массивом невозможно работать.

Секрет поиска распространенных русских корней и крестьянских родов заключается не в одной звездочке, а в комбинации усеченных слов и фильтров.

Вот несколько эффективных сценариев:

1. Поиск фамилий на -СКИЙ, -ОВИЧ, -ЕВА

Алгоритмы Яндекса действительно неплохо обучены на стандартных русских окончаниях. Но если вы получаете слишком много шума, используйте усечение базовой основы фамилии плюс дополнительный идентификатор (имя, отчество или место).

  • Как не надо: Островский (сотни тысяч совпадений).
  • Как надо: Островск* + Евламп*.
  • Почему это работает: Окончания (-ий, -ая, -ого, -ому) меняются в зависимости от падежа и рода, а писцы часто сокращали их недописанными закорючками. Отбросив изменчивое окончание и добавив усеченное имя (чтобы избежать ошибок вроде «Евлампий/Евлампей»), вы получаете точечный результат.

2. Поиск по редким сочетаниям (без привязки к фамилии)

У большинства крестьян до определенного периода фамилий не было вовсе. Искать «Ивана Иванова» бессмысленно. В таких случаях мы опираемся на связку имени/отчества с уникальным топонимом (названием деревни, села, прихода).

  • Пример 1: Ищем крестьянина в конкретной деревне. Допустим, вам нужен Иван Куприянович из Ближней Слободы. Вводим: Купр* слобод* Почему это работает: Мы страхуемся от ошибок в отчестве (Куприянов, Купреянов, Киприянов) и от того, как записали деревню (Слобода, Слободка, в Слободке).
  • Пример 2: Ищем семью по редкому имени. Если в семье был кто-то с не самым частым именем (Акакий, Евграф, Силуян), цепляйтесь за него! Например, Богдановы из деревни Ершники. Вводим: Богд* ершн*
  • Используйте связки с сословием, званием, родом деятельности: Купец Косатк*, солдат Бобр*, мещан* Иголк*, крестьян* Артемыч*

3. Топонимы: когда ищем не людей, а место

Топографические названия в старых документах не имеют однотипного написания. Деревня из 20 дворов могла называться Городище, Городищи, на Городищах, а писарь мог пропустить половину букв.

В некоторых случаях, когда документы по нужной семье не находятся вовсе, единственная стратегия — просматривать всё, что сохранилось по крошечному населенному пункту.

  • Вводим: Городищ* + священ* (если ищем клировые ведомости) или Городищ* + двор* (если ищем подворные переписи).
  • Распространенные названия деревень вводите вместе с названием волости в комбинации! Новоселки — очень распространенное название, но в связке с волостью Новоселко-Пеньковской можно найти, то что нужно! Поэтому ищем Новоселк* Пеньков* или Новоселк* Пеньк*

4. Фильтры — ваши лучшие друзья

Комбинация звездочек дает лучшую полноту поиска (находит всё, даже с опечатками), но чтобы обеспечить точность (отсечь лишнее), обязательно используйте боковую панель настроек Яндекса.

Найдя удачную связку Богд* ершн*, обязательно:

  • Сузьте регион: выберите конкретный архив (например, ГКУ ЯО ГАЯО для Ярославля).
  • Ограничьте годы: если знаете, что семья жила там в 1850-х, выставьте период с 1840 по 1860, чтобы отсечь однофамильцев из других веков.

Резюме: Даже если вы ищете людей с самыми обычными именами, метод звездочки работает. Главное — найти в их биографии хотя бы одно «узкое место» (редкое имя родственника, название деревни, нестандартное отчество) и усечь его, отбросив все возможные ошибки писцов и алгоритмов распознавания.

Желаю всем удачи и новых архивных открытий!