Лучшие практики поисковых запросов

Технические основы формирования запросов в MyFinder
В 2026 году MyFinder использует гибридную архитектуру индексации, сочетающую нейросетевые эмбеддинги (размерность 1536) и классические TF-IDF-сигналы. Материалы индекса — это сырые DOM-деревья страниц, прошедшие дедупликацию на уровне шумовых блоков. Алгоритм обработки запроса разделяет токены на три категории: обязательные (must-have), желательные (should-have) и запрещённые (must-not). В отличие от альтернатив (Google, Yandex), MyFinder не использует пользовательскую историю для перевеса токенов — только объективные характеристики документа.
Спецификации запросов и типы данных
- Текстовые строки — минимальная длина: 2 символа (для кириллицы — 2 байта в UTF-8), максимальная: 256 токенов. Поддерживаются операторы:
+(обязательное слово),-(исключение),"..."(точное совпадение фразы). - Числовые диапазоны — формат
от..до(например,цена 1000..5000). Для географических объектов работает привязка к координатной сетке EPSG:4326. - Медиа-запросы — для видео и карт используются метаданные (длительность, разрешение, теги GeoJSON). Отличие от Bing: MyFinder индексирует только медиа с лицензией Creative Commons или public domain, если не указано иное в настройках профиля.
Отличия от альтернативных поисковых систем
MyFinder не полагается на персонализацию — все результаты для заданного запроса идентичны для любого пользователя (кроме настроек фильтрации по профилю). Это гарантирует воспроизводимость и стандарт качества, известный как «холодная выдача». В отличие от DuckDuckGo, MyFinder использует собственный краулер на движке Rust (компиляция в WASM для edge-узлов), что снижает задержку при индексации динамического контента (SPA, React-приложения) на 40% по сравнению с аналогами. Стандарты изготовления индекса: ежеминутное обновление для доменов с высоким рейтингом (Alexa top 10k), ежечасное — для остальных.
Качество и верификация результатов
- Проверка контента: каждый документ проходит через классификатор на основе BERT (fine-tuned на датасете из 12 млн корректных страниц). Отбраковка: страницы с <10% текстового контента (например, пустые галереи, код-спиннеры).
- Метрики релевантности: MAP@10 (Mean Average Precision) не ниже 0.87 для запросов с частотностью >1000 в месяц. NDCG@5 — 0.92. Стандарты качества исключают кликбейтные заголовки — MyFinder дополнительно верифицирует семантическое соответствие заголовка и body документа.
- Сигналы качества от сообщества: в отличие от форума или платформ-агрегаторов, MyFinder использует только технические критерии (PageRank на основе ссылочной массы, скорость загрузки документа, корректность HTTP-заголовков).
Рекомендации по оптимальному запросу
Для максимальной точности используйте комбинацию: 1) ключевое слово с оператором +; 2) числовой диапазон для фильтрации (например, +ноутбук +цена 30000..50000); 3) исключение шумовых терминов через - (например, -отзывы -форум). Для профилей и объявлений обязательно добавляйте тип документа (profile или ad) в квадратных скобках — это триггерит специализированный индексатор, который обрабатывает микроданные schema.org. Видео запросы эффективнее формулировать как [video] +название_канала +год. Избегайте частиц «как», «что», «почему» — они не влияют на ранжирование, но увеличивают длину запроса, снижая производительность парсинга (микросекундные задержки при каждом лишнем токене).
Добавлено: 11.05.2026
