Эмуляция (программная реализация) скобок в языках запросов

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Программируем пакеты СайтСпутника (для продвинутых юзеров) »   Эмуляция (программная реализация) скобок в языках запросов
RSS

Эмуляция (программная реализация) скобок в языках запросов

Реализация скобок (скобочной структуры) для запросов, заданных в Яндексе, Google, Yahoo, других поисковиках и встроенных в сайты поисках

<<Назад  Вперед>>Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Замечание от 21.12.17.
По этой теме и её развитии смотрите ещё здесь - Запрос + Пост-запрос.


    Как известно, в ближайшее время в Языке запросов Яндекса скобочные структуры (или просто скобки) перестанут поддерживаться, а в Google, Bing, других поисковиках и, тем более, во встроенных в сайты поисках скобок никогда не было и в помине.

    В этой связи, в версии 9.3.1 программы SiteSputnik от 06.02.2017 реализована эмуляция (программная реализация) скобочной структуры, которая может быть применена как для Яндекса, Google, Bing и других поисковиков, так и для встроенных в сайты поисков.


    Суть вопроса продемонстрирована на наглядном примере:

    (site:one.ru | site:two.ru) ( (Астафьев /1 Иван) | (Руденко /1 (Владимир | эдуард)) | (Кудрин /1 Александр) )

    В этом чисто демонстрационном запросе на двух сайтах ищутся четыре личности: Астафьев Иван, Руденко Владимир и Эдуард и Кудрин Александр. В запросе использована трехуровневая скобочная структура.

    Программа СайтСпутник может преобразовать этот запрос к следующему теоретически на 100% эквивалентному и в значительной степени эквивалентному на практике пакету запросов, точнее на практике выдача такого пакета запросов будет лучше, а именно, она будет более полной и более релевантной (пояснение приведено ниже), чем выдача скобочного запроса:

    site:one.ru Астафьев /1 Иван
    site:two.ru Астафьев /1 Иван
    site:one.ru Руденко /1 Владимир
    site:one.ru Руденко /1 эдуард
    site:two.ru Руденко /1 Владимир
    site:two.ru Руденко /1 эдуард
    site:one.ru Кудрин /1 Александр
    site:two.ru Кудрин /1 Александр

    Результатом выполнения этого пакета запросов будет объединенная выдача, такая, как будто, выполнялся один запрос. Повторно найденные ссылки в выдачу не попадут. Это первый "стандартный" вариант выдачи.

    Второй вариант выдачи - выдача будет упорядочена таким образом: чем большим количеством отдельных запросов была найдена ссылка, тем ближе к началу выдачи она будет стоять. Для этого в пакет запросов следует добавить операцию Аналитическое объединение: ^^АО;. В этом варианте выдачи для каждой ссылки указывается какими именно запросами она была найдена.

    ПЛЮСЫ:
    - Описанная эмуляция скобочной структуры работает не только для Яндекса, но и для Google, Yahoo, Bing, ... , для любого другого поисковика или встроенного в сайт поиска, в которых скобок нет и никогда не было. То есть, Пользователь получает возможность применять скобки в запросах для любого подключенного к СайтСпутнику поиска.
    - можно установить связи объектов, точнее те страницы на которых они вместе упомянуты (это для второго варианта выдачи).
    - поиск и сбор информации будет более релевантным за счет возможности упорядочивания ссылок по "весу" (количеству запросов, которыми каждая ссылка была найдена). Это утверждение лучше рассматривать на приведенном во втором топике примере, где задан запрос для одного, а не четырёх объектов.
    - более полный поиск и сбор информации: смотрите публикацию от 2009 года - Закон аддитивности и его нарушение в основных поисковиках.
    - ещё одна чисто техническая причина более полного поиска: поисковики по одному запросу выдают не более 1000 ссылок, соответственно, по скобочному запросу можно получить максимум 1000 релевантных ссылок, а по пакету запросов из 8 запросов до 8000 ссылок.
    - для любого поисковика и для любого другого источника практически снимается ограничение на длину запроса в символах.

    МИНУСы:
    - поиск и сбор идет дольше, ориентировочно, кратно количеству запросов в пакете запросов,

Продолжение следует ...

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Второй пример.

    Запрос со скобками:

    ((Мыльников /2 Алексей ) | (Mylnikov /1 Alexei) | SiteSputnik | СайтСпутник) ((программное | математическое) /3 обеспечение)

    Эквивалентный пакет запросов:

    Мыльников /2 Алексей программное /3 обеспечение
    Мыльников /2 Алексей математическое /3 обеспечение
    Mylnikov /1 Alexei программное /3 обеспечение
    Mylnikov /1 Alexei математическое /3 обеспечение
    SiteSputnik программное /3 обеспечение
    SiteSputnik математическое /3 обеспечение
    СайтСпутник программное /3 обеспечение
    СайтСпутник математическое /3 обеспечение


    В настоящей реализации, чтобы включить пребразования скобочных запросов к бесскобочным, установите в Настройках на вкладке Pro галочку для параметра "Раскрывать скобки в запросах" (см. по чёрной стрелочке на картинке). По умолчанию эта настройка пока выключена.



Продолжение следует ...

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Картинки по материалам, изложенным выше.
    На всех картинках в качестве Источников применен Метапоиск, в который входит поиск в Яндексе, Google, Yahoo, NSN (Bing), Mail.ru, Rambler, блогах Яндекса и Google. Глубина всех поисков - 7 страниц.

    Картинка со скобочным запросом, если он задан как простой запрос:



    а эта картинка, если он применяется в пакете запросов:



    Эта картинка, с его эквивалентным бесскобочным видом:



    Картинка, в которой добавлена операции "Аналитическое объединение" (эта операция не является обязательной):




    На практике Вы можете произвольным образом отредактировать пакет запросов перед отправкой его на выполнение.


    Дополнительное замечание:

    1) ~, &. &&, !! - для этих операций на этапе поиска программная реализация (эмуляция) невозможна, но на этапе Рубрикации в SiteSputnik Pro+News и выше такая эмуляция возможна, но, к сожалению, только для ссылок, найденных на этапе поиска, а не для всего "индекса" Источника или Источников.

    2) Рубрикацию всегда можно выполнить после поиска, причем по различным правилам, побробнее на ссылке.

    3) Скобочных запросов в пакете может быть сколько угодно, бесскобочные запросы могут стоять рядом со скобочными.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Отличный выход из ситуации с Яндексом!
А кроме того, прекрасная возможность улучшить качество сбора информации из других поисковиков.
:good:
<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Программируем пакеты СайтСпутника (для продвинутых юзеров) »   Эмуляция (программная реализация) скобок в языках запросов
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS