Некорректная работа поисковиков для исключаемых слов

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Некорректная работа поисковиков для исключаемых слов
RSS

Некорректная работа поисковиков для исключаемых слов

Поисковики некорректно обрабатывают операнды исключения слов. И этот их "косяк" можно исправить СайтСпутником.

<<Назад  Вперед>>Страницы: 1 2 * 3
Печать
 
tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009

Алексей Мыльников написал:
[q]
К поисковику будет запрос "приземлился самолет", а "приземлился самолет" /7 ~Аэрофлот - это пост-запрос. Его на поисковики посылать бессмысленно
[/q]
Именно так. Это пост-запрос, который будет работать исключительно внутри СайтСпутника.
И такой же пост-запрос может эффективно работать в рубриках.


Алексей Мыльников написал:
[q]
На практике это не всегда хорошо, так как по "приземлился самолет" будет огромная выдача, которую надо будет всю переработать. Но если запросы к поисковикам идут по дате (интересует новая информация), то можно ограничить глубину поиска. В этом случае можно достичь практичного результата.
[/q]
Именно так и приходится делать.
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Алексей Мыльников написал:
[q]
К сожалению, это не решает проблемы. В приведённом мной примере №1 есть 2 фразы: "приземлился самолёт Боинг" и "приземлился самолёт Аэрофлота" оба выделенных слова располагаются в одной последовательности и на одинаковом расстоянии. Поисковики всё равно исключат документ из выдачи.
[/q]


Вот в таком варианте что плохо?

(приземлился /1 самолёт) ~ Аэрофлот

или вот в таком - более жестком:
"приземлился самолёт" ~ Аэрофлот

На всякий случай, проверяем - не исключены ли все документы по слову "Аэрофлот" огульно:
("приземлился самолёт" ~ Аэрофлот) && +Аэрофлот

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009

CI-KP написал:
[q]
Вот в таком варианте что плохо?

(приземлился /1 самолёт) ~ Аэрофлот
[/q]
Нормальный вариант :smile:
Яндекс просто работает с ошибками...
По этому запросу Яндекс должен был исключить все документы, в которых в одном предложении встречаются слова приземлился, самолёт и Аэрофлот.
Однако, если мы сделаем тут же "поиск в найденном" с запросом:

(приземлился /1 самолёт) & Аэрофлот

И видим: "Яндекс нашёл 131 ответ".
Я, правда, посмотрел не все ссылки, а только первые. В них во всех встречаются слова приземлился и самолёт только вместе со словом Аэрофлот и нигде не встречаются эти слова без слова Аэрофлот.
"Косяк" поисковика! :wonder1:
Поэтому мной и предложен вариант - собирать СайтСпутником всё, без исключения слов. А уже потом уточнять поиск (делать пост-обработку результатов).
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

tungus1973 написал:
[q]
Однако, если мы сделаем тут же "поиск в найденном" с запросом:
[/q]

У Яндекса "поиск в найденном", по моим наблюдениям, никогда корректно и не работал. Основная выдача может подглючивать, но временами, а вот "поиском в найденном" я вообще не пользуюсь.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
beta
Молчун

Всего сообщений: 1
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
15 нояб. 2012
Добрый день!
Подскажите, пожалуйста, ответ по такому вопросу:
Пользуюсь пакетом "Pro", при поиске по номеру телефона в выдаче результата много сайтов "мусоров", которые не несут в себе никакой полезной информации. Существуют ли какие-либо приемы, чтобы при выполнении таких запросов эти сайты в выдаче результата не попадались? Скажем, внести их в "Черный список" и в список "Сайты-исключения". В настройках поиска я этого не обнаружила, как и на этом форуме тоже.

Под сайтами "мусора" я имею в виду, например, такие:




И им подобные.

Заранее спасибо.
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

beta написал:
[q]
Существуют ли какие-либо приемы, чтобы при выполнении таких запросов эти сайты в выдаче результата не попадались? Скажем, внести их в "Черный список" и в список "Сайты-исключения".
[/q]

Вот здесь на форуме - forum.razved.info/index.php?t=1170 есть тема: Блэклист сайтов.

Но можно использовать: в подменю "Золотой ключик" - "Сбор информации по..." - "Телефону". Здесь отрабатывает алгоритм отбрасывающий значительное количество ненужных сайтов (в поисковиках они мелькают, а в выдачу не пропускаются).

<<Назад  Вперед>>Страницы: 1 2 * 3
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Некорректная работа поисковиков для исключаемых слов
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS