Аналитическое вычитание

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Аналитическое вычитание
RSS

Аналитическое вычитание

<<Назад  Вперед>>Страницы: 1 2 * 3 4
Печать
 
Искендер
Администратор

Всего сообщений: 5925
Рейтинг пользователя: 43


Ссылка


Дата регистрации на форуме:
7 июня 2009

Alexei Mylnikov написал:
[q]

Искендер написал:
[q]
Через "АВ" мы, действительно, могли бы (пошагово, к примеру, или пакетом) убрать "Сергеевичей", "Михайловичей", "Владимировичей", "Петровичей" и прочих не нужных нам Игорей Федоровых.
[/q]
Да, согласен: это способ убрать из выдачи некоторые заведомо ненужные страницы, причем делать это можно "долго" и "упорно", чего на чистом Гугле не сделаешь, то есть можно добиться более точного результата. Сделать ее реально.Еще где-нибуть АВ может быть полезно?
[/q]

Думаю, что похожий пример смог бы привести уважаемый Дмитрий Петряшов. По какой-то товарной номенклатуре.

---
I`m not a Spy! I can do much better!
Информационные войны "под ключ"
petryashov
Администратор

Откуда: Москва
Всего сообщений: 480
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009

Искендер написал:
[q]
Думаю, что похожий пример смог бы привести уважаемый Дмитрий Петряшов. По какой-то товарной номенклатуре.
[/q]

Пара первых попавшихся примеров:

1. Если такая компания Legrand, а есть композитор Мишель Легран. Информации куча и по тому, и по тому. Мишель Легран мне не нужен, надо его "вычесть"

2. При мониторинге по слову GE (General Electric) находится масса грузинских сайтов, у которых домены заканчиваются на .ge. Соответственно, грузинские сайты тоже нужно отметать

И кстати, Алексей, можно ли сделать некой черный список тех сайтов, которые СайтСпутник должен обходить стороной? Например, выкинуть все или некоторые грузинские сайты или все или часть музыкальных сайтов, содержащих информацию о Мишеле Легране?
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

petryashov написал:
[q]
И кстати, Алексей, можно ли сделать некой черный список тех сайтов, которые СайтСпутник должен обходить стороной? Например, выкинуть все или некоторые грузинские сайты или все или часть музыкальных сайтов, содержащих информацию о Мишеле Легране?
[/q]
Своих фильтров над сниппетами в СайтСпутнике пока нет.

Замечание от 28.10.10.
В настоящее время уже есть. Смотрите на форуме здесь - forum.razved.info/index.php?t=1007

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Еще один частый пример - нередко встречается одно и то же название организаций во многих регионах. Чтобы найти нужную, приходится указывать исключения:

"Самолёт" ~/1 (ЗАО | ОАО) ~~/40 (Москва | Волгоград | Петербург) || Yandex=1000

Эту задачу тоже можно решать с помощью "АВ".

Если сказать общими словами, то "Аналитическое Вычитание" необходимо везде, где нужно исключить МАССУ похожих объектов.
АВ - такая же аналитическая операция, как и АО, как и анализ пересечений объектов.
tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Снова возвращаюсь к теме "Аналитического вычитания".

Один из коллег СПКР попросил помочь в сборе информации.
Уже сейчас из задания ясно, что придется выполнять поиск в несколько этапов. Значит, одни и те же ссылки будут попадаться несколько раз. Хотелось бы облегчить задачу.

Вопрос к Alexei Mylnikov: можно в сделать в СайтСпутнике универсальный механизм "АО" "АВ"? Например, так.

Выполняем несколько поисковых пакетов, которые в СайтСпутнике записываются под универсальными системными номерами (эти номера уже сейчас автоматически присваиваются каждому новому запросу):

1. ....
2. ....
3. ....
4. АО 3-(1+2)

Четвертая строка - аналитическая операция над ссылками, собранными в пунктах 1, 2, 3. В данном случае обозначает, что нужно выполнить "Аналитическое объединение" над ссылками, собранными по строкам 1 и 2. Затем вычесть полученное из ссылок, собранных по строке 3.
Запись в строке 4 могла бы выглядеть и так "АО 3-1-2". Это не принципиально. Просто хотелось показать, что теоретически к таким записям можно было бы применять скобки как в математике.

Возможно ли реализовать этот способ?
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
Возможно ли реализовать этот способ?
[/q]

Да, возможно.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
В версии SiteSputnik 6.4.6 от 28.10.10 появилась обсуждаемая в данной теме операция.

Она получила название "Взятие разности", а не "Аналитическое вычитание", по следующим причинам.
1. Не вижу в этой операции аналитики, в отличии от "Аналитического объединения".
2. Операция "Взятие разности" имеется в теории множеств и полностью совпадает с тем, что сделано в SiteSputnik(е),

а именно, из МНОЖЕСТВА ссылок, найденных запросом А, она удаляет МНОЖЕСТВО ссылок, найденных запросом Б.
Другими словами, из запроса А, удаляются ссылки, найденные в запросе Б.
Под запросом здесь понимается любое поисковое задание, начиная от простого запроса и заканчивая очень сложным поисковым заданием, составленным при помощи ассемблера или пакетов запросов.

Качественно, "Взятие разности" похоже на ~~ в Яндеске и - в Гугле:
получив при помощи мощного поискового задания множество "не очень релевантных" ссылок, затем можно "выбивать" из него нерелевантные ссылки при помощи других запросов. Выше приводились примеры задач, в которых это может пригодиться.

Как прописать "Взятие разности".
1. Поставьте знак + в колонке "Вкл." для "Уменьшаемое".
2. Поставьте знак - в колонке "Вкл." для "Вычитаемого".
3. В подменю "Глобуса с линзой" выбираете: "Групповые операции поиска - Взятие разности".



Уменьшаемое - это то множество ссылок, из которого удаляем ссылки.
Вычитаемое - это те ссылки, которые удаляем из Уменьшаемого.
Разность - это оставшиеся ссылки.

Уменьшаемым и вычитаемым могут быть не только результаты поиска, но и само "Взятие разности" и "Аналитическое объединение".
"Взятие разности" к любому Уменьшаемому можно рекурсивно применить любое количество раз.

P.S.
Можно будет в будущем "наделать" много плюсиков и много минусиков (это уже не проблема), если "Взятие разности" будет достаточно хорошо востребовано.
Также можно будет создавать для контроля список "Удаленные ссылки" и так далее...

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Для: Alexei Mylnikov, ОГРОМНОЕ СПАСИБО!!! :yahoo: :yahoo: :yahoo:
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009
:hi: :hi: :hi: :good: :good: :good:
Спасибо, Алексей!

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
petryashov
Администратор

Откуда: Москва
Всего сообщений: 480
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Алексей, спасибо!
<<Назад  Вперед>>Страницы: 1 2 * 3 4
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Аналитическое вычитание
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS