Аналитическое вычитание

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Аналитическое вычитание
RSS

Аналитическое вычитание

<<Назад  Вперед>>Страницы: 1 2 3 4
Печать
 
petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009

Искендер написал:
[q]
Думаю, что похожий пример смог бы привести уважаемый Дмитрий Петряшов. По какой-то товарной номенклатуре.
[/q]

Пара первых попавшихся примеров:

1. Если такая компания Legrand, а есть композитор Мишель Легран. Информации куча и по тому, и по тому. Мишель Легран мне не нужен, надо его "вычесть"

2. При мониторинге по слову GE (General Electric) находится масса грузинских сайтов, у которых домены заканчиваются на .ge. Соответственно, грузинские сайты тоже нужно отметать

И кстати, Алексей, можно ли сделать некой черный список тех сайтов, которые СайтСпутник должен обходить стороной? Например, выкинуть все или некоторые грузинские сайты или все или часть музыкальных сайтов, содержащих информацию о Мишеле Легране?
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

petryashov написал:
[q]
И кстати, Алексей, можно ли сделать некой черный список тех сайтов, которые СайтСпутник должен обходить стороной? Например, выкинуть все или некоторые грузинские сайты или все или часть музыкальных сайтов, содержащих информацию о Мишеле Легране?
[/q]
Своих фильтров над сниппетами в СайтСпутнике пока нет.

Замечание от 28.10.10.
В настоящее время уже есть. Смотрите на форуме здесь - forum.razved.info/index.php?t=1007

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 784
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Еще один частый пример - нередко встречается одно и то же название организаций во многих регионах. Чтобы найти нужную, приходится указывать исключения:

"Самолёт" ~/1 (ЗАО | ОАО) ~~/40 (Москва | Волгоград | Петербург) || Yandex=1000

Эту задачу тоже можно решать с помощью "АВ".

Если сказать общими словами, то "Аналитическое Вычитание" необходимо везде, где нужно исключить МАССУ похожих объектов.
АВ - такая же аналитическая операция, как и АО, как и анализ пересечений объектов.
tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 784
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Снова возвращаюсь к теме "Аналитического вычитания".

Один из коллег СПКР попросил помочь в сборе информации.
Уже сейчас из задания ясно, что придется выполнять поиск в несколько этапов. Значит, одни и те же ссылки будут попадаться несколько раз. Хотелось бы облегчить задачу.

Вопрос к Alexei Mylnikov: можно в сделать в СайтСпутнике универсальный механизм "АО" "АВ"? Например, так.

Выполняем несколько поисковых пакетов, которые в СайтСпутнике записываются под универсальными системными номерами (эти номера уже сейчас автоматически присваиваются каждому новому запросу):

1. ....
2. ....
3. ....
4. АО 3-(1+2)

Четвертая строка - аналитическая операция над ссылками, собранными в пунктах 1, 2, 3. В данном случае обозначает, что нужно выполнить "Аналитическое объединение" над ссылками, собранными по строкам 1 и 2. Затем вычесть полученное из ссылок, собранных по строке 3.
Запись в строке 4 могла бы выглядеть и так "АО 3-1-2". Это не принципиально. Просто хотелось показать, что теоретически к таким записям можно было бы применять скобки как в математике.

Возможно ли реализовать этот способ?
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
Возможно ли реализовать этот способ?
[/q]

Да, возможно.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
В версии SiteSputnik 6.4.6 от 28.10.10 появилась обсуждаемая в данной теме операция.

Она получила название "Взятие разности", а не "Аналитическое вычитание", по следующим причинам.
1. Не вижу в этой операции аналитики, в отличии от "Аналитического объединения".
2. Операция "Взятие разности" имеется в теории множеств и полностью совпадает с тем, что сделано в SiteSputnik(е),

а именно, из МНОЖЕСТВА ссылок, найденных запросом А, она удаляет МНОЖЕСТВО ссылок, найденных запросом Б.
Другими словами, из запроса А, удаляются ссылки, найденные в запросе Б.
Под запросом здесь понимается любое поисковое задание, начиная от простого запроса и заканчивая очень сложным поисковым заданием, составленным при помощи ассемблера или пакетов запросов.

Качественно, "Взятие разности" похоже на ~~ в Яндеске и - в Гугле:
получив при помощи мощного поискового задания множество "не очень релевантных" ссылок, затем можно "выбивать" из него нерелевантные ссылки при помощи других запросов. Выше приводились примеры задач, в которых это может пригодиться.

Как прописать "Взятие разности".
1. Поставьте знак + в колонке "Вкл." для "Уменьшаемое".
2. Поставьте знак - в колонке "Вкл." для "Вычитаемого".
3. В подменю "Глобуса с линзой" выбираете: "Групповые операции поиска - Взятие разности".



Уменьшаемое - это то множество ссылок, из которого удаляем ссылки.
Вычитаемое - это те ссылки, которые удаляем из Уменьшаемого.
Разность - это оставшиеся ссылки.

Уменьшаемым и вычитаемым могут быть не только результаты поиска, но и само "Взятие разности" и "Аналитическое объединение".
"Взятие разности" к любому Уменьшаемому можно рекурсивно применить любое количество раз.

P.S.
Можно будет в будущем "наделать" много плюсиков и много минусиков (это уже не проблема), если "Взятие разности" будет достаточно хорошо востребовано.
Также можно будет создавать для контроля список "Удаленные ссылки" и так далее...

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 784
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Для: Alexei Mylnikov, ОГРОМНОЕ СПАСИБО!!! :yahoo: :yahoo: :yahoo:
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5730
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009
:hi: :hi: :hi: :good: :good: :good:
Спасибо, Алексей!

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Алексей, спасибо!
Семёныч
Модератор форума
Городской Охотник
Всего сообщений: 977
Рейтинг пользователя: 10


Ссылка


Дата регистрации на форуме:
8 июня 2009
Похоже, мне "Взятие разности" нравиться больше, чем "Аналитическое объединение". Субъективное мнение. :respect:

---
Нет такой безвыходной ситуации,в которую невозможно вляпаться... (с)
<<Назад  Вперед>>Страницы: 1 2 3 4
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Аналитическое вычитание
RSS

Последние RSS
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st
Историческое. Агентурная разведка
Open Source Intelligence (OSINT) Tools and Resources Handbook
Top tips on gathering information about companies by using free online sources
Новое на блоге HRразведка
Безопасность данных в MS Access
Слово как улика
20 Recon and Intel Gathering Tools used by InfoSec Professionals
What’s Changed?
10 альтернативных поисковиков
Ситуационный центр главы Республики Коми
Развёртывание ситуационных центров на базе технологии Avalanche
Как принимать сложные решения. Советы бывшего оперативника ЦРУ.
Открытая информация о "Новичке" из сети интернет.
Ген. директор "ОЗХО" Ахмет Узюмдж о "Новичке" и хим. атаке в Сирии
Онлайн-сервисы для Twitter
Коллекция для Twitter
Приложение Opera VPN закрывается

Самые активные 20 тем RSS
Новости блогов
Не все VPN-сервисы одинаково полезны