Аналитическое вычитание

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Аналитическое вычитание
RSS

Аналитическое вычитание

<<Назад  Вперед>>Страницы: 1 2 3 4
Печать
 
tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
На семинаре, посвященном СайтСпутнику, мы с коллегами обсуждали применение операции противоположной "Аналитическому объединению", которую мы условно назвали "Аналитическое вычитание". Кратко разъясню суть операции.
Предположим, у Вас есть 2 проекта.

Проект 1
Проект 2


Выполняя "Аналитическое объединение" вы соединяете все найденные списки из двух проектов в один.

Проект 1 + Проект 2 = АО

Но вот, допустим, Вам потребовалось не объединить списки, а вычесть из одного списка ссылок ссылки из другого списка. То есть, нужно выполнить такую операцию:

Проект 2 - Проект 1 = АВ

Когда может пригодиться эта функция? Ну, например, собираете Вы информацию про "Алексея Ивановича Федорова". И, чтобы собрать данные более полно, Вы проверяете, а не упоминается ли искомый человек в сочетании "Алексей Фёдоров"?

И вы делаете отдельный пакет и собираете все ссылки на странички, где упоминается гр-н. Фёдоров. Предположим, что таких ссылок собралось более 1000 шт. Но! Как выяснилось, у нашего Фёдорова очень много однофамильцев, в том числе и очень известных личностей. И вот Вы просматриваете собранные сниппеты и видите, что очень часто упоминаются "Алексей Петрович Фёдоров" (примерно 500 ссылок) и "Алексей Васильевич Фёдоров" (тоже примерно 300 из всех ссылок). Вы знаете, что где-то среди оставшихся 200 ссылок есть и Ваш "Алексей Иванович Фёдоров", но просматривать из-за него все 1000 ссылок Вам уже как-то не хочется.
Что делать?

Логично было бы запустить отдельные пакеты для поиска "Васильевича" и "Петровича" Фёдоровых, а потом уже вычесть результаты из общего пакета. А оставшиеся 200 (а может уже и меньше) ссылок просмотреть, и даже выкачать на свой компьютер. Вот здесь нам и пригодилась бы функция "Аналитическое вычитание"!

На страничке СайтСпутника написано, что в программе уже реализована аналогичная функция как "Взятие разности"("метавычитание").

Уважаемый Алексей Борисович, можно ли в этой ветке форума рассказать о том, как выполнить "Аналитическое вычитание" методами, уже реализованными в программе? И если такая операция на поверку оказывается сложновыполнимой, нельзя ли предусмотреть в СайтСпутнике специальную функцию для такой операции?
Искендер
Администратор

Всего сообщений: 5925
Рейтинг пользователя: 43


Ссылка


Дата регистрации на форуме:
7 июня 2009
Да-да-да! Дайте две! Совсем, вот, недавно - мало того, что объект персонаж медийный, да еще и с распространенными ФИО. Почти 4 тысячи ссылок! Думал - глаза выпадут! Алексей! Не дайте зрения лишиться!

---
I`m not a Spy! I can do much better!
Информационные войны "под ключ"
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009
Насколько я понимаю, эта-то опция вообще не требует особо время тратить на ее создание. Ежели оно что-то с чем-то складывает, то и вычесть может это же самое без проблем.
Или я неправ?

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Искендер написал:
[q]
ало того, что объект персонаж медийный, да еще и с распространенными ФИО. Почти 4 тысячи ссылок! Думал - глаза выпадут! Алексей! Не дайте зрения лишиться!
[/q]

А нефиг мониторить Сергея Безрукова. Мониторь Эммануила Папандопуло - и тебе не понадобятся никакие приблуды в СайтСпутник :smile:

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
petryashov
Администратор

Откуда: Москва
Всего сообщений: 480
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Очень нужная функция. БЫло бы замечательно, если бы она была реализована
Искендер
Администратор

Всего сообщений: 5925
Рейтинг пользователя: 43


Ссылка


Дата регистрации на форуме:
7 июня 2009

CI-KP написал:
[q]

Искендер написал:
[q]
ало того, что объект персонаж медийный, да еще и с распространенными ФИО. Почти 4 тысячи ссылок! Думал - глаза выпадут! Алексей! Не дайте зрения лишиться!
[/q]
А нефиг мониторить Сергея Безрукова. Мониторь Эммануила Папандопуло - и тебе не понадобятся никакие приблуды в СайтСпутник
[/q]

Что делать - не фанат я Папандопуло... :smile:

---
I`m not a Spy! I can do much better!
Информационные войны "под ключ"
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
На страничке СайтСпутника написано, что в программе уже реализована аналогичная функция как "Взятие разности"("метавычитание").
[/q]

Да, "Взятие разности", упомянутое на сайте делает именно то, что написал tungus1973.

А = "Проект 1" - "Проект 2"
и
Б = "Проект 2" - "Проект 1",

не равны друг другу, более того, не имеют не одной общей ссылки.

Но А и Б не выделены в отдельные списки. Их можно руками выделить следующим образом. Отметить, превратив маленькие серые шарики в зеленые, затем нажать большой зеленый шарик и получить список "Отмеченные". Отмечать для А надо те ссылки, которые вошли только и только в "Проект 2", для Б только и только в "Проект 1". Ссылки идут подряд.

Делать я этого не стал - итак "получаю" за "сложные места", а здесь, если берется разность только двух проектов, еще два непонятных списка. Если проектов несколько, то там вообще можно окончательно запутать пользователя.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009

Alexei Mylnikov написал:
[q]
Их можно руками выделить следующим образом.
[/q]
Руками - это долго. Взять, к примеру, задачу Искендера - 4000 ссылок! Вручную особо не наотмечаешься...

А, в принципе, насколько сложно автоматизировать эту функцию?

Как заметил ув. CI-KP
[q]
Ежели оно что-то с чем-то складывает, то и вычесть может это же самое без проблем.
[/q]
Наверняка он прав.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
А, в принципе, насколько сложно автоматизировать эту функцию?

Как заметил ув. CI-KP
[q]
Ежели оно что-то с чем-то складывает, то и вычесть может это же самое без проблем.
[/q]
Наверняка он прав.
[/q]

Уважаемый СI-KP прав. Сделать несложно. Сомневаюсь, что нужно. Зачем лишние списки или лишнии опции. По-моему, это надумано.

CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Alexei Mylnikov написал:
[q]
По-моему, это надумано.
[/q]

Не. Ну, если уже двое ПРАКТИКОВ говорят, что надо, то наверное таки надо.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
<<Назад  Вперед>>Страницы: 1 2 3 4
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Аналитическое вычитание
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS