Формирование, объединение и пересечение потоков информации

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Формирование, объединение и пересечение потоков информации
RSS

Формирование, объединение и пересечение потоков информации

Объединение и пересечение (сопоставление) результатов выполнения поисковых заданий из разных баз данных в СайтСпутнике

<<Назад  Вперед>>Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
В версии SiteSputnik 6.5.1 от 15.12.10 реализована возможность объединения и пересечения (сопоставления) ссылок из нескольких папок, вложенных в базу "Поиск в Интернете", функционально подобная простому "Аналитическому объединению", выполняемому в одной папке.


На картинке для наглядности приведены используемые ниже понятия, а именно:
• база данных «Поиск в Интернете», хранящая в папках потоки информации, - обведена синей линией,
• выбор операции «Аналитическое объединение в Задаче», применяемой для объединения и пересечения потоков, - обведена красной линией,
• пример Задачи, состоящей из 13 потоков (подзадач), – обведён зеленой линией.
• список «Объединение» и список «Новые» отмечены жёлтыми галочками.

1. Потоки информации в программе SiteSputnik.

• Поток информации - это результаты периодического выполнения одного или нескольких поисковых заданий (ПЗ) на заданную тему. Каждое ПЗ может формироваться из запросов, пакетов запросов, ассемблеров. Операция «Аналитическое объединение» (АО) может быть применена для объединения результатов нескольких ПЗ в единый список.
• Каждый поток и его полная история хранится в папке, вложенной в базу данных "Поиск в Интернете".
• Поток может быть разбит на дочернии потоки, каждый из которых размещается в своей вложенной папке.
• Единицей информации в потоке является один адрес ссылки. Он «окружён» кратким описанием контента ссылки, называемым сниппетом.
• Контент потока – это множество сниппетов.
• Каждый поток имеет две разновидности контента: список «Объединение» и список «Новые».
• Список «Объединение» - это вся информация, собранная в потоке.
• Список «Новые» - только та информация, которая еще не встречалась в потоке.
• АО внутри потока может быть выполнено как над списками «Объединение», так и над списками «Новые».
• В терминологии, принятой в программе SiteSputnik, эквивалентом потока является подзадача. Для работы с несколькими подзадачами рационально применять Планировщик Задач.

2. Формирование потоков информации.

• Структурирование потоков: создание папок, вложенных в базу данных "Поиск в Интернете". Глубина вложенных папок может быть любой.
• Подключение дополнительных средств поиска.
• Составление одного или нескольких ПЗ для каждого потока.
• Периодический запуск ПЗ.
• Применение при необходимости АО в рамках одного потока.


3. Объединение и пересечение потоков информации.

• Над любым количеством потоков (подзадач) можно провести операцию «Аналитическое объединение в Задаче».
• АО можно проводить как над списками «Объединение», так и над списками «Новые».
• Результат выполнения АО над потоками: объединение и пересечение потоков информации.
В программе SiteSputnik суть этой операции заключается в следующем.
• • Объединение. Создаются следующие списки:
• • • «Ссылки» - все ссылки из всех потоков (подзадач).
• • • «Папки» - все папки …
• • • «Ресурсы» - все ресурсы …
• • • «Карты» - иерархическая структура из ссылок, папок и ресурсов.
• • • «Домены» - все домены ...
• • • «Объединение» - то же, что и «Ссылки», но в «окружении» сниппетов.
• • Пересечение. Для каждого созданного списка, вместо повторного попадания в него из разных потоков (подзадач), соответственно,
• • • ссылок,
• • • папок,
• • • ресурсов,
• • • ресурсов и ссылок,
• • • доменов,
• • • сниппетов, -
для каждого элемента прописываются названия тех потоков (подзадач), в которых соответствующий элемент присутствует.

Подробнее здесь - sitesputnik.ru/Help/Stream.doc

Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Во - то что надо! Спасибо!!!
Пошел пробовать и генерировать вопросы....

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Коллеги, расскажу "зачем это надо".

В общем виде сравнение потоков информации нужно для выявления совпадений в событиях (это если совсем просто). Или говоря более научно - для выявления корреляций.

Пример 1
У вас есть интернет-активность двух объектов (два блога). И вы нутром чувствуете , что что то тут не чисто, а обосновать не можете :tuktuk: В таком случае заводите в СайтСпутнике папочку и в ней две подпапки на каждый объект, ставите на мониторинг отдельно один объект и отдельно второй. С какой то периодичностью осуществляете "мониторинг" этих объектов. После накопления достаточного для анализа материала проводите сопоставление двух этих потоков информации. И обнаруживаете , к своему удивлению, например, что одни и теже темы поднимаются ими одновременно, что выражают они своё мироощущение примерно в одно время.......... :tsss:
Пример упрощенный до "не могу" и решаемый (с такими исходными) разныими способами, в т.ч. и штатными средствами Яндекса и Гугля. Но как только Объекты становятся сложными (не один блог, да и не только блог) справиться с отслеживанием активности и ее сравнением сможет только СайтСпутник.

Пример2
Наблюдаете вы за неким конкурентом.... Заведите под него папочку в СайтСпутнике, а в ней подпапки "Конкурент вакансии", "Конкурент кандидаты", Конкурент новости" и "Новости рынка". и мониторьте эти направления с помощью СайтСпутника какое то время. после накопления материала достаточного для анализа, сравните с помощью СайтСпутника накопившиеся потоки информации. Вы обнаружите много интересного по совпадениям.... :laugh:

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Формирование, объединение и пересечение потоков информации
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS