SiteSputnik NewStreams - поиск новых источников информации

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   SiteSputnik NewStreams - поиск новых источников информации
RSS

SiteSputnik NewStreams - поиск новых источников информации

Поиск адресов RSS-потоков и адресов страниц (не RSS), несущих потоки новой информации на заданную тему

<<Назад  Вперед>>Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Замечание от 21.01.2015.
В течение года описанный в этом топике "Блок поиска новых источников" развился до нового варианта комплектации SiteSputnik NewStreams.
Подробнее в 5-ом топике этой темы - forum.razved.info/index.php?t=5287&p=55499#pp55499



    Новый вид поиска в программе СайтСпутник версии 8.3.3 от 01.10.2014 - это поиск источников информации на заданную тему, то есть, поиск страниц и ресурсов, на которых затем будет отслеживаться появление новой нужной информации (осуществляться мониторинг).

    В настоящей версии можно искать следующие два вида потоков информации:

      1. RSS-потоки. На картинке ниже по красной стрелке показано где включается поиск адресов RSS-потоков.
      Включение приводит к созданию двух списков: RSS-потоки все и RSS-потоки новые. В первом - все RSS-ки, найденные в текущем выполнении Проекта, во втором - новые RSS-потоки, которые ещё не были найдены ни разу при всех выполнениях Проекта.

      2. URL-потоки. Страницы, не являющиеся RSS-потоками, но несущие поток или потоки информации на заданные темы. Включение по зеленой стрелке. Сами темы отределяются в поле по синей стрелке, например: econom; business;.
      Включение приводит к созданию двух списков: URL-ссылки все и URL-потоки новые. В первом - все ссылки по заданным темам из текущего выполнения Проекта, во втором - новые, которые ещё не были найдены ни разу при всех выполнениях Проекта, и на которых обнаружены потоки.

      Можно создать ещё и третий список. По серой стрелке включается поиск новых адресов страниц, содержащих информацию на заданную тему. Список URL-ссылки новые содержит только такие ссылки.



    RSS-потоки новые и URL-потоки новые в настоящей реализации можно вручную просмотреть, оценить и, если это рационально, то некоторые из них добавить в источники проекта (вручную вписать в Проект), возможно даже, что не в данный, а в какой-то другой Ваш Проект.

    На этом пока всё. Работы в данном направлении продолжаются.

    P.S.
    1. Уже более трёх месяцев сам работаю с этими списками. Находил новые полезные источники для мониторинга не только в новых для себя темах, но и в хорошо изученных.
    2. В принципе, можно искать источники не только для работы в СайтСпутнике, но и для других целей.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 784
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Посмотрел новый функционал в работе. Списки источников пополняются.

Алексей Борисович, мне несколько непонятен механизм коллекционирования потоков. Новые источники собираются только для тех новостей, которые попали в рубрики? Если ссылка не попала ни в одну рубрику, то она, как источник, не засчитывается? Или я неправильно понял?
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
Посмотрел новый функционал в работе. Списки источников пополняются.
[/q]

Да, сначала новых источников побольше, потом поменьше, так как отсеиваются ранее найденные источники, то есть, всё сделано "по-сайтспутниковски". Практическое значение этой функции всё-таки в SiteSputnik News и выше.

tungus1973 написал:
[q]
мне несколько непонятен механизм коллекционирования потоков. Новые источники собираются только для тех новостей, которые попали в рубрики? Если ссылка не попала ни в одну рубрику, то она, как источник, не засчитывается? Или я неправильно понял?
[/q]

Нет, не так. Всё, а именно, все ссылки, которые открываются и скачиваются, и все адреса ссылок, которые находятся в контенте этих ссылок, - проверяется на предмет принадлежности к RSS-потокам и URL-потокам. Для этого по адресам ссылок тоже надо сделать подкачку, чтобы проанализировать контент (можно и далее углубиться, но это не практично).

Что такое RSS-поток знают все.

Кроме RSS-потоков, в интернете есть ещё масса страниц с краткими описаниями (или даже только заголовками) новостей или сообщений и ссылками на их полное содержание. Они в программе СайтСпутник называются URL-потоками.

Вот эти два вида потоков и ищутся, если это прописано в настройках, при выполнении Проекта и на этапе поиска (открытия прописанных в Проекте источников), и на на этапе скачивания найденных в источниках новых ссылок, и на этапе подкачки комментариев.

То есть, Вы поняли не так, но мыслите по-своему, мыслите вперед и мыслите правильно. Если то, о чем написано выше делать с контентами только тех ссылок, которые попали в Рубрики, то будем "добывать" меньше источников, но вероятность, что они будут востребованы в текущем Проекте больше. У меня другие задумки на перспективу, но Вашу буду иметь ввиду, хотя в плане её практичности имею некоторые сомнения.

В любом случае, поиск новых источников "попутно" при выполнении Проектов или целенаправленно на мой взгляд может быть полезен.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 784
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Спасибо, Алексей Борисович! :hi:
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
    SiteSputnik NewStreams


    Вышла Бета-версия нового варианта комплектации программы СайтСпутник - SiteSputnik NewsStreams. Обновитесь до 8.8.8.

    Назначение:

    • Организация и автоматизация поиска Источников информации: именно Источников, а не самой информации.
    • Мониторинг интернета на предмет появления в нём Источников, которые могут быть интересны.
    • Модуль +NewStreams можно назвать поставщиком Источников для SiteSputnik News или других программ.
    • Его также можно использовать для более глубокого мониторинга открытых источников интернета.

    Настройки находятся на отдельной вкладке и выглядят следующим образом:



    Подробнее о них и пошаговая инструкция применения SiteSputnik NewStreams на ссылке _http://sitesputnik.ru/Help/I/i_SiteSputnik_NewStreams.docx.


Ed
Модератор форума

Всего сообщений: 1825
Рейтинг пользователя: 28


Ссылка


Дата регистрации на форуме:
7 июня 2009
Обновился.
Даже только ради 08.08.08. :cool:
<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   SiteSputnik NewStreams - поиск новых источников информации
RSS

Последние RSS
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st
Историческое. Агентурная разведка
Open Source Intelligence (OSINT) Tools and Resources Handbook
Top tips on gathering information about companies by using free online sources
Новое на блоге HRразведка
Безопасность данных в MS Access
Слово как улика
20 Recon and Intel Gathering Tools used by InfoSec Professionals
What’s Changed?
10 альтернативных поисковиков
Ситуационный центр главы Республики Коми
Развёртывание ситуационных центров на базе технологии Avalanche
Как принимать сложные решения. Советы бывшего оперативника ЦРУ.
Открытая информация о "Новичке" из сети интернет.
Ген. директор "ОЗХО" Ахмет Узюмдж о "Новичке" и хим. атаке в Сирии
Онлайн-сервисы для Twitter
Коллекция для Twitter
Приложение Opera VPN закрывается

Самые активные 20 тем RSS
Новости блогов
Не все VPN-сервисы одинаково полезны