SiteSputnik NewStreams - поиск новых источников информации

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   SiteSputnik NewStreams - поиск новых источников информации
RSS

SiteSputnik NewStreams - поиск новых источников информации

Поиск адресов RSS-потоков и адресов страниц (не RSS), несущих потоки новой информации на заданную тему

<<Назад  Вперед>>Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 835
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Замечание от 21.01.2015.
В течение года описанный в этом топике "Блок поиска новых источников" развился до нового варианта комплектации SiteSputnik NewStreams.
Подробнее в 5-ом топике этой темы - forum.razved.info/index.php?t=5287&p=55499#pp55499



    Новый вид поиска в программе СайтСпутник версии 8.3.3 от 01.10.2014 - это поиск источников информации на заданную тему, то есть, поиск страниц и ресурсов, на которых затем будет отслеживаться появление новой нужной информации (осуществляться мониторинг).

    В настоящей версии можно искать следующие два вида потоков информации:

      1. RSS-потоки. На картинке ниже по красной стрелке показано где включается поиск адресов RSS-потоков.
      Включение приводит к созданию двух списков: RSS-потоки все и RSS-потоки новые. В первом - все RSS-ки, найденные в текущем выполнении Проекта, во втором - новые RSS-потоки, которые ещё не были найдены ни разу при всех выполнениях Проекта.

      2. URL-потоки. Страницы, не являющиеся RSS-потоками, но несущие поток или потоки информации на заданные темы. Включение по зеленой стрелке. Сами темы отределяются в поле по синей стрелке, например: econom; business;.
      Включение приводит к созданию двух списков: URL-ссылки все и URL-потоки новые. В первом - все ссылки по заданным темам из текущего выполнения Проекта, во втором - новые, которые ещё не были найдены ни разу при всех выполнениях Проекта, и на которых обнаружены потоки.

      Можно создать ещё и третий список. По серой стрелке включается поиск новых адресов страниц, содержащих информацию на заданную тему. Список URL-ссылки новые содержит только такие ссылки.



    RSS-потоки новые и URL-потоки новые в настоящей реализации можно вручную просмотреть, оценить и, если это рационально, то некоторые из них добавить в источники проекта (вручную вписать в Проект), возможно даже, что не в данный, а в какой-то другой Ваш Проект.

    На этом пока всё. Работы в данном направлении продолжаются.

    P.S.
    1. Уже более трёх месяцев сам работаю с этими списками. Находил новые полезные источники для мониторинга не только в новых для себя темах, но и в хорошо изученных.
    2. В принципе, можно искать источники не только для работы в СайтСпутнике, но и для других целей.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 794
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Посмотрел новый функционал в работе. Списки источников пополняются.

Алексей Борисович, мне несколько непонятен механизм коллекционирования потоков. Новые источники собираются только для тех новостей, которые попали в рубрики? Если ссылка не попала ни в одну рубрику, то она, как источник, не засчитывается? Или я неправильно понял?
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 835
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
Посмотрел новый функционал в работе. Списки источников пополняются.
[/q]

Да, сначала новых источников побольше, потом поменьше, так как отсеиваются ранее найденные источники, то есть, всё сделано "по-сайтспутниковски". Практическое значение этой функции всё-таки в SiteSputnik News и выше.

tungus1973 написал:
[q]
мне несколько непонятен механизм коллекционирования потоков. Новые источники собираются только для тех новостей, которые попали в рубрики? Если ссылка не попала ни в одну рубрику, то она, как источник, не засчитывается? Или я неправильно понял?
[/q]

Нет, не так. Всё, а именно, все ссылки, которые открываются и скачиваются, и все адреса ссылок, которые находятся в контенте этих ссылок, - проверяется на предмет принадлежности к RSS-потокам и URL-потокам. Для этого по адресам ссылок тоже надо сделать подкачку, чтобы проанализировать контент (можно и далее углубиться, но это не практично).

Что такое RSS-поток знают все.

Кроме RSS-потоков, в интернете есть ещё масса страниц с краткими описаниями (или даже только заголовками) новостей или сообщений и ссылками на их полное содержание. Они в программе СайтСпутник называются URL-потоками.

Вот эти два вида потоков и ищутся, если это прописано в настройках, при выполнении Проекта и на этапе поиска (открытия прописанных в Проекте источников), и на на этапе скачивания найденных в источниках новых ссылок, и на этапе подкачки комментариев.

То есть, Вы поняли не так, но мыслите по-своему, мыслите вперед и мыслите правильно. Если то, о чем написано выше делать с контентами только тех ссылок, которые попали в Рубрики, то будем "добывать" меньше источников, но вероятность, что они будут востребованы в текущем Проекте больше. У меня другие задумки на перспективу, но Вашу буду иметь ввиду, хотя в плане её практичности имею некоторые сомнения.

В любом случае, поиск новых источников "попутно" при выполнении Проектов или целенаправленно на мой взгляд может быть полезен.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 794
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Спасибо, Алексей Борисович! :hi:
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 835
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
    SiteSputnik NewStreams


    Вышла Бета-версия нового варианта комплектации программы СайтСпутник - SiteSputnik NewsStreams. Обновитесь до 8.8.8.

    Назначение:

    • Организация и автоматизация поиска Источников информации: именно Источников, а не самой информации.
    • Мониторинг интернета на предмет появления в нём Источников, которые могут быть интересны.
    • Модуль +NewStreams можно назвать поставщиком Источников для SiteSputnik News или других программ.
    • Его также можно использовать для более глубокого мониторинга открытых источников интернета.

    Настройки находятся на отдельной вкладке и выглядят следующим образом:



    Подробнее о них и пошаговая инструкция применения SiteSputnik NewStreams на ссылке _http://sitesputnik.ru/Help/I/i_SiteSputnik_NewStreams.docx.


Ed
Модератор форума

Всего сообщений: 1825
Рейтинг пользователя: 28


Ссылка


Дата регистрации на форуме:
7 июня 2009
Обновился.
Даже только ради 08.08.08. :cool:
<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   SiteSputnik NewStreams - поиск новых источников информации
RSS

Последние RSS
шантаж, угрозы по Интернету
Практически весь интернет становится русскоязычным
SiteSputnik. Об одном подходе к мониторингу Телеграм
Безопасность при работе на ПК
Книги о критическом мышлении
Наказывать за вмешательство в частную жизнь, Верховный суд
CI Academic Materials
CiMi.CON Evolution USA
Поиск в КЭШ поисковиков по запросу и пакету запросов
СайтСпутник: Многоязычность, Юникод, MS ACCESS
Новый курс OSINT от АИС
Год тюрьмы за отказ удалять
Книга "Строим доверие по методикам спецслужб"
аналог "Консультанта" о зарубежном законодательстве
Открытые данные ФНС
Получаем информацию по VIN
Competitive-Market Intelligence Conference, Berlin 2018
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st

Самые активные 20 тем RSS