SiteSputnik News

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   SiteSputnik News
RSS

SiteSputnik News

Версия "СайтСпутник Ньюс" и работа с ней

<<Назад  Вперед>>Страницы: 1 2 3 4
Печать
 
tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 784
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Совсем недавно я начал пользоваться версией "СайтСпутник Ньюс", и нахожусь просто в восторге от неё. Если охарактеризовать программу кратко - это продвинутая система мониторинга интернета.

Ежедневно я запускаю на выполнение пакеты сбора новостей из разных источников - это сайты СМИ, новостные сервисы от Яндекса и Гугла, сайты работы, доски объявлений и т.д. (в принципе, "источником" может быть любой сайт).
СайтСпутник просматривает все материалы на страничке, сравнивает с новостями, которые были собраны ранее, и выкачивает новые странички. Затем из выкачанных материалов довольно точно "вырезается" полезный контент (из странички удаляются реклама, всякие ссылки на другие материалы и прочее). Собранные новости преобразуются в одинаковый формат, и "монтируются" в единую ленту новостей.

В программе можно создать рубрики для новостей. Например:
Конкурент ХХХ
--Учредители
--Руководители
--Филиалы
--Вакансии
--Резюме сотрудников
----Топ-менеджмент
----Бухгалтерия
----Инженеры
--Продукция
--Клиенты

Для каждой рубрики создаются правила попадания в рубрику. Правил может быть много, все они прекрасно работают с морфологией русского языка. СайтСпутник анализирует контент новостей и распределяет их по рубрикам.

Со стороны всё выглядит так.
Вы пишете пакеты сбора новостей из разных источников. Например, это может быть такой простой пакет:

^^ Новости;
^^ Рубрики\Конкурент
Конкурент || News=2

Если новостей много, то оставляете программу работать на ночь. Утром приходите, наливаете чашку кофе, и просматриваете всё, что программа собрала для Вас и разложила по рубрикам.
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Да - хороший плагин для СайтСпутника, позволяющий делать значительно больше. Первое это то, что сама система рубрик это фактически дополнительный фильтр. Основной фильтр в соответствующем пакете (так сказать фильтр грубой очистки), а в каждой рубрике еще один фильтр (тонкий). В результате на выходе более релевантная информация. А второе - работа с полнотекстовым документом - пользователь получает весь заинтересовавший его текст, а не сниппет.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Эта тема уже здесь на форуме обсуждалась:
1) forum.razved.info/index.php?t=894&&st=0
2) forum.razved.info/index.php?t=1045&&st=0

3) Результаты третьего подхода к теме - в вышедшей сегодня версии SiteSputnik News 6.5.4.

Они следующие.

1! Достигнута устойчивость и стабильность работы программы для длительных процессов сбора информации (многочасовые задания).

2. Реализована точная фраза для Рубрик, которая заключается в 'одинарные кавычки', поскольку двойные кавычки задействованы в ссылках на концах слов или фраз.

3. Усовершенствована картинка для создания и редактирования Рубрик.

4. Продвинуто матобеспечение, отвечающее за чистоту отделения значащего контента ссылок от "мусора".

5. Список "Всё по рубрике". Все значащие контенты ссылок, удовлетворяющие Правилам попадания в рубрику, выдаются в виде отдельной новостной ленты.

6. Список "Правило-ссылки". Для каждого Правила (Рубрики) создается список ссылок, которые ему удовлетворяют.

7! Список "Ссылка-правила". Для каждой ссылки показывается список правил (из всех Рубрик), которым она удовлетворяет.
Другими словами, для каждой ссылки показывается список Рубрик, в которые она попала.
На мой взгляд - это очень полезная функция. При помощи неё можно обнаружить пересечение искомых объектов на одной ссылке.

8. Удаление дублей ссылок, имеющих одинаковый контент в рамках выполнения одного пакета. Оно очень актуально при использовании большого числа источников.

9. Прочие усовершенствования.


Добавлю к словам Игоря Нежданова, дальше всех продвинувшегося в применении SiteSputnik News, следующее (в большой степени это повторение слов Игоря).
SiteSputnik News может быть полезен, когда поток отслеживаемой информации настолько большой, что просмотреть его не хватает ни времени, ни сил, и, главное, нет возможности отсеить ненужные ссылки. Программа СайтСпутник Новости такую возможность предоставляет.

CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5730
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009
А к Invisible можно News прикрутить или это совсем разные программы получаются?

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

CI-KP написал:
[q]
А к Invisible можно News прикрутить или это совсем разные программы получаются?
[/q]

Да, можно скомпоновать любые варианта.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Как было упомянуто Выше, применение SiteSputnik News возможно не только для собственно новостей, но и для прочих однородных объектов.

В данном сообщении речь пойдет о мониторинге резюме с job-сайтов. Адреса нескольких источников мне любезно предоставила Елена Ларина.

Последовательность действий такова.

1. Подключил пять рекрутинговых источников:

e-prof.ru
finstaff.ru
it-rabota.ru
rabota.mail.ru
job.qip.ru

и поместил их в сценарий "Соискатели".


2. Составил пакет: поиск новых резюме соискателей на должность директора.
Вот этот пакеты:

^^Новости;
^^Рубрики\Резюме
директор || Соискатели=1

Первый оператор - признак новостного пакета,
второй адрес Рубрики (этот оператор необязательный),
третий - собственно метапоиск по рекрутинговым сайтам.

3. Отправил пакет на выполнение.

4. Получил результаты, которые размещены прикрепленном файле.

Суть результатов такова. СайтСпутник прошёл по пяти источникам, нашёл новые резюме соискателей по прописанной в пакете специальности, открыл страницы с резюме, выделил значимую информацию (само резюме очищенное от "мусора") и составил из найденных резюме новостную ленту (она как раз и приведена в прикрепленном файле).

Пакеты запускались вчера. Сегодня их выполнение принесло новые результаты - резюме, которых не было в предыдущих поисках.

Кроме этого, в специально подготовленные папки, вложенные в папку "Рубрики\Резюме", резюме соискателей были разложены по "полочкам":

Языки: Английский язык, итальянский, ...,
Фирмы: Газпром, СургутНефтегаз,...
Ученые степени: к.т.н, к.э.н, д.ф-м.н, ...,
Компьютерные навыки: Word, Excel, 1C, ...
и так далее.

Это всё, но напрашивается аналитическая обработка Рубрик, например, поиск кандидатов, удовлетворяющих заданному перечню Рубрик (сразу нескольким критериям).
Пока или уже! СайтСпутник Новости умеет это делать в рамках выполнения одного пакета. Если задать поиск поглубже, то с большей вероятностью можно найти подобных соискателей.



Прикрепленный файл (News_01.htm, 662260 байт, скачан: 2371 раз)
tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 784
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Для: Alexei Mylnikov:
Вопрос в тему: расскажите, пожалуйста, как подключали сайт it-rabota.ru? Там стоит php-скрипт. Ключевые слова не отображаются в адресной строке, СайтСпутник не принимает этот адрес.

Проблема с сайтом finstaff.ru - не находит ключевые слова "сайт", "это". Что сделать?
:wonder1:
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
Вопрос в тему: расскажите, пожалуйста, как подключали сайт it-rabota.ru? Там стоит php-скрипт. Ключевые слова не отображаются в адресной строке, СайтСпутник не принимает этот адрес.
[/q]

В данном случае, взял адрес внизу, там где переход к i-ой странице, первую страницу.
tungus1973 написал:
[q]
Проблема с сайтом finstaff.ru - не находит ключевые слова "сайт", "это". Что сделать?
[/q]

Берите слово "я".

Сценарий "Соискатели" - в прикрепленном файле.

Прикрепленный файл (Сценарий~С%E, 1076 байт, скачан: 235 раз)
tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 784
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Люди знающие, подскажите пожалуйста, как подключить к СайтСпутнику сайт
www.zarplata.ru/hr/result.aspx?pagesize=30&keywords=%D1%81%D0%B0%D0%B9%D1%82&period=0&sortfield=Rank&sortdirection=Descending&hasaccess=False&searchwithmoscow=True&onlymoscowinparams=False&freetext=False&showall=False&keywordssql=formsof%28INFLECTIONAL%2c%D1%81%D0%B0%D0%B9%D1%82%29&issearchbyid=False&employments=58 ,59,61,64,67&rubrics=&locations=0#o:SaveDate;
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
В файле два сценария - один для поиска людей, а другой для поиска вакансий. В обоих этот сайт есть.

ЗЫ
криво прицепился файл - это *.rar

Прикрепленный файл (Вакансия-Ка%, 2834 байт, скачан: 251 раз)
---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
<<Назад  Вперед>>Страницы: 1 2 3 4
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   SiteSputnik News
RSS

Последние RSS
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st
Историческое. Агентурная разведка
Open Source Intelligence (OSINT) Tools and Resources Handbook
Top tips on gathering information about companies by using free online sources
Новое на блоге HRразведка
Безопасность данных в MS Access
Слово как улика
20 Recon and Intel Gathering Tools used by InfoSec Professionals
What’s Changed?
10 альтернативных поисковиков
Ситуационный центр главы Республики Коми
Развёртывание ситуационных центров на базе технологии Avalanche
Как принимать сложные решения. Советы бывшего оперативника ЦРУ.
Открытая информация о "Новичке" из сети интернет.
Ген. директор "ОЗХО" Ахмет Узюмдж о "Новичке" и хим. атаке в Сирии
Онлайн-сервисы для Twitter
Коллекция для Twitter
Приложение Opera VPN закрывается

Самые активные 20 тем RSS
Новости блогов
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку