Версия для печати

-   Форум Сообщества Практиков Конкурентной разведки (СПКР) http://forum.razved.info/
--  Приемы работы с программой СайтСпутник (SiteSputnik) http://forum.razved.info//index.php?f=38
--- Опыт организации системы мониторинга (штрихи) http://forum.razved.info//index.php?t=5654




-- petryashov написал 17 сентября 2015 13:11
Можно выделить две концепции использования поиска: знаем что искать и не знаем что искать.

Первый вариант, знаем что искать, подходит для мониторинга упоминаний определённого перечня объектовые: компаний, брендов, персон, географических наименований и так далее.

Как делается: вбиваются запросы с прямым указанием интересующих объектов в поисковые системы и в системы внутреннего поиска сайтов.

Достоинства: снижается риск того, что важная информация будет пропущена, в том числе и за счет того, что она не была проиндексирована поисковыми системами.

Недостатки:
1. многочисленные обращения с разными запросами к одному и тому же источнику могут вызвать бан.;

2. По мере появления новых ключевых слов для мониторинга нужно дорабатывать поисковые запросы, что требует времени на настройку.

Второй вариант, не знаем, что искать, подходит для поиска информации по примерно очерченной тематике.

Как делается: собираем новости из разных источников, затем сортируем и рубрицируем их.
Достоинства:
1. обращение к источнику информации идет 1 раз за сеанс, что снижает риск бана;
2. по мере конкретизации информационных интересов можно создавать новые рубрики. Благодаря возсможности перерубрикации можно раскладывать по новым рубрикам ранее собранные новости.
Недостатки: есть риск пропустить часть упоминаний за счет неиспользования внутреннего поиска по сайтам.

Я использую оба варианта поиска и мониторинга информации. Расскажу более подробно про второй вариант поиска.


1. Источники разбиваем на классы, и каждый прописываем в рамках своего проекта. Критериями разбиения на классы могут служить требуемая частота обращения к источникам, тип содержимого, минимальное число пересечений с другими классами. В настоящий момент у меня три проекта: новости, тендеры и социальные сети.

2. Подключаем новые источники. Минимум раз в неделю целесообразно изучать статистику использования источников и менять в случае необходимости настройки поиска

3. Создаём структуру рубрик, не забывая создавать в каждой группе рубрик рубрику "ящик остальные", куда будут попадать новости, не попавшие и в одну из рубрик внутри группы.

4. Сразу прописать все рубрики удаётся редко, да и круг интересов может время от времени изменяться, расширяться и дополняться. Поэтому целесообразно после каждого сеанса работы программы делать две вещи: проверять содержимое рубрик "ящик остальные" с целью выявления пропущенных при создании структуры рубрик ключевых слов, а затем запускать поиск объектов. В случае выявления интересующих объектов создавать новые рубрики.

5. В отличие от источников, которые могут появляться и исчезать, менять структуру представления информации, рубрики намного более стабильны: словоформы слова "нефть", к примеру, ограничены, и достаточно их указать в условиях попадания в рубрики, чтобы вся информация попадала в рубрику "нефть" спустя многое годы после создания данной рубрики. Этот факт позволяет предложить разработчику программы Алексею Мыльникову, а также пользователям СайтСпутника создавать специальные тематические библиотеки рубрик, которые можно было бы подключать другим пользователям программы.



-- Алексей Мыльников написал 8 октября 2015 8:22

petryashov написал:
[q]
Как делается: собираем новости из разных источников, затем сортируем и рубрицируем их.
Достоинства:
1. обращение к источнику информации идет 1 раз за сеанс, что снижает риск бана;
2. по мере конкретизации информационных интересов можно создавать новые рубрики. Благодаря возсможности перерубрикации можно раскладывать по новым рубрикам ранее собранные новости.
Недостатки: есть риск пропустить часть упоминаний за счет неиспользования внутреннего поиска по сайтам.
[/q]

В СайтСпутнике внутренние поиски Вы можете использовать и при применении второго варианта.

Да и запросы к поисковикам тоже, но запросы, возможно, что не всегда рационально отправлять на Рубрикацию, достаточно просматривать сниппеты.


petryashov написал:
[q]
... предложить разработчику программы Алексею Мыльникову, а также пользователям СайтСпутника создавать специальные тематические библиотеки рубрик, которые можно было бы подключать другим пользователям программы.
[/q]
Здесь наблюдаю такую тенденцию: Пользователь как только доведет Систему до ума, как сразу "затаился". Вы же не выложите свои наработки даже по тендерам и по новостям, не говоря уже о соцсетях.



-- savara написал 7 марта 2017 18:49
Доброго времени суток)
Я только начинаю разбираться с программой, поэтому извините, если вопросы будут простые, не толковые, или не по теме.)

Так вот первая проблема, которая возникла. Мне нужно, чтобы результат поиска по пакету запросов, выдавал именно новые интернет страницы. То есть те, которые появились например за последнюю неделю. Нечто подобное, как есть в расширенном поиске гугла.
В инстурциях пока не нашла, поетому я пробовала добавить оператор поиска daterange, к запросам, но что-то не получилось. Также пробовала задать запрос в гугле, установить нужный период времени, инструментами поиска, а затем скопировала юрл, и сделала поиск по нему в СС, но так тоже не работает.

Возможно кто-то такое делал, а возможно я хочу что-то не то, я только учусь) Подскажите пожалуйста. :smile:


-- vbl написал 7 марта 2017 19:25

savara написал:
[q]
[/q]


Самый простой вариант - воспользоваться уже настроенным источником, который есть в СайтСпутнике.

Нажимаете "Золотой ключик" потом "Пакет". Потом в столбце "Источник" щелкаете левой клавишей мышки, после чего появляется меню, в котором выбираете:

Сценарии — Yandex ----- Дата

Источник добавляется в пакет. Выставляете глубину страниц и в столбце "Запрос......", формируете необходимый запрос и запускаете проект.

То же самое с Гуглом.

Есть второй вариант.

Добавление поисковика (Яндекс, Гугл) через "Мастера добавления новых источников".

Подробнее про мастер можно прочитать здесь - sitesputnik.ru/Help/SSMaster.htm


-- Алексей Мыльников написал 7 марта 2017 19:51



-- savara написал 8 марта 2017 10:53
Большое спасибо )))


-- savara написал 8 марта 2017 11:09
Все получилось, так просто оказалось) Буду аккуратнее читать инструкции)) Еще раз спасибо!)


Этот форум работает на скрипте Intellect Board
© 2004-2007, 4X_Pro, Объединенный Открытый Проект