Поиск на тематических сайтах и форумах

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Поиск на тематических сайтах и форумах
RSS

Поиск на тематических сайтах и форумах

<<Назад  Вперед>>Страницы: 1 * 2 3 4
Печать
 
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
6. Потом увеличиваем глубину поиска до 100 страниц. Понятно, что в таких системах результатов могут быть десятки и 40 результатов (4 страницы по 10 результатов) будет маловато :smile3:

7. Запускаем тестирование поиска по тому же слову "программист" в SS и видим, что число найденных ссылок не совпадает.
Причина становится понятна после анализа сообщения в правом нижнем углу - неправильно определен признак следующей страницы.

Прикрепленный файл (c11.jpg, 245682 байт, скачан: 834 раза)
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
8. Значит надо вернуться к первой закладке, снова нажать на кнопку "Открыть", дождаться загрузки страницы с результатами поиска (я не дождался и остановил вручную, нажав на красный шарик в нижнем правом углу) и перейти на вторую закладку.
Что-то кнопка "Автоматически " не работает. Пробуем делать по подсказке. Для этого:
1) выделить справа на странице мышкой одно резюме из списка
2) нажать кнопку "По подсказке"
3) увидеть, что в левом поле появились теги
4) проверить, что по такому признаку нашлось столько ссылок, сколько должно быть на странице (в данном случае - 10)

Прикрепленный файл (c12.jpg, 247555 байт, скачан: 833 раза)
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
А вот с признаком следующей страницы - проблемы, так как ни автоматическое обнаружение ни обнаружение с помощью подсказки не позволяет найти правильный признак. С помощью этих способов находится только одна ссылка (как правило, на вторую или последнюю страницу результатов), но нам-то нужно получить ссылки и на другие страницы результатов
Для случая со словом "программист" их будет семь...

Попробуем ручной поиск - нажимаем кнопку "Вручную". в Notepad открывается исходный текст веб-страницы. С помощью поиска строки "Страница:" (она визуально на той же строке страницы, что и ссылки на другие страницы результатов) находим теги со ссылками.

Прикрепленный файл (c13.jpg, 394976 байт, скачан: 833 раза)
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Пробуем другой вариант


Прикрепленный файл (c14.jpg, 220949 байт, скачан: 829 раз)
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Но попытка проверить поиск приводит к его зацикливанию (снова и снова читаются одни и та же страницы результатов)

Увы, но и этот сайт нельзя подключить к SS, так как он рассчитан на то, что в списке ссылок присутствует в той или иной форме ссылка на следующую страницу результатов. А здесь есть только ссылки на первую и последнюю страницу и ссылки на конкретные страницы результатов :goodbuy:
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Следующий сайт - www.rabota.ru

Вроде здесь есть ссылка на следующую страницу с результатами - посмотрим... :blush:

С учетом печального опыта используем вариант по подсказке и там и там (стрелками показано, что я выделял в качестве образца).

Если с первого нажатия на кнопку нужный текст не появляется, жмите на нее еще раз (словом, пока не появится) :yes:

и, конечно, проверьте корректность признаков. посмотрев найденное число ссылок с ними :binocular:

Прикрепленный файл (c15.jpg, 249639 байт, скачан: 866 раз)
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Теперь проверяем правильность поиска с помощью слова "программист" (найдено 513 результатов). Но учтите число страниц, которые вы указали в описании поисковика (их всего 4)
SS честно обошел все страницы но нашел всего 4 ссылки :wonder1:

Стало понятно, что без ручного варианта не обойтись. Посмотрев собранные 4 ссылки и исходный текст страницы, я понял причину ошибки SS - он хватал первую попавшуюся ссылку в тексте страницы после сигнатуры. А надо было брать вторую ссылку :wink:
Поэтому я несколько изменил сигнатуру

Прикрепленный файл (c16.jpg, 433146 байт, скачан: 691 раз)
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Вот что получилось. Забыл в предыдущем сообщении сказать, что в таких случаях надо в браузере смотреть правильную ссылку на чье-то резюме, открывать исходный текст страницы и выбирать в качестве признака что-то непосредственно перед этой ссылкой (и проверять в SS, что находится нужное количество ссылок - в данном случае 20)

Прикрепленный файл (c17.jpg, 237253 байт, скачан: 789 раз)
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Дальнейшие шаги не привожу - скажу только, что для 4 страниц по умолчанию было найдено 60 ссылок :good:

Наконец, хоть что-то удалось подключить к SS :beer2:
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Следующий сайт - www.jobster.ru/ Тут только вакансии, но давайте посмотрим и его.
Задаю в качестве тестового слово "сайт" - получается 41 вакансия (5 страницы). ссылка на следующую страницу тоже присутствует :yahoo:

Не дожидаюсь завершения загрузки и жму красный шарик в нижнем правом углу.
Автоматически режим успеха не принес, поэтому в обоих случаях я выделял нужный текст (стрелки с номерами 1 и 2 соответственно) и щелкал по "По подсказке". Проверка с помощью "№" показала, что вроде бы все найдено правильно.

Прикрепленный файл (c18.jpg, 240261 байт, скачан: 821 раз)
<<Назад  Вперед>>Страницы: 1 * 2 3 4
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Поиск на тематических сайтах и форумах
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS