Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » Поиск на тематических сайтах и форумах |
<<Назад Вперед>> | Страницы: 1 2 3 4 | Печать |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Теперь проверяем правильность поиска с помощью слова "программист" (найдено 513 результатов). Но учтите число страниц, которые вы указали в описании поисковика (их всего 4) SS честно обошел все страницы но нашел всего 4 ссылки Стало понятно, что без ручного варианта не обойтись. Посмотрев собранные 4 ссылки и исходный текст страницы, я понял причину ошибки SS - он хватал первую попавшуюся ссылку в тексте страницы после сигнатуры. А надо было брать вторую ссылку Поэтому я несколько изменил сигнатуру |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Вот что получилось. Забыл в предыдущем сообщении сказать, что в таких случаях надо в браузере смотреть правильную ссылку на чье-то резюме, открывать исходный текст страницы и выбирать в качестве признака что-то непосредственно перед этой ссылкой (и проверять в SS, что находится нужное количество ссылок - в данном случае 20) |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Дальнейшие шаги не привожу - скажу только, что для 4 страниц по умолчанию было найдено 60 ссылок Наконец, хоть что-то удалось подключить к SS |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Следующий сайт - www.jobster.ru/ Тут только вакансии, но давайте посмотрим и его. Задаю в качестве тестового слово "сайт" - получается 41 вакансия (5 страницы). ссылка на следующую страницу тоже присутствует Не дожидаюсь завершения загрузки и жму красный шарик в нижнем правом углу. Автоматически режим успеха не принес, поэтому в обоих случаях я выделял нужный текст (стрелки с номерами 1 и 2 соответственно) и щелкал по "По подсказке". Проверка с помощью "№" показала, что вроде бы все найдено правильно. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Проверка "на лету" с помощью слова "программист" (должно выдать 49 вакансий) показала, что SS нашел правильное число результатов. Дальнейшие шаги не описываю, так как они стандартные |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Следующий сервер - www.rjb.ru/ Выбираем в качестве тестового слова - "я". Здесь пришлось все делать вручную - результаты на скриншоте. Но на самом деле ничего сложного - нужно выбрать какую-нибудь ссылку на само резюме и скопировать ее в браузере. Потом в исходном тексте страницы поискать ее как строку (полностью или частично - тут я выбрал код резюме и искал только его), а потом взять тег, непосредственно перед тегом ссылки. Ошиблись (если находится не то число ссылок с помощью "№"), можно немного поиграться |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Следующий - superjob.ru Тестовое слово - "сайт". На странице с результатами присутствует ссылка "Следующая". Чтобы не рисковать, делаю все по подсказке - см. скриншот. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Последний сайт - www.job.ru/ Тестовое слово - "сайт" (нашлось 531 вакансия) Снова делаю все по подсказке. Обратите внимание на то, что выделяется непосредственно то, что обведено кругом, так как попытка выделить всю строку привела к ошибочному признаку. А в качестве признака следующей страницы используется символ >. Так как ссылки на другие страницы есть и вверху и внизу, то он обнаруживается два раза (все нормально). |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
В заключение хочу сформулировать общие правила, выработанные в ходе описанных выше экспериментов 1) при заполнении полей поисковой формы на тематическом сайте сразу указывайте нужные вам параметры (регион, диапазон дат для поиска и т.д.), так как URL, который потом будет использовать SS, будет сформирован на ее основе. 2) при возникновении проблем с тестовыми русскими словами пробуйте английские 3) всегда выделяйте признак следующей страницы либо по подсказке либо вручную 4) проверяйте правильность полученных признаков с помощью кнопки "№" 5) при задании параметров сценария (на третьей вкладке) выбирайте нужное число страниц (а не 4 по умолчанию) Вот, пожалуй и все пока |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Коллеги, а ни кто случаем не подключал этот ресурс _ttp://hh.ru/ ? ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
<<Назад Вперед>> | Страницы: 1 2 3 4 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » Поиск на тематических сайтах и форумах |
Самые активные 20 тем | |