Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » Поиск на тематических сайтах и форумах |
<<Назад Вперед>> | Страницы: 1 * 2 3 4 | Печать |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Посмотрел я на инструкцию по добавлению новых поисковиков на ab.vlink.ru/FFF/Help/SSInstr/SSMaster.htm и решил попробовать сам |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Начнем с onlinejobs.ru 1. Пытаемся делать, как написано в инструкции Мыльникова - идем на форму, вбиваем слово "сайт". 2. Копируем URL из браузера в СайтСпутник (я считаю, что вы уже открыли экранную форму для добавления нового поисковика - "Интернет/Мастер подключения новых поисковиков"), нажимаем на "Открыть" 3. В СайтСпутник открывается в правой части окна страница с резюме соискателей, найденными по ключевому слову "cайт" 4. Переходим на вторую закладку в форме подключения нового поисковика и нажимаем "Автоматически" в разделе "Распознать признак начала пункта" (п.1 на скриншоте), видим, что что-то появилось в окне, проверяем правильность - нажимаем "№" (п.2 на скриншоте). Видим, что обнаружено 10 мест с такими ссылками, что соответствует реальному количеству ссылок на странице (резюме выдаются по 10 - две страницы, так как обнаружено 19 резюме). Потом аналогично нажимаем "Автоматически" в другом разделе (п.3) и проверяем, что ссылка найдена правильно - нажимаем "№" (п.4) |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
5. Переходим на третью закладку и проверяем работоспособность сделанных на предыдущем шаге настроек - делаем тестовый поисковый запрос (я выбрал другое слово "программист"). Сначала проверяем, сколько на самом деле должно быть результатов - 61 (см. скриншот) |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
6. Потом увеличиваем глубину поиска до 100 страниц. Понятно, что в таких системах результатов могут быть десятки и 40 результатов (4 страницы по 10 результатов) будет маловато :smile3: 7. Запускаем тестирование поиска по тому же слову "программист" в SS и видим, что число найденных ссылок не совпадает. Причина становится понятна после анализа сообщения в правом нижнем углу - неправильно определен признак следующей страницы. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
8. Значит надо вернуться к первой закладке, снова нажать на кнопку "Открыть", дождаться загрузки страницы с результатами поиска (я не дождался и остановил вручную, нажав на красный шарик в нижнем правом углу) и перейти на вторую закладку. Что-то кнопка "Автоматически " не работает. Пробуем делать по подсказке. Для этого: 1) выделить справа на странице мышкой одно резюме из списка 2) нажать кнопку "По подсказке" 3) увидеть, что в левом поле появились теги 4) проверить, что по такому признаку нашлось столько ссылок, сколько должно быть на странице (в данном случае - 10) |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
А вот с признаком следующей страницы - проблемы, так как ни автоматическое обнаружение ни обнаружение с помощью подсказки не позволяет найти правильный признак. С помощью этих способов находится только одна ссылка (как правило, на вторую или последнюю страницу результатов), но нам-то нужно получить ссылки и на другие страницы результатов Для случая со словом "программист" их будет семь... Попробуем ручной поиск - нажимаем кнопку "Вручную". в Notepad открывается исходный текст веб-страницы. С помощью поиска строки "Страница:" (она визуально на той же строке страницы, что и ссылки на другие страницы результатов) находим теги со ссылками. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Пробуем другой вариант |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Но попытка проверить поиск приводит к его зацикливанию (снова и снова читаются одни и та же страницы результатов) Увы, но и этот сайт нельзя подключить к SS, так как он рассчитан на то, что в списке ссылок присутствует в той или иной форме ссылка на следующую страницу результатов. А здесь есть только ссылки на первую и последнюю страницу и ссылки на конкретные страницы результатов |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Следующий сайт - www.rabota.ru Вроде здесь есть ссылка на следующую страницу с результатами - посмотрим... С учетом печального опыта используем вариант по подсказке и там и там (стрелками показано, что я выделял в качестве образца). Если с первого нажатия на кнопку нужный текст не появляется, жмите на нее еще раз (словом, пока не появится) и, конечно, проверьте корректность признаков. посмотрев найденное число ссылок с ними |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Теперь проверяем правильность поиска с помощью слова "программист" (найдено 513 результатов). Но учтите число страниц, которые вы указали в описании поисковика (их всего 4) SS честно обошел все страницы но нашел всего 4 ссылки Стало понятно, что без ручного варианта не обойтись. Посмотрев собранные 4 ссылки и исходный текст страницы, я понял причину ошибки SS - он хватал первую попавшуюся ссылку в тексте страницы после сигнатуры. А надо было брать вторую ссылку Поэтому я несколько изменил сигнатуру |
<<Назад Вперед>> | Страницы: 1 * 2 3 4 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » Поиск на тематических сайтах и форумах |
Самые активные 20 тем | |