Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » Веб-Карта сайта, ресурса, папки, искомого объекта. |
<<Назад Вперед>> | Печать |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 16 июля 2009 23:36 Сообщение отредактировано: 16 июля 2009 23:39
Карта сайта, ресурса или папки (далее просто карта сайта). В интернете собираются ссылки, принадлежащие сайту. Иерархическая структура этих ссылок есть веб-карта сайта. Ссылки собираются при помощи нескольких поисковиков, а именно: Google, Яндекс, Yahoo, MSN (Live Search, Bing), Altavista. Пользователю достаточно набрать имя сайта, остальное сделает СайтСпутник. Есть два варианта построения карты сайта: стандартная и углубленная. Стандартный вариант. Выполняется один пакет из пяти запросов: по одному на каждый поисковик. Для Гугля, например, применяется запрос "site:ab.vlink.ru". После двоеточия имя cайта, для которого строится карта. Стандартного варианта, по моим оценкам, вполне достаточно для сайтов, содержащих до 200-300 ссылок. Углубленный вариант. Выполняется до 2100 пакетов, каждый из которых содержит по пять запросов: по одному на каждый поисковик. Первым пакетом идет пакет, рассмотренный при описании Стандартного варианта. Для каждого найденного ресурса или папки, принадлежащего сайту, например, ab.vlink.ru/FFF, создается и выполняется очередной пакет из пяти запросов. Результаты его выполнения будут объединены с результатами, полученными при выполнении предыдущих пакетов. Указанным способом SiteSputnik "вгрызается" в сайт, пятью поисковиками "обыскивает" каждый ресурс и каждую его папку и приносит практически все ссылки, видимые из интернета. На их основе он строит карту сайта углубленную. Имею опыт построения карт сайтов размером около 50000 ссылок. Сайт, для которого таким образом формируется карта, остается в полном "неведении", так как вся информация берется только из поисковиков. Карта искомого объекта. Это иерархическая структура ссылок, удовлетворяющих запросу или пакету запросов (о пакетах есть отдельный раздел на этом форуме). Другими словами, Вы выполнили запрос или пакет запросов и получили множество ссылок. Иерархическая структура этих ссылок есть веб-карта искомого объекта. Подробнее здесь - ab.vlink.ru/FFF/Help/SSInstr/SSMapSite.htm. |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Alexei Mylnikov написал: Сайт, для которого таким образом формируется карта, остается в полном "неведении", так как вся информация берется только из поисковиков. СайтСпутник открывает страницы кэша или просто берет в поисковике ссылку и сниппеты? ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Кеш здесь не берется, только ссылка. Разработан алгоритм сбора для конкретной ссылки кешей из нескольких поисковиков (Яндекса, Гугля и Яху), но не приступал к его реализации - сомневаюсь в ликвидности такой функции. |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 17 июля 2009 7:58 Сообщение отредактировано: 17 июля 2009 7:58 Alexei Mylnikov написал: Кеш здесь не берется, только ссылка. ОК. Спасибо. ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
<<Назад Вперед>> | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » Веб-Карта сайта, ресурса, папки, искомого объекта. |
Самые активные 20 тем | |