Форум Сообщества Практиков Конкурентной разведки (СПКР) » Предложения по программе для допроса Интернета СайтСпутник » Предложения по доработке "Карты сайта" |
![]() |
<<Назад Вперед>> | Страницы: 1 2 3 | Печать |
petryashov
Администратор
Откуда: Москва Всего сообщений: 480 Рейтинг пользователя: 9 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Алексей, мы уже в свое время предлагали небольшую доработку "Карты сайта". Суть - добавление в карту еще одного столбца, в котором было бы описание из тега TITLE нужной страницы сайта. вот, например, что кроется за такой ссылкой? www.site.ru/10975/306992/ Пока не нажмешь - не увидишь.А если таких неговорящих ссылок тысячи, то ценность полученной карты сайта сомнительна. Достаточно сделать доработку, включив в карту столбец из тайтла, и мы увидим описание этой страницы Это можно сделать? |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Да, но для этого придется открыть ровно столько ссылок сколько содержится в карте сайта (КС), а их количество может исчисляться десятками тысяч. Это не всегда приемлемо на эпапе поиска при помощи поисковиков. Без проблем "прицепить" сниппеты. В этом случае не надо ничего открывать. Они уже есть в списке "Объединение", на основе которого формируется КС. Я их просто отбрасываю при построении иерархической структуры сайта. Поэтому работайте со списком "Объединение". В нем один к одному те самые ссылки, что и в КС, но каждая ссылка сопровождается сниппетом. КС задумана для другого. Она является базой (стартовой площадкой) для поиска непроиндексированных (невидимых) поисковиками ссылок. Одной из функций поиска таких ссылок является разрабатываемый в настоящее время спайдер, запускаемый с КС. Спайдеру приходится закачивать все ссылки и видимые, и обнаруженные невидимые. Вот здесь можно и НУЖНО "прицепить" не только тайтлы, но и другие составные части контента ссылок и даже "функциональные производные" от их контента. Предполагается реализовать целый набор функций над контентом ссылок и сайта в целом. Причем не только над текстовой составляющей контента, но и над HTML составляющей. В принците реализация бета версии "Контекстного граббера" - это опробация базового алгоритма работы с контентом сайта, детализация которого будет являть собой упомянутый набор функций. |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1024 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 17 мая 2010 10:35 Сообщение отредактировано: 17 мая 2010 10:41 Alexei Mylnikov написал: КС задумана для другого. Она является базой (стартовой площадкой) для поиска непроиндексированных (невидимых) поисковиками ссылок. На самом деле карта сайта может использоваться для самых разных нужд даже в КР. Например (помимо поиск страниц, на которых нет ссылок) для изучения сайта и его наполнения в целях выявления связанных компаний или людей, в целях понимания процессов. происходящих в исследуемой компании. в целях составления представления о профессионализме ПРщиков и рекламщиков и соответственно какова рекламная политика компании.... Да много для чего. И как раз с этой точки зрения гораздо удобнее иметь не только адрес страницы,но и ее название. Так проще ориентироваться в контенте. А такие задачи есть в достаточном колличестве у КРщиков, а уж у "смежников" они сплошь и рядом. И, к стати, "смежники" (маркетологи, ПР-щики, журналисты) довольно активно интересуются возможностями SS. А это своя и не малая группа потребителей. Может есть смысл сделать два разных пункта: "КС видимая" и "КС не очень видимая". ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
Vinni
Администратор
Всего сообщений: 2126 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Иоанн написал: Alexei Mylnikov написал: Соглашусь с Алексеем. Если заставить SS самому скачивать все найденные страницы (а не пользоваться тем, что дал поисковик), то это будет уже просто паук со всеми вытекающими последствиями ![]() Пауков, строящих карты сайтов, уже хватает (см. например, бесплатный вариант на базе wget+php - _ttp://ardoino.com/15-google-php-wget-sitemap-generator/ и ) |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1024 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Vinni написал: Соглашусь с Алексеем. Если заставить SS самому скачивать все найденные страницы (а не пользоваться тем, что дал поисковик), то это будет уже просто паук со всеми вытекающими последствиями В том то и фишечка, что не надо паука делать - для начала "вытянуть" под эту функцию все что можно из поисковиков. ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
petryashov
Администратор
Откуда: Москва Всего сообщений: 480 Рейтинг пользователя: 9 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Иоанн написал:
хотя бы сниппеты |
Семёныч
Модератор форума
Городской Охотник Всего сообщений: 924 Рейтинг пользователя: 10 Ссылка Дата регистрации на форуме: 8 июня 2009 |
Соглашусь с Иоанном и petryashov - "для начала ... хотя бы сниппеты" сделали бы КС на порядок информативней. Т.Е. она и так информативна, но пока откроешь массу ссылок, большую часть их которых уже открывал, то тут и трафик и время летит. Ведь неоспоримое преимущество SS именно скорости. Понимаете о какой скорости я говорю? ---
Нет такой безвыходной ситуации,в которую невозможно вляпаться... (с) |
vbl
Модератор форума
Откуда: Нижний Новгород Всего сообщений: 170 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 10 июня 2009 |
Alexei Mylnikov написал: На самом деле карта сайта может использоваться для самых разных нужд даже в КР Как-то некорректно звучит слово "даже" :) Как раз в КР используется данная функция "на ура". Из собственного опыта. Построение карты сайта очень помогает следующим образом: - находит странички с внутренней статистикой сайта, например, созданные Вэбалайзером. Напрямую на них, как правило, выйти не получается. У нас был случай, когда СС притащил одну такую страничку с подробной статистикой IP посетителей за март 2009 года. Имея урл данной странички мы легко ознакомились и со страницами за другие месяцы. Причем не только по посетителям, а и по ключевым словам, откуда приходили посетители и т.д. - приносит очень интересные странички с сайта, которые вроде бы запрещены к показу и индексации, но ведь Гуглу пофиг ![]() А вот просматривать все найденные ссылки в карте бывает тяжко, тут я за предложение Дмитрия. И хотелось бы еще уточнить, а чем подробная карта сайта отличается от просто карты сайта? ---
Non progredi est regredi http://www.informnn.ru Информационная рассылка "Конкурентная разведка. Сам себе разведчик" - http://subscribe.ru/catalog/tech.razvedka |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
vbl написал: Здесь в 1-ом топике - forum.razved.info/index.php?t=209 И хотелось бы еще уточнить, а чем подробная карта сайта отличается от просто карты сайта? vbl написал: Alexei Mylnikov написал:На самом деле карта сайта может использоваться для самых разных нужд даже в КР Это не я написал. |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1024 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Alexei Mylnikov написал:
Это писал некто "Иоанн" ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
<<Назад Вперед>> | Страницы: 1 2 3 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Предложения по программе для допроса Интернета СайтСпутник » Предложения по доработке "Карты сайта" |
![]() |
Самые активные 20 тем |
![]() |