Форум Сообщества Практиков Конкурентной разведки (СПКР) » Техподдержка программы SiteSputnik » Удаление дублей ссылок, имеющих одинаковое содержание |
<<Назад Вперед>> | Печать |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
05.10.11. Версия 7.2.4 Удаление в выдаче SiteSputnik News дублей ссылок, имеющих одинаковое содержание. Учитываются ссылки из текущего и предыдущих заданий (ссылки полученные в старых версиях, на предмет дублирования их контента не рассматриваются). |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 795 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
Алексей Мыльников написал: А возле теста останутся ссылки на дубли? Иногда интересно знать, на каких ресурсах одновременно была размещена одна и та же статья. Удаление в выдаче SiteSputnik News дублей ссылок, имеющих одинаковое содержание. Будут ли сравниваться тексты, которые были ранее? Например, при первом запуске программы прошла статья, а при следующем запуске программы появилась еще одна точно такая же статья, но размещенная на другом ресурсе. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 5 октября 2011 18:42 Сообщение отредактировано: 5 октября 2011 18:45 tungus1973 написал: А возле теста останутся ссылки на дубли? Иногда интересно знать, на каких ресурсах одновременно была размещена одна и та же статья. Ссылки на дубли в специальном списке "Повторные". Возле текста ничего нет. Если интересно знать ресурсы, то эффектвнее составить пакет с параметрами и по ключевым словам систематически собирать ссылки на статью. tungus1973 написал: Будут ли сравниваться тексты, которые были ранее? Например, при первом запуске программы прошла статья, а при следующем запуске программы появилась еще одна точно такая же статья, но размещенная на другом ресурсе. Именно это и сделано. Ранее дубли отлавливались в рамках одного поиска, сейчас в рамках нескольких последних поисков (заданий). Учтите сказанное выше: "...ссылки, полученные в старых версиях, на предмет дублирования их контента не рассматриваются", - то есть, если Вы сейчас выполните задание в новой версии, а через час повторите его, затем через два часа выполните ещё раз это задание, то во второй выдаче не будет дублей из первого выполнения, в третьей из первого и второго. Задания из старых версий алгоритм поиска и отбрасывания дублей по контенту не рассматривает. |
<<Назад Вперед>> | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Техподдержка программы SiteSputnik » Удаление дублей ссылок, имеющих одинаковое содержание |
Самые активные 20 тем | |