Удаление дублей ссылок, имеющих одинаковое содержание

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Техподдержка программы SiteSputnik »   Удаление дублей ссылок, имеющих одинаковое содержание
RSS

Удаление дублей ссылок, имеющих одинаковое содержание

<<Назад  Вперед>>Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
05.10.11. Версия 7.2.4
Удаление в выдаче SiteSputnik News дублей ссылок, имеющих одинаковое содержание. Учитываются ссылки из текущего и предыдущих заданий (ссылки полученные в старых версиях, на предмет дублирования их контента не рассматриваются).

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009

Алексей Мыльников написал:
[q]
Удаление в выдаче SiteSputnik News дублей ссылок, имеющих одинаковое содержание.
[/q]
А возле теста останутся ссылки на дубли? Иногда интересно знать, на каких ресурсах одновременно была размещена одна и та же статья.

Будут ли сравниваться тексты, которые были ранее? Например, при первом запуске программы прошла статья, а при следующем запуске программы появилась еще одна точно такая же статья, но размещенная на другом ресурсе.
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
А возле теста останутся ссылки на дубли? Иногда интересно знать, на каких ресурсах одновременно была размещена одна и та же статья.
[/q]

Ссылки на дубли в специальном списке "Повторные". Возле текста ничего нет. Если интересно знать ресурсы, то эффектвнее составить пакет с параметрами и по ключевым словам систематически собирать ссылки на статью.

tungus1973 написал:
[q]
Будут ли сравниваться тексты, которые были ранее? Например, при первом запуске программы прошла статья, а при следующем запуске программы появилась еще одна точно такая же статья, но размещенная на другом ресурсе.
[/q]

Именно это и сделано. Ранее дубли отлавливались в рамках одного поиска, сейчас в рамках нескольких последних поисков (заданий). Учтите сказанное выше: "...ссылки, полученные в старых версиях, на предмет дублирования их контента не рассматриваются", - то есть, если Вы сейчас выполните задание в новой версии, а через час повторите его, затем через два часа выполните ещё раз это задание, то во второй выдаче не будет дублей из первого выполнения, в третьей из первого и второго. Задания из старых версий алгоритм поиска и отбрасывания дублей по контенту не рассматривает.

<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Техподдержка программы SiteSputnik »   Удаление дублей ссылок, имеющих одинаковое содержание
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS