Блэклист сайтов

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Блэклист сайтов
RSS

Блэклист сайтов

<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7
Печать
 
petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Алексей, мы когда-то этот вопрос уже обсуждали, но он как-то завис.
Суть:в тех случаях, когда мы ежедневно мониторим группу запросов в СайтСпутнике, достаточно быстро выявляется группа сайтов, которые не имеют отношения к теме, но не отфильтровываются даже самыми изощренными запросами в поисковых системах.

Можно ли создать некий Блеклист, в который пользователь может включать сайты, которые СайтСпутнику посещать не надо?
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 866
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

petryashov написал:
[q]
Алексей, мы когда-то этот вопрос уже обсуждали, но он как-то завис.
Суть:в тех случаях, когда мы ежедневно мониторим группу запросов в СайтСпутнике, достаточно быстро выявляется группа сайтов, которые не имеют отношения к теме, но не отфильтровываются даже самыми изощренными запросами в поисковых системах.

Можно ли создать некий Блеклист, в который пользователь может включать сайты, которые СайтСпутнику посещать не надо?
[/q]

Подобно тому, что сделано в пункте 4 здесь forum.razved.info/index.php?t=1007 , но не отдельное слово отфильтровывать, а указать файл, содержащий список запрещенных слов?

Vinni
Администратор

Всего сообщений: 2711
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Нет - список URL сайтов, которые надо исключить из поиска
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 866
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Vinni написал:
[q]
Нет - список URL сайтов, которые надо исключить из поиска
[/q]

Так URL - это частный случай слова. Иногда удобнее написать часть URL, например, forum.razved.info, чтобы не вклюсать в выдачу информацию с данного форума.

Vinni
Администратор

Всего сообщений: 2711
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Так слово бывает в тексте, а не в URL. :wink:
Если соответствующая часть алгоритма будет примерно такой
-получить URL из выдачи поисковика
-проверить по "файлу, содержащему список запрещенных слов" не входит ли одно из слов в URL
- если входит, то не использовать данный URL

то все нормально :wink:
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 866
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Vinni написал:
[q]
Так слово бывает в тексте, а не в URL.
Если соответствующая часть алгоритма будет примерно такой
-получить URL из выдачи поисковика
-проверить по "файлу, содержащему список запрещенных слов" не входит ли одно из слов в URL
- если входит, то не использовать данный URL

то все нормально
[/q]

Нет, Вы предлагаете более частный случай. Нельзя будет отфильтровать слова не из URL, а это тоже может пригодиться.

Vinni
Администратор

Всего сообщений: 2711
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

Alexei Mylnikov написал:
[q]
Вы предлагаете более частный случай. Нельзя будет отфильтровать слова не из URL, а это тоже может пригодиться
[/q]


Ради бога, делайте и это. Но это уже другая задача. :wink:
Главное, чтобы, как минимум, производилась фильтрация URL
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 866
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Надо услышать еще автора темы Петряшова: что ему больше подойдет.

petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009

Alexei Mylnikov написал:
[q]
Надо услышать еще автора темы Петряшова: что ему больше подойдет.
[/q]



Vinni написал:
[q]
Нет - список URL сайтов, которые надо исключить из поиска
[/q]

Да, я именно то, что ув. Vinni озвучил, имел в виду
Vinni
Администратор

Всего сообщений: 2711
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

petryashov написал:
[q]
Да, я именно то, что ув. Vinni озвучил, имел в виду
[/q]


:wink:
<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Блэклист сайтов
RSS

Последние RSS
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
ВС разрешил пропускать работу без разрешения работодателя
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей
Лог-файл в программе СайтСпутник
шантаж, угрозы по Интернету
Практически весь интернет становится русскоязычным
SiteSputnik. Об одном подходе к мониторингу Телеграм
Безопасность при работе на ПК

Самые активные 20 тем RSS