Блэклист сайтов

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Блэклист сайтов
RSS

Блэклист сайтов

<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7
Печать
 
petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Алексей, мы когда-то этот вопрос уже обсуждали, но он как-то завис.
Суть:в тех случаях, когда мы ежедневно мониторим группу запросов в СайтСпутнике, достаточно быстро выявляется группа сайтов, которые не имеют отношения к теме, но не отфильтровываются даже самыми изощренными запросами в поисковых системах.

Можно ли создать некий Блеклист, в который пользователь может включать сайты, которые СайтСпутнику посещать не надо?
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

petryashov написал:
[q]
Алексей, мы когда-то этот вопрос уже обсуждали, но он как-то завис.
Суть:в тех случаях, когда мы ежедневно мониторим группу запросов в СайтСпутнике, достаточно быстро выявляется группа сайтов, которые не имеют отношения к теме, но не отфильтровываются даже самыми изощренными запросами в поисковых системах.

Можно ли создать некий Блеклист, в который пользователь может включать сайты, которые СайтСпутнику посещать не надо?
[/q]

Подобно тому, что сделано в пункте 4 здесь forum.razved.info/index.php?t=1007 , но не отдельное слово отфильтровывать, а указать файл, содержащий список запрещенных слов?

Vinni
Администратор

Всего сообщений: 2711
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Нет - список URL сайтов, которые надо исключить из поиска
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Vinni написал:
[q]
Нет - список URL сайтов, которые надо исключить из поиска
[/q]

Так URL - это частный случай слова. Иногда удобнее написать часть URL, например, forum.razved.info, чтобы не вклюсать в выдачу информацию с данного форума.

Vinni
Администратор

Всего сообщений: 2711
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Так слово бывает в тексте, а не в URL. :wink:
Если соответствующая часть алгоритма будет примерно такой
-получить URL из выдачи поисковика
-проверить по "файлу, содержащему список запрещенных слов" не входит ли одно из слов в URL
- если входит, то не использовать данный URL

то все нормально :wink:
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Vinni написал:
[q]
Так слово бывает в тексте, а не в URL.
Если соответствующая часть алгоритма будет примерно такой
-получить URL из выдачи поисковика
-проверить по "файлу, содержащему список запрещенных слов" не входит ли одно из слов в URL
- если входит, то не использовать данный URL

то все нормально
[/q]

Нет, Вы предлагаете более частный случай. Нельзя будет отфильтровать слова не из URL, а это тоже может пригодиться.

Vinni
Администратор

Всего сообщений: 2711
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

Alexei Mylnikov написал:
[q]
Вы предлагаете более частный случай. Нельзя будет отфильтровать слова не из URL, а это тоже может пригодиться
[/q]


Ради бога, делайте и это. Но это уже другая задача. :wink:
Главное, чтобы, как минимум, производилась фильтрация URL
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Надо услышать еще автора темы Петряшова: что ему больше подойдет.

petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009

Alexei Mylnikov написал:
[q]
Надо услышать еще автора темы Петряшова: что ему больше подойдет.
[/q]



Vinni написал:
[q]
Нет - список URL сайтов, которые надо исключить из поиска
[/q]

Да, я именно то, что ув. Vinni озвучил, имел в виду
Vinni
Администратор

Всего сообщений: 2711
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

petryashov написал:
[q]
Да, я именно то, что ув. Vinni озвучил, имел в виду
[/q]


:wink:
<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Блэклист сайтов
RSS

Последние RSS
SiteSputnik. Об одном подходе к мониторингу Телеграм
Безопасность при работе на ПК
Книги о критическом мышлении
Наказывать за вмешательство в частную жизнь, Верховный суд
CI Academic Materials
CiMi.CON Evolution USA
Поиск в КЭШ поисковиков по запросу и пакету запросов
СайтСпутник: Многоязычность, Юникод, MS ACCESS
Новый курс OSINT от АИС
Год тюрьмы за отказ удалять
Книга "Строим доверие по методикам спецслужб"
аналог "Консультанта" о зарубежном законодательстве
Открытые данные ФНС
Получаем информацию по VIN
Competitive-Market Intelligence Conference, Berlin 2018
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st
Историческое. Агентурная разведка
Open Source Intelligence (OSINT) Tools and Resources Handbook

Самые активные 20 тем RSS
Мелочи