Форум Сообщества Практиков Конкурентной разведки (СПКР) » Предложения по программе для допроса Интернета СайтСпутник » Блэклист сайтов |
![]() |
<<Назад Вперед>> | Страницы: 1 2 3 4 5 6 7 | Печать |
petryashov
Администратор
Откуда: Москва Всего сообщений: 480 Рейтинг пользователя: 9 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Алексей, мы когда-то этот вопрос уже обсуждали, но он как-то завис. Суть:в тех случаях, когда мы ежедневно мониторим группу запросов в СайтСпутнике, достаточно быстро выявляется группа сайтов, которые не имеют отношения к теме, но не отфильтровываются даже самыми изощренными запросами в поисковых системах. Можно ли создать некий Блеклист, в который пользователь может включать сайты, которые СайтСпутнику посещать не надо? |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
petryashov написал: Алексей, мы когда-то этот вопрос уже обсуждали, но он как-то завис. Подобно тому, что сделано в пункте 4 здесь forum.razved.info/index.php?t=1007 , но не отдельное слово отфильтровывать, а указать файл, содержащий список запрещенных слов? |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Нет - список URL сайтов, которые надо исключить из поиска |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Vinni написал: Нет - список URL сайтов, которые надо исключить из поиска Так URL - это частный случай слова. Иногда удобнее написать часть URL, например, forum.razved.info, чтобы не вклюсать в выдачу информацию с данного форума. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Так слово бывает в тексте, а не в URL. ![]() Если соответствующая часть алгоритма будет примерно такой -получить URL из выдачи поисковика -проверить по "файлу, содержащему список запрещенных слов" не входит ли одно из слов в URL - если входит, то не использовать данный URL то все нормально ![]() |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Vinni написал: Так слово бывает в тексте, а не в URL. Нет, Вы предлагаете более частный случай. Нельзя будет отфильтровать слова не из URL, а это тоже может пригодиться. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Alexei Mylnikov написал: Вы предлагаете более частный случай. Нельзя будет отфильтровать слова не из URL, а это тоже может пригодиться Ради бога, делайте и это. Но это уже другая задача. ![]() Главное, чтобы, как минимум, производилась фильтрация URL |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Надо услышать еще автора темы Петряшова: что ему больше подойдет. |
petryashov
Администратор
Откуда: Москва Всего сообщений: 480 Рейтинг пользователя: 9 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 30 сентября 2010 17:11 Сообщение отредактировано: 30 сентября 2010 17:12 Alexei Mylnikov написал: Надо услышать еще автора темы Петряшова: что ему больше подойдет. Vinni написал: Нет - список URL сайтов, которые надо исключить из поиска Да, я именно то, что ув. Vinni озвучил, имел в виду |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
petryashov написал: Да, я именно то, что ув. Vinni озвучил, имел в виду ![]() |
<<Назад Вперед>> | Страницы: 1 2 3 4 5 6 7 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Предложения по программе для допроса Интернета СайтСпутник » Блэклист сайтов |
![]() |
Самые активные 20 тем |
![]() |