Форум Сообщества Практиков Конкурентной разведки (СПКР) » Предложения по программе для допроса Интернета СайтСпутник » Блэклист сайтов |
<<Назад Вперед>> | Страницы: 1 * 2 3 4 5 6 7 | Печать |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Vinni написал: Нет - список URL сайтов, которые надо исключить из поиска Так URL - это частный случай слова. Иногда удобнее написать часть URL, например, forum.razved.info, чтобы не вклюсать в выдачу информацию с данного форума. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Так слово бывает в тексте, а не в URL. Если соответствующая часть алгоритма будет примерно такой -получить URL из выдачи поисковика -проверить по "файлу, содержащему список запрещенных слов" не входит ли одно из слов в URL - если входит, то не использовать данный URL то все нормально |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Vinni написал: Так слово бывает в тексте, а не в URL. Нет, Вы предлагаете более частный случай. Нельзя будет отфильтровать слова не из URL, а это тоже может пригодиться. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Alexei Mylnikov написал: Вы предлагаете более частный случай. Нельзя будет отфильтровать слова не из URL, а это тоже может пригодиться Ради бога, делайте и это. Но это уже другая задача. Главное, чтобы, как минимум, производилась фильтрация URL |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Надо услышать еще автора темы Петряшова: что ему больше подойдет. |
petryashov
Администратор
Откуда: Москва Всего сообщений: 480 Рейтинг пользователя: 9 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 30 сентября 2010 17:11 Сообщение отредактировано: 30 сентября 2010 17:12 Alexei Mylnikov написал: Надо услышать еще автора темы Петряшова: что ему больше подойдет. Vinni написал: Нет - список URL сайтов, которые надо исключить из поиска Да, я именно то, что ув. Vinni озвучил, имел в виду |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
petryashov написал: Да, я именно то, что ув. Vinni озвучил, имел в виду |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Vinni написал: |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Если в версии 6.4.5.5 в пакете написать два запроса (можно не в пакете, а по-отдельности в "Золотом ключике" выполнить эти запросы): запрос1 --noturl.txt запрос2 --Мои документы\нет.txt предварительно в корневой папке СайтСпутник(а) создать файл: noturl.txt, содержащий: sitesputnik.ru ab.vlink.ru youtube.com livejournal.com freesoft.ru shareware.su Интернет-проект СМИ метапоиск в интернете средство для поиска в интернете а в папке "Мои документы", вложенной в корневую папку, создать файл: нет.txt, содержащий: ci-razvedka.ru sitesputnik.ru/Help То выдача SiteSputnik(a) для: "запрос1" не будет содержать сниппетов, в html-тексте которых содержатся абсолютно точные копии строк из файла noturl.txt, "запрос2" не будет содержать сниппетов, в html-тексте которых содержатся абсолютно точные копии строк из файла Мои документы\нет.txt |
petryashov
Администратор
Откуда: Москва Всего сообщений: 480 Рейтинг пользователя: 9 Ссылка Дата регистрации на форуме: 7 июня 2009 |
2 Alexei Mylnikov Ага, понятно. А можно сделать так, чтобы файлы noturl.txt и нет.txt заполнялись при помощи интерфейса, встроенного в саму программу SiteSputnik? А то некоторых юзеров будет напрягать необходимость создавать какие-то файлы и их куда-то сохранять... |
<<Назад Вперед>> | Страницы: 1 * 2 3 4 5 6 7 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Предложения по программе для допроса Интернета СайтСпутник » Блэклист сайтов |
Самые активные 20 тем | |