Блэклист сайтов

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Блэклист сайтов
RSS

Блэклист сайтов

<<Назад  Вперед>>Страницы: 1 * 2 3 4 5 6 7
Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Vinni написал:
[q]
Так слово бывает в тексте, а не в URL.
Если соответствующая часть алгоритма будет примерно такой
-получить URL из выдачи поисковика
-проверить по "файлу, содержащему список запрещенных слов" не входит ли одно из слов в URL
- если входит, то не использовать данный URL

то все нормально
[/q]

Нет, Вы предлагаете более частный случай. Нельзя будет отфильтровать слова не из URL, а это тоже может пригодиться.

Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

Alexei Mylnikov написал:
[q]
Вы предлагаете более частный случай. Нельзя будет отфильтровать слова не из URL, а это тоже может пригодиться
[/q]


Ради бога, делайте и это. Но это уже другая задача. :wink:
Главное, чтобы, как минимум, производилась фильтрация URL
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Надо услышать еще автора темы Петряшова: что ему больше подойдет.

petryashov
Администратор

Откуда: Москва
Всего сообщений: 480
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009

Alexei Mylnikov написал:
[q]
Надо услышать еще автора темы Петряшова: что ему больше подойдет.
[/q]



Vinni написал:
[q]
Нет - список URL сайтов, которые надо исключить из поиска
[/q]

Да, я именно то, что ув. Vinni озвучил, имел в виду
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

petryashov написал:
[q]
Да, я именно то, что ув. Vinni озвучил, имел в виду
[/q]


:wink:
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Vinni написал:
[q]
[q]
:wink:
[/q]

:bottle:

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Если в версии 6.4.5.5 в пакете написать два запроса (можно не в пакете, а по-отдельности в "Золотом ключике" выполнить эти запросы):

запрос1 --noturl.txt
запрос2 --Мои документы\нет.txt

предварительно в корневой папке СайтСпутник(а) создать файл: noturl.txt, содержащий:

sitesputnik.ru
ab.vlink.ru
youtube.com
livejournal.com
freesoft.ru
shareware.su
Интернет-проект
СМИ
метапоиск в интернете
средство для поиска в интернете

а в папке "Мои документы", вложенной в корневую папку, создать файл: нет.txt, содержащий:

ci-razvedka.ru
sitesputnik.ru/Help

То выдача SiteSputnik(a) для:
"запрос1" не будет содержать сниппетов, в html-тексте которых содержатся абсолютно точные копии строк из файла noturl.txt,
"запрос2" не будет содержать сниппетов, в html-тексте которых содержатся абсолютно точные копии строк из файла Мои документы\нет.txt

petryashov
Администратор

Откуда: Москва
Всего сообщений: 480
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
2 Alexei Mylnikov
Ага, понятно. А можно сделать так, чтобы файлы noturl.txt и нет.txt заполнялись при помощи интерфейса, встроенного в саму программу SiteSputnik? А то некоторых юзеров будет напрягать необходимость создавать какие-то файлы и их куда-то сохранять...
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

petryashov написал:
[q]
Ага, понятно. А можно сделать так, чтобы файлы noturl.txt и нет.txt заполнялись при помощи интерфейса, встроенного в саму программу SiteSputnik? А то некоторых юзеров будет напрягать необходимость создавать какие-то файлы и их куда-то сохранять...
[/q]



Красная стрелка на картинке указывает на кнопку "N", по которой осуществляется переход к работе с "Черным списком".
Нажав ее, затем можно выбрать готовый список, отредактировать его в блокноте или создать новый список.
В перспективе можно будет повесить более "комфортабельную" отдельную картиночку на кнопку "N" под работу с черными списками, а не стандартный диалог как в настоящей версии.

Правила:
для каждого простого запроса допускается один черный список;
в пакете каждому запросу можно прописать один свой (персональный) черный список.

Это доступно в версии 6.4.5.6 от 02.10.10г.
Подкачаться можно из главного меню "? | Проверить наличие обновлений".

petryashov
Администратор

Откуда: Москва
Всего сообщений: 480
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Ага, работает, но хитро: один раз ссылку на "забаненный" сайт все же выдает
<<Назад  Вперед>>Страницы: 1 * 2 3 4 5 6 7
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Блэклист сайтов
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS