Блэклист сайтов

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Блэклист сайтов
RSS

Блэклист сайтов

<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7
Печать
 
Доктор ТуамОсес
Молчун

Всего сообщений: 38
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
2 сен. 2013
Вы здесь:http://forum.razved.info/index.php?t=1170&p=14290#pp14290 самое главное не сказали.
Что создаваемый файл слов исключений должен быть в кодировке ASCII.

А ведь все современные редакторы сохраняют файлы в юникоде.

Из-за этого я почти месяц мучился и не мог понять: почему у меня не работает "черный список" :diablo:
Доктор ТуамОсес
Молчун

Всего сообщений: 38
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
2 сен. 2013
================================================================================
И ещё вопрос к разработчику: не планируется ли расширить возможности файлов слов исключений возможностью добавлять REGEX-ы? Ну или хотя бы фразы?

Этого очень не хватает

---
Я разработчик новых концепций, от которых содрогнется вся цивилизация
doctortuamoses.0pk.ru
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Дима, Олег - так понимаю вы эту тему освоили ("черные" и "белые" списки сайтов).
Подскажите - этот список глобально действует или локально (в рамках одного Проекта). И если локально - то как создавать списки под каждый проект?

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Доктор ТуамОсес написал:
[q]
И ещё вопрос к разработчику: не планируется ли расширить возможности файлов слов исключений возможностью добавлять REGEX-ы? Ну или хотя бы фразы?
[/q]

    "Городить большой огород" специально над сниппетами считаю, что не рационально. Если очень надо, то есть более мощная возможность работы с ними, но в SiteSputnik News, а именно:

    1. Для источников в "Настройка поиска" (но не в Main сценарии) прописываете "Да" в столбце "Сниппет-Новость" (сниппет есть новость), то есть, на рубрикацию отправляете не скачанный контент ссылки, а контент сниппета.

    2. Создаёте новостной пакет (проект) и в нем прописываете Рубрику или несколько Рубрик, в которых можно задать Правила попадания в Рубрику, которые значительно мощнее, чем REGEX-ы и простые фразы.

    Если в пакете для всех источников прописано, что сниппет есть новость, то он отработает быстро, так как скачивания ссылок проводиться не будет, а сами новости будут очень маленькими и их рубрикация пройдет очень быстро.



Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Игорь Нежданов написал:
[q]
Подскажите - этот список глобально действует или локально (в рамках одного Проекта). И если локально - то как создавать списки под каждый проект?
[/q]

Список действует локально, причем привязан не к проекту, а явно прописывается в строке запроса, там где это нужно.

Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009

Алексей Мыльников написал:
[q]
Список действует локально...
[/q]

Это очень хорошо. Потопал пробовать. Спасибо!

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Доктор ТуамОсес
Молчун

Всего сообщений: 38
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
2 сен. 2013
[b]Для: Игорь Нежданов[/b]
Список (в смысле файл чёрного списка) как я понял действует только в текущем запросе.
P.S. А что такое "проект"& Ящик что ли?

---
Я разработчик новых концепций, от которых содрогнется вся цивилизация
doctortuamoses.0pk.ru
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Доктор ТуамОсес написал:
[q]
А что такое "проект"& Ящик что ли?
[/q]

Проект - может быть простым поисковым или новостным (с поиском, скачиванием и рубрикацией новых материалов или обновлений).
Типы новостных Проектов перечислены в "Инструкторе".

Ящик - это база данных (Пользователь видит две взаимосвязанные таблицы), в которой сохраняется история работы с Проектом.

В принцине, в одном Ящике можно вести несколько Проектов, но в реальной работе каждый Проект удобнее вести в своем Ящике.

Доктор ТуамОсес
Молчун

Всего сообщений: 38
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
2 сен. 2013
[q=Алексей Мыльников]Проект - может быть простым поисковым или новостным[/q]
Всё-равно не очень понятно, что Вы подразумеваете под словом "проект" в своей программе.
Дайте формальное и математически строгое определение

---
Я разработчик новых концепций, от которых содрогнется вся цивилизация
doctortuamoses.0pk.ru
Доктор ТуамОсес
Молчун

Всего сообщений: 38
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
2 сен. 2013
[q=Алексей Мыльников]запрос2 --Мои документы\нет.txt[/q]

Т.е. SS автоматом находит папку "Мои документы"? :wonder:
Как? Сканируя более чем полтора миллиона файлов на моем харде?

А если я, к примеру, хочу чтобы у меня файлы черного и белого списков лежали на диске E:, то как в этом случае будет выглядеть запрос?

Так: папа --E:\Папка для списков SiteSputnik\Чёрный список.TXT


ДА?

---
Я разработчик новых концепций, от которых содрогнется вся цивилизация
doctortuamoses.0pk.ru
<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Блэклист сайтов
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS