SiteSputnik News. Внешние функции для Рубрик

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   SiteSputnik News. Внешние функции для Рубрик
RSS

SiteSputnik News. Внешние функции для Рубрик

Расширение возможностей рубрикации материалов

<<Назад  Вперед>>Страницы: 1 * 2
Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 839
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Вчера по просьбе Пользователя (скорее всего, на этом форуме он не присутствует) сделал 13-ю ВФ-функцию.

    13. Поиск слова в якоре ссылки - AnchorWord

    Эта ВФ-функция имеет один параметр - искомое слово. Оно ищется во всех "якорях" значимого контента ссылки.
    Если слово (точнее лексема) находится, то функция возвращает значение "Да" (истина).
    Особенность реализации - 100% совпадение, без дополнительного анализа слова, поэтому окончания рекомендуется отбрасывать.

    Например, правило:

    fun(AnchorWord,Путин)
    fun(AnchorWord,Янукович)
    fun(AnchorWord,Лукашенко)
    fun(AnchorWord,Серге) fun(AnchorWord,Иванов)
    !Путин* fun(AnchorWord,Един) fun(AnchorWord,Росси)

    обеспечит попадание в Рубрику тех ссылок, в якоре которых прописан хотя бы один из трёх президентов: Путин, Лукашенко или Янукович, или Сергей Иванов, или в любом месте ссылки упомянут Путин, а в якоре есть Единая Россия.

Чтобы воспользоваться ею обновитесь до SiteSputnik 8.4.1.2 и перепишите функцию AnchorWord отсюда в папку Exe.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 796
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Чрезвычайно полезный функционал! :good:
Алексей Борисович, а когда примерно можно ожидать инструкцию для программиста? Много времени займёт её написание?
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 839
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Написание займет дня 2-4. Сделаю, когда увижу устойчивую обратную связь.
У Вас есть конкретные, реальные потребности? Какие?

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 796
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Для: Алексей Мыльников
Через ВФ-функции можно много чего делать. :smile:

Например, можно сотворить парсеры контактов.
Допустим, нужно собрать все e-mail организации "Аэрофлот", чтобы потом мониторить их. Делаем модуль, который будет искать в текстах @aeroflot.ru, извлекать e-mail и складывать их в файл. Каждый найденный e-mail проверяется на наличие в этом списке и, если мейл новый, то ВФ-модуль добавляет его в список. Остаётся поставить этот файл с мейлами на мониторинг - как только в нём произойдут изменения, смотрим, какой мейл появился, и добавляем его к общему мониторингу "Аэрофлота".
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 839
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
Через ВФ-функции можно много чего делать.
[/q]
А ещё поконкретнее можно?

Касательно сбора е-майлов для организации, предложенного в предыдущем сообщении, можно применить следующую ВФ-функцию.

    14. Поиск Е-майлов корпоративных (по домену) - ParserForEmail

    Эта ВФ-функция имеет от одного до трех параметров.
    1-ый параметр обязательный. В нём указывается какие Е-майлы мы ищем, например, @aeroflot.ru.
    2-й параметр, если он задан и равен 0 или false, обеспечивает возврат в Правило попадания в Рубрику значения "Нет" при любых обстоятельствах. Иначе функция работает логически: вернет "Да", если искомый E-майл в ссылке найден, "Нет", если не найден
    3-й параметр, если он задан, укажет в какую папку помещать найденные е-майлы. Иначе адреса попадут в папку Mails, вложенную в корневую папку программы. Папки предварительно создавать не обязятельно.

    Например, если мы работаем по Роснано, то правило:

    ( fun(ParserForEmail,@rusnano.com) | Чубайс | Роснано )

    обеспечит попадание в Рубрику даже тех ссылок, в которых нет Чубайса или Роснано, но есть фирменный роснановский е-майл.

    Если мы напишем так (2-му параметру присвоим 0):

    ( fun(ParserForEmail,@rusnano.com,0) | Чубайс | Роснано )

    то фирменный е-майл не отправит ссылку в Рубрику, но своё основное дело сделает: роснановские е-майлы "выцарапаны" будут.

    Если мы напишем так:
    fun(ParserForEmail,@yandex.ru,0,F:\Майлы)
    fun(ParserForEmail,@mail.ru,0,F:\Майлы\Mail)
    fun(ParserForEmail,@gmail.com,0,f:\Майлы)
    fun(ParserForEmail,@yahoo.com,0,F:\Майлы)
    fun(ParserForEmail,@rambler.ru,0,f:\Майлы)
    ( fun(ParserForEmail,@rusnano.com) | Чубайс | Роснано )

    то кроме работы по Роснано, будем попутно собирать "встретившиеся" е-майлы с yandex.ru, mail.ru, gmail.com, yahoo.com, rambler.ru.

    Напомню, что строки в Правиле соединяются через логическое "Или".

Чтобы воспользоваться этой ВФ-функцией обновитесь до SiteSputnik 8.4.1.3.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 796
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009

Алексей Мыльников написал:
[q]
А ещё поконкретнее можно?
[/q]

Функционал ВФ позволяет пользователю, знакомому с любым языком программирования (!), писать модули обмена информацией между программами. Пожалуй, никто из присутствующих не будет со мной спорить, если я скажу, что НЕ существует универсальной программы для КР, которая умела бы делать абсолютно ВСЁ. Однако механизм ВФ позволяет, при желании, использовать достоинства всех этих программ.
Например, результаты работы СайтСпутника можно автоматически выгружать для обработки в другие программы. Пользователи давно уже просят механизм для занесения новостей, собранных "СайтСпутником", в их внутренние базы данных. Базы данных могут быть разных форматов, от Cronos до Oracle. Написать модули для переноса данных в базы ВСЕХ форматов не получится. Вы же не знаете, в какие таблицы и в какие поля таблиц нужно заносить данные. Однако, пользователи, умеющие программировать или имеющие знакомого программиста, могут сами сделать модуль для выгрузки данных в базу любого формата.
Vinni
Администратор

Всего сообщений: 2711
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

tungus1973 написал:
[q]
Написать модули для переноса данных в базы ВСЕХ форматов не получится.
[/q]


Ну почему же - есть стандарт текстового файла для импорта-экспорта в базы данных - CSV.

А для прямого чтения содержимого таблиц Paradox можно использовать утилиту командной строки PdxHakView - _ttp://pdxhak.sourceforge.net/ :wink:

Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
На самом деле функция экспорта в БД у СайтСпутника уже есть.
В настройках Рубрики (которую хотите экспортировать) указываете папку и формат экспортируемого файла (таблица). Результат по данной Рубрике будет выложен в указанную папку в табличной форме. Далее указываете вашей БД откуда импортировать данные и собственно всё.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Vinni
Администратор

Всего сообщений: 2711
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

Игорь Нежданов написал:
[q]
Результат по данной Рубрике будет выложен в указанную папку в табличной форме.
[/q]


То есть там уже CSV? Здорово! :good:
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 839
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Ещё одна логическая ВФ-функция.

    15. Количество комментариев к ссылке - NumberOfComments

    Эта ВФ-функция имеет два параметра - знак сравнения и число, например >,10.
    Если количество комментариев к ссылке удовлетворяет условию, заданному в параметрах, то функция возвращает значение "Да" (истина).

    Например, правило:

    Дмитрий /1 Медведев fun(NumberOfComments,>=,100)

    обеспечит попадание в Рубрику тех ссылок, в которых упоминается Дмитрий Медведев и количество комментариев к которым не менее 100.

Чтобы воспользоваться ею обновитесь до SiteSputnik 8.4.1.4.

<<Назад  Вперед>>Страницы: 1 * 2
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   SiteSputnik News. Внешние функции для Рубрик
RSS

Последние RSS
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей
Лог-файл в программе СайтСпутник
шантаж, угрозы по Интернету
Практически весь интернет становится русскоязычным
SiteSputnik. Об одном подходе к мониторингу Телеграм
Безопасность при работе на ПК
Книги о критическом мышлении
Наказывать за вмешательство в частную жизнь, Верховный суд
CI Academic Materials
CiMi.CON Evolution USA
Поиск в КЭШ поисковиков по запросу и пакету запросов
СайтСпутник: Многоязычность, Юникод, MS ACCESS
Новый курс OSINT от АИС
Год тюрьмы за отказ удалять
Книга "Строим доверие по методикам спецслужб"
аналог "Консультанта" о зарубежном законодательстве
Открытые данные ФНС
Получаем информацию по VIN

Самые активные 20 тем RSS
К вопросу о телеграм