Версия для печати

-   Форум Сообщества Практиков Конкурентной разведки (СПКР) http://forum.razved.info/
--  Приемы работы с программой СайтСпутник (SiteSputnik) http://forum.razved.info//index.php?f=38
--- SiteSputnik News. Внешние функции для Рубрик http://forum.razved.info//index.php?t=3657




-- Алексей Мыльников написал 18 февраля 2013 1:54
В версии 8.4.1 от 18.02.13 программы SiteSputnik (http://sitesputnik.ru/) реализованы новые возможности рубрикации материалов .
Они получили название ВФ-технологии (http://sitesputnik.ru/Help/SSNewsEF.htm) и доступны в вариантах SiteSputnik News, WebSpider и Station .

Назначение и суть ВФ-технологии "на пальцах"

Для того, чтобы выделить нужную информацию из потока, в программе SiteSputnik применяются Правила попадания в Рубрику (http://sitesputnik.ru/Help/SSRubriki.htm).

Упрощённо, с точки зрения Пользователя, Правило является последовательностью слов или фраз, которые должны присутствовать в контенте ссылки. С точки зрения математического обеспечения программы, Правило - это логическое выражение. Если оно принимает значение истина, то считается, что ссылка содержит нужную информацию и попадает в Рубрику.

В новой версии программы SiteSputnik в Правилах попадания в Рубрику можно прописывать обращения к внешним логическим функциям (сокращенно ВФ-функциям ).Обращений может быть несколько, помещены они могут быть в разные части Правила, сами ВФ-функции могут быть тоже разные.

ВФ-функция
может быть написана на любом языке программирования. Она получает от программы SiteSputnik контент ссылки, производит свою работу и возвращает в Правило одно из двух значений: "Да" - критерий, который проверяет функция, выполнен или "Нет" - критерий не выполнен.

О главном.
Сообщение о результате работы ВФ-функции принимается в том и только в том месте Правила, из которого она была вызвана.
Это важный момент технологии: ВФ-функции не просто "подвешены на ссылке" (такая технология применяется при реализации обычных плагинов), а "органически" встроены в Правила попадания в Рубрику, участвуют в его логической работе.

Что это дает.

Продолжение следует ...



-- Алексей Мыльников написал 18 февраля 2013 2:22
Перечень ВФ-функций на момент публикации

На момент публикации в рамках программы SiteSputnik реализованы следующие 12 функций.
Некоторые из них носят демонстрационный характер.
На их примере продемонстрированы возможности ВФ-технологии.
Функции осуществляют достаточно сложную символьную обработку,
есть функции, которые выполняют сравнения чисел и дат, встречающихся внутри контента ссылок.















Продолжение следует ...


-- Алексей Мыльников написал 18 февраля 2013 2:28
Создание и применение собственных ВФ-функций

Инструкция программисту по разработке ВФ-функций - в стадии написания.

Инструкция Пользователя по применению ВФ-функций.



-- Игорь Нежданов написал 18 февраля 2013 6:52
Подтверждаю - отличный функционал! Активно использую NumberNearWord и DateOfEvent .

DateOfEvent - для отбора только новых материалов по ряду тем(там где важно ТОЛЬКО новое видеть).

NumberNearWord - для отбора материалов о конкурентах с указанием числовых значений. Это указания на эх объемы, доходы, численность и т.п.. Думаю нет нужды объяснять зачем :) Второе направление - сбор разных исследований рынка.


-- Алексей Мыльников написал 20 февраля 2013 3:44
Вчера по просьбе Пользователя (скорее всего, на этом форуме он не присутствует) сделал 13-ю ВФ-функцию.


Чтобы воспользоваться ею обновитесь до SiteSputnik 8.4.1.2 и перепишите функцию AnchorWord отсюда (http://sitesputnik.ru/Files/Exe.rar) в папку Exe.



-- tungus1973 написал 20 февраля 2013 10:12
Чрезвычайно полезный функционал! :good:
Алексей Борисович, а когда примерно можно ожидать инструкцию для программиста? Много времени займёт её написание?


-- Алексей Мыльников написал 20 февраля 2013 11:34
Написание займет дня 2-4. Сделаю, когда увижу устойчивую обратную связь.
У Вас есть конкретные, реальные потребности? Какие?


-- tungus1973 написал 20 февраля 2013 17:03
Для: Алексей Мыльников
Через ВФ-функции можно много чего делать. :smile:

Например, можно сотворить парсеры контактов.
Допустим, нужно собрать все e-mail организации "Аэрофлот", чтобы потом мониторить их. Делаем модуль, который будет искать в текстах @aeroflot.ru, извлекать e-mail и складывать их в файл. Каждый найденный e-mail проверяется на наличие в этом списке и, если мейл новый, то ВФ-модуль добавляет его в список. Остаётся поставить этот файл с мейлами на мониторинг - как только в нём произойдут изменения, смотрим, какой мейл появился, и добавляем его к общему мониторингу "Аэрофлота".


-- Алексей Мыльников написал 21 февраля 2013 20:15

tungus1973 написал:
[q]
Через ВФ-функции можно много чего делать.
[/q]
А ещё поконкретнее можно?

Касательно сбора е-майлов для организации, предложенного в предыдущем сообщении, можно применить следующую ВФ-функцию.


Чтобы воспользоваться этой ВФ-функцией обновитесь до SiteSputnik 8.4.1.3.


-- tungus1973 написал 22 февраля 2013 9:59

Алексей Мыльников написал:
[q]
А ещё поконкретнее можно?
[/q]

Функционал ВФ позволяет пользователю, знакомому с любым языком программирования (!), писать модули обмена информацией между программами. Пожалуй, никто из присутствующих не будет со мной спорить, если я скажу, что НЕ существует универсальной программы для КР, которая умела бы делать абсолютно ВСЁ. Однако механизм ВФ позволяет, при желании, использовать достоинства всех этих программ.
Например, результаты работы СайтСпутника можно автоматически выгружать для обработки в другие программы. Пользователи давно уже просят механизм для занесения новостей, собранных "СайтСпутником", в их внутренние базы данных. Базы данных могут быть разных форматов, от Cronos до Oracle. Написать модули для переноса данных в базы ВСЕХ форматов не получится. Вы же не знаете, в какие таблицы и в какие поля таблиц нужно заносить данные. Однако, пользователи, умеющие программировать или имеющие знакомого программиста, могут сами сделать модуль для выгрузки данных в базу любого формата.


-- Vinni написал 22 февраля 2013 16:48

tungus1973 написал:
[q]
Написать модули для переноса данных в базы ВСЕХ форматов не получится.
[/q]


Ну почему же - есть стандарт текстового файла для импорта-экспорта в базы данных - CSV.

А для прямого чтения содержимого таблиц Paradox можно использовать утилиту командной строки PdxHakView - _ttp://pdxhak.sourceforge.net/ :wink:




-- Игорь Нежданов написал 22 февраля 2013 17:14
На самом деле функция экспорта в БД у СайтСпутника уже есть.
В настройках Рубрики (которую хотите экспортировать) указываете папку и формат экспортируемого файла (таблица). Результат по данной Рубрике будет выложен в указанную папку в табличной форме. Далее указываете вашей БД откуда импортировать данные и собственно всё.


-- Vinni написал 22 февраля 2013 21:41

Игорь Нежданов написал:
[q]
Результат по данной Рубрике будет выложен в указанную папку в табличной форме.
[/q]


То есть там уже CSV? Здорово! :good:


-- Алексей Мыльников написал 25 февраля 2013 15:52
Ещё одна логическая ВФ-функция.


Чтобы воспользоваться ею обновитесь до SiteSputnik 8.4.1.4.


Этот форум работает на скрипте Intellect Board
© 2004-2007, 4X_Pro, Объединенный Открытый Проект