Рубрики в СайтСпутник(е).

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Рубрики в СайтСпутник(е).
RSS

Рубрики в СайтСпутник(е).

  Вперед>>Страницы: 1 2 3 4 5 6 7 8 * 9 10
Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
    Обсуждали в переписке по e-mail с Tungus1973 опцию "Рубрицировать HTML-код".

    Реализовал эту опцию в SiteSputnik Pro+News версии 8.7.2 от 11.06.14.



    Назначение опции
    При её включении анализируется не текстовая составляющая документа, а весь его HTML-код (точнее его значимая часть).

    Если ключевые слова найдены в текстовой части документа, то они выделяются зеленоватым фоном, если в теге html-документа, то они (ключевые слова) выносятся за пределы тега и кроме подзеленения зачеркиваются (потому что их реально в содержании документа в этом месте нет).

    Рекомендуется применять эту опцию только в специальных случаях. Например:

      title /2 Кудрин - отфильтровать ссылки, внутри контента которых есть такой код: <A title="Алексей Кудрин" htef=...>...

      href= /1 (http://sitesputnik.ru/ | www.sitesputnik.ru) - есть обратная ссылка на сайт www.sitesputnik.ru или проще:
      href= /1 sitesputnik.ru

      можно просто искать какой-то тег, например: <noindex

    Следует помнить, что эта опция может изменить расстояние между словами, поскольку теги (они невидимы) могу стоять где угодно и в них бывают пробелы. Например, может быть:

    Алексей Кудрин - текст без Html: расстояние между словами 1 пробел,
    Алексей <b style="...">Кудрин</b> - соответствующий ему Html-код: расстояние между словами 2 пробела.

    Поэтому эту опцию рекомендуется применять только в специальных случаях с учетом всех особенностей HTML-кода

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    В SiteSputnik Pro+News версии 8.7.3.1 от 19.06.14 можно в Правилах рубрикации применить оператор &.

    Например, правило:

      Медведев & Кудрин Антон /1 Силуанов

    означает, что в контенте ссылки слова Медведев и Кудрин должны встретиться в одном предложении и в любом месте ссылки рядом должны ещё быть слова Антон и Силуанов.


Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Полезный оператор - спасибо!

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    В SiteSputnik Pro+News версии 8.8.7 от 30.03.15 можно в Правилах рубрикации применить оператор &&.

    Например, правило:

      Медведев && Кудрин Антон /2 Силуанов

    означает, что в контенте ссылки слова Медведев и Кудрин должны встретиться в одном абзацеи, а также в любом месте ссылки должны ещё быть слова Антон и Силуанов на расстоянии не более двух пробелов (одного слова).



    Пример из реальной жизни от Дмитрия из Владивостока:

      !индекс* /1 ('ММВБ' | 'MICEX') && (!максимум* | !плюсе* | !рост* | !подрос | !подн* | !выше | !прибавил | !повы* | !слабоповы*)
      !индекс* /1 ('ММВБ' | 'MICEX') && (!минимум* | !минус* | !пада* | !сниж* | !сниз* | !просел | !опустил* | 'негативное влияние')
      !индекс* /1 ('ММВБ' | 'MICEX') && (!отметк* | !район* | !пробил* | !поддержк* | !уров* | !предел* | !коррекц* | !сопротивлени*)

    Этo правило применяется для отслеживания трех ситуаций настроения рынка по индексу ММВБ:
    1. Движение ММВБ вверх.
    2. Движение ММВБ вниз.
    3. Боковое движение.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    В SiteSputnik Pro+News версии 8.8.7.3 от 13.04.15 можно в Правилах рубрикации применять скобочную структуру с любой глубиной вложенности (многоуровневая скобочная структура).
    Ранее была реализована только одноуровневая скобочная структура.

    Ранее можно было так:
      (Хорошавин | Сандаков) /5 (махинации | хищения | предъявлено /1 обвинение | предъявлены /1 доказательства)

    Теперь можно так:
      (Хорошавин | Сандаков) /5 (махинации | хищения | предъявлено /1 (обвинение | доказательства))


    Пример, из реальной практики:
      ((нормандская /1 (четверка | четвёрка)) | ( (Владимир /1 !Путин*) & (Ангела /1 Меркель) & (Франсуа /1 Олланд) & ((Петр | Пётр) /1 Порошенко)) ) ('НАТО' | Йенс /1 Столтенберг | 'США' | Барак* /1 Обам* )

    3-уровневая структура. Отслеживание информации по вопросу отношения США и НАТО, с одной стороны, и "нормандской четверки", с другой стороны.

    К слову будет сказано. Иногда правила Рубрикации, описывающие интересующую нас информацию, рационально снабдить комментариями. Здесь, также как и в пакетах запросов, можно применять комментарии. Всё, что правее ^^ - это комментарий. Пробельные строки в правилах рубрикации тоже допускаются. Они просто игнорируются.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Отлично! Рубрики СайтСпутника стали ещё более точными.
Теперь можно будет прописывать в рубриках меньшее число правил. Настройка рубрик станет более быстрой.
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Да - согласен - вложенные скобки позволяют делать более тонкую настройку.
Спасибо!

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Объекты в Рубриках (Объектное мышление)

    Доступно, начиная с версии SiteSputnik News 8.8.9 от 19.11.2015г.

    Объекты - это поставляемые вместе с программой или созданные Пользователями правила анализа контента ссылок.

    Объект может быть задан как логическое выражение, сформированное из обычных Правил, из Регулярных выражений, из Внешних функций.

    На картинке ниже показан способ выбора Объекта и Правило, составленное из них:



    Назначение приведенного на картинке Правила, содержащего три объекта следующее:

    Правилу удовлетворяют те ссылки, в контенте которых имеются и 10-значный номер телефона (любой), и адрес электронной почты (любой), и название Юридического лица (любого), и слова Москва или Московская область.

    Как видно по картинке, наименованию Объекта предшествует символ %.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Ещё про одну маленькую деталь забыл: Объекты для Рубрик могут быть вложенными. То есть, Вы можете прописать в теле Объекта другой Объект.

    Например, если для предыдущего примера Вы создадите Объект "Контакты" в таком виде:

    %Телефон10 %ПочтаЭлектронная %ЮЛ

    То вместо Правила:

    %Телефон10 %ПочтаЭлектронная %ЮЛ (Москва | Московская /1 область)

    можно будет написать:

    %Контакты (Москва | Московская /1 область)

    Глубина вложенности Объектов - произвольная. То есть, Объект "Контакты" может сам быть вложен в другой Объект. Следите за тем, чтобы не было зацикливаиия. Если не уследите, то СайтСпутник сообщит Вам об этом.



Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    В SiteSputnik Pro+News версии 8.9.2 от 04.02.16 добавлена рубрикация материалов, созданных в Word, Excel и Acrobat.

    Соответственно, материалы могут быть размещены в типах файлов DOC(x), RTF, XLS(x) и PDF.

    Структура документов сохраняется в значительной степени.


  Вперед>>Страницы: 1 2 3 4 5 6 7 8 * 9 10
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Рубрики в СайтСпутник(е).
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS