Рубрики в СайтСпутник(е).

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Рубрики в СайтСпутник(е).
RSS

Рубрики в СайтСпутник(е).

  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 10
Печать
 
petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Если я принудительно нажимаю на "Загрузки", то перерубрикацию вообще не провести, этот пункт в меню, вызываемом нажатием правой кнопки мыши, неактивен (см. скриншот)

Прикрепленный файл (sitesputnik2.JPG, 106065 байт, скачан: 358 раз)
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Подробнее не могу. Могу только повторить всё в одном топике.

Встаньте не на материнскую, а на новую дочернюю Рубрику и перерубрицируйтесь. Проделайте это для каждой новой дочерней Рубрики. В настоящей версии при этом нужно у дочерней Рубрики снять галочку у параметра "Искать только в родительской", иначе в неё ничего не попадёт (на следующей неделе это устраню). После перерубрикации, если эта галочка нужна - установите её.

По перескоку. Да, Вы нажали на Рубрики и СайтСпутник к ним и перейдет. Так и должно быть. А как иначе?

Сначала встаньте не на "Ящик остальные"(его нельзя перерубрицировать - у него нет Правил, по которым информация попадает в Рубрики), а на те, что на картинке из топика #70 выше и относятся к новым, например, на "Контактор", если он новый и его надо перерубрицировать.

Да, если Вы перейдете в меню на "Загрузках" (картинка из топика #71), то пункт перерубрикации будет не доступен. Перерубрикация делается так: сначала выбирается Рубрика, которую Вы хотите перерубрицировть, затем нажимаете правую кнопку мышки и выбираете пункт: "Перерубрикация - Ссылки открытые - По всем строкам Ящика", затем идете к тому Яшику, по которому нужно сделать перерубрикацию (за материалом, на основе которого она делается). У вас это будет: "Ссылки открытые - Рубрики Ящик, где вы загрузили ссылки по этому проекту". То есть, Вы программе сказали: вот эту Рубрику я хочу перерубрицировать, а ссылки попадающие на Рубрикацию уже загружены и лежат вот в этом Ящике. Да, в этом случае выбирайте файл F1.

Повторюсь: не забудьте убрать галочку перед перерубрикацией у Рубрики "Контактор" (это можно устранить, но я это не предугадал при реализации задачи из топика #57).

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
В версии 8.5.2.2 от 17.05.13 сделано следующее:

1) не надо изменять параметр "Искать только в родительской" при перерубрикации,
2) изменен диалог выбора Ящиков, вложенных в "Ссылки открытые", по ссылкам которых проходит перерубрикация (без F1).

Замечание: выделение значимого контента ссылок при перерубрикации заблокировано по техническим причинам (требует очень тщательного анализа и тестирования). Перерубрикация проходит по полным контентам ссылок.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
В последней версии программы SiteSputnik в Правилах попадания в Рубрику можно применить следующие два оператора:
    inurl: и insource:

Например, Правило:
    Дмитрий /2 Медведев (inurl:twitter.com | inurl:comments | inurl:forum | insource:blogs)

означает, что в Рубрику попадет информация о Дмитрии Медведеве только с сайта twitter.com, или со ссылок, адреса которых содержат слово comments или forum, или название источника (см. последний оператор), содержит слово blogs.

Напомню, что название источника прописывается при его подключении в Мастере на третьей вкладке.

Сделано при реализации заявки Игоря Нежданова, связанной с потребностью разделения потока новостей, попадающих в Рубрики, на составные части такие как: СМИ, ИнформАгентства, Блоги, Микроблоги, Соцсети, Форумы, ПрофПорталы, ... в различных комбинациях. Для этих целей удобно саму тему описать в родительской рубрике, а в дочерних указать параметр "Искать только в родительской" и нужные операторы inurl: и insource:. Возможно, что найдется другое применение этих операторов.

Кроме разложения потока на составляющие, произойдет его упорядочивание по источникам. Порядок не алфавитный, а в соответствии с правилами из дочерних Рубриках.

Ограничение. Не реализовывал пока для этих операторов логическое "НЕ", например, ~inurl:news
Замечание от 22.10.13. В версии SiteSputnik 8.5.6.1 эту конструкцию применять можно, например, правило:

Оборонсервис ~inurl:war ~inurl:weapon ~inurl:arsenal.com/

означает, что содержащие информацию об Оборонсервисе новости, размещенные на ссылках, URL которых включает хотя бы одну из трех лексем не попадут в Рубрику.

Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Работает эффективно. Уже сейчас делю поток по нужному Объекту на составляющие (СМИ и СоцМедиа). По некоторым Объектам деление будет глубже - СМИ, ИнформАгентства, ПрофПорталы, Блоги, Соцсети, МикроБлоги, Форумы.

Составлю словарь-список соответствющих площадок (т.к. этот список довольно длинный) и использую в правилах именно отсылку к этому списку. Так удобнее.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
    Обсуждали в переписке по e-mail с Tungus1973 опцию "Рубрицировать HTML-код".

    Реализовал эту опцию в SiteSputnik Pro+News версии 8.7.2 от 11.06.14.



    Назначение опции
    При её включении анализируется не текстовая составляющая документа, а весь его HTML-код (точнее его значимая часть).

    Если ключевые слова найдены в текстовой части документа, то они выделяются зеленоватым фоном, если в теге html-документа, то они (ключевые слова) выносятся за пределы тега и кроме подзеленения зачеркиваются (потому что их реально в содержании документа в этом месте нет).

    Рекомендуется применять эту опцию только в специальных случаях. Например:

      title /2 Кудрин - отфильтровать ссылки, внутри контента которых есть такой код: <A title="Алексей Кудрин" htef=...>...

      href= /1 (http://sitesputnik.ru/ | www.sitesputnik.ru) - есть обратная ссылка на сайт www.sitesputnik.ru или проще:
      href= /1 sitesputnik.ru

      можно просто искать какой-то тег, например: <noindex

    Следует помнить, что эта опция может изменить расстояние между словами, поскольку теги (они невидимы) могу стоять где угодно и в них бывают пробелы. Например, может быть:

    Алексей Кудрин - текст без Html: расстояние между словами 1 пробел,
    Алексей <b style="...">Кудрин</b> - соответствующий ему Html-код: расстояние между словами 2 пробела.

    Поэтому эту опцию рекомендуется применять только в специальных случаях с учетом всех особенностей HTML-кода

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    В SiteSputnik Pro+News версии 8.7.3.1 от 19.06.14 можно в Правилах рубрикации применить оператор &.

    Например, правило:

      Медведев & Кудрин Антон /1 Силуанов

    означает, что в контенте ссылки слова Медведев и Кудрин должны встретиться в одном предложении и в любом месте ссылки рядом должны ещё быть слова Антон и Силуанов.


Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Полезный оператор - спасибо!

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    В SiteSputnik Pro+News версии 8.8.7 от 30.03.15 можно в Правилах рубрикации применить оператор &&.

    Например, правило:

      Медведев && Кудрин Антон /2 Силуанов

    означает, что в контенте ссылки слова Медведев и Кудрин должны встретиться в одном абзацеи, а также в любом месте ссылки должны ещё быть слова Антон и Силуанов на расстоянии не более двух пробелов (одного слова).



    Пример из реальной жизни от Дмитрия из Владивостока:

      !индекс* /1 ('ММВБ' | 'MICEX') && (!максимум* | !плюсе* | !рост* | !подрос | !подн* | !выше | !прибавил | !повы* | !слабоповы*)
      !индекс* /1 ('ММВБ' | 'MICEX') && (!минимум* | !минус* | !пада* | !сниж* | !сниз* | !просел | !опустил* | 'негативное влияние')
      !индекс* /1 ('ММВБ' | 'MICEX') && (!отметк* | !район* | !пробил* | !поддержк* | !уров* | !предел* | !коррекц* | !сопротивлени*)

    Этo правило применяется для отслеживания трех ситуаций настроения рынка по индексу ММВБ:
    1. Движение ММВБ вверх.
    2. Движение ММВБ вниз.
    3. Боковое движение.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    В SiteSputnik Pro+News версии 8.8.7.3 от 13.04.15 можно в Правилах рубрикации применять скобочную структуру с любой глубиной вложенности (многоуровневая скобочная структура).
    Ранее была реализована только одноуровневая скобочная структура.

    Ранее можно было так:
      (Хорошавин | Сандаков) /5 (махинации | хищения | предъявлено /1 обвинение | предъявлены /1 доказательства)

    Теперь можно так:
      (Хорошавин | Сандаков) /5 (махинации | хищения | предъявлено /1 (обвинение | доказательства))


    Пример, из реальной практики:
      ((нормандская /1 (четверка | четвёрка)) | ( (Владимир /1 !Путин*) & (Ангела /1 Меркель) & (Франсуа /1 Олланд) & ((Петр | Пётр) /1 Порошенко)) ) ('НАТО' | Йенс /1 Столтенберг | 'США' | Барак* /1 Обам* )

    3-уровневая структура. Отслеживание информации по вопросу отношения США и НАТО, с одной стороны, и "нормандской четверки", с другой стороны.

    К слову будет сказано. Иногда правила Рубрикации, описывающие интересующую нас информацию, рационально снабдить комментариями. Здесь, также как и в пакетах запросов, можно применять комментарии. Всё, что правее ^^ - это комментарий. Пробельные строки в правилах рубрикации тоже допускаются. Они просто игнорируются.

  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 10
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Рубрики в СайтСпутник(е).
RSS

Последние RSS
SiteSputnik. Об одном подходе к мониторингу Телеграм
Безопасность при работе на ПК
Книги о критическом мышлении
Наказывать за вмешательство в частную жизнь, Верховный суд
CI Academic Materials
CiMi.CON Evolution USA
Поиск в КЭШ поисковиков по запросу и пакету запросов
СайтСпутник: Многоязычность, Юникод, MS ACCESS
Новый курс OSINT от АИС
Год тюрьмы за отказ удалять
Книга "Строим доверие по методикам спецслужб"
аналог "Консультанта" о зарубежном законодательстве
Открытые данные ФНС
Получаем информацию по VIN
Competitive-Market Intelligence Conference, Berlin 2018
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st
Историческое. Агентурная разведка
Open Source Intelligence (OSINT) Tools and Resources Handbook

Самые активные 20 тем RSS