Рубрики в СайтСпутник(е).

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Рубрики в СайтСпутник(е).
RSS

Рубрики в СайтСпутник(е).

<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9
Печать
 
petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Если я принудительно нажимаю на "Загрузки", то перерубрикацию вообще не провести, этот пункт в меню, вызываемом нажатием правой кнопки мыши, неактивен (см. скриншот)

Прикрепленный файл (sitesputnik2.JPG, 106065 байт, скачан: 330 раз)
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Подробнее не могу. Могу только повторить всё в одном топике.

Встаньте не на материнскую, а на новую дочернюю Рубрику и перерубрицируйтесь. Проделайте это для каждой новой дочерней Рубрики. В настоящей версии при этом нужно у дочерней Рубрики снять галочку у параметра "Искать только в родительской", иначе в неё ничего не попадёт (на следующей неделе это устраню). После перерубрикации, если эта галочка нужна - установите её.

По перескоку. Да, Вы нажали на Рубрики и СайтСпутник к ним и перейдет. Так и должно быть. А как иначе?

Сначала встаньте не на "Ящик остальные"(его нельзя перерубрицировать - у него нет Правил, по которым информация попадает в Рубрики), а на те, что на картинке из топика #70 выше и относятся к новым, например, на "Контактор", если он новый и его надо перерубрицировать.

Да, если Вы перейдете в меню на "Загрузках" (картинка из топика #71), то пункт перерубрикации будет не доступен. Перерубрикация делается так: сначала выбирается Рубрика, которую Вы хотите перерубрицировть, затем нажимаете правую кнопку мышки и выбираете пункт: "Перерубрикация - Ссылки открытые - По всем строкам Ящика", затем идете к тому Яшику, по которому нужно сделать перерубрикацию (за материалом, на основе которого она делается). У вас это будет: "Ссылки открытые - Рубрики Ящик, где вы загрузили ссылки по этому проекту". То есть, Вы программе сказали: вот эту Рубрику я хочу перерубрицировать, а ссылки попадающие на Рубрикацию уже загружены и лежат вот в этом Ящике. Да, в этом случае выбирайте файл F1.

Повторюсь: не забудьте убрать галочку перед перерубрикацией у Рубрики "Контактор" (это можно устранить, но я это не предугадал при реализации задачи из топика #57).

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
В версии 8.5.2.2 от 17.05.13 сделано следующее:

1) не надо изменять параметр "Искать только в родительской" при перерубрикации,
2) изменен диалог выбора Ящиков, вложенных в "Ссылки открытые", по ссылкам которых проходит перерубрикация (без F1).

Замечание: выделение значимого контента ссылок при перерубрикации заблокировано по техническим причинам (требует очень тщательного анализа и тестирования). Перерубрикация проходит по полным контентам ссылок.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
В последней версии программы SiteSputnik в Правилах попадания в Рубрику можно применить следующие два оператора:
    inurl: и insource:

Например, Правило:
    Дмитрий /2 Медведев (inurl:twitter.com | inurl:comments | inurl:forum | insource:blogs)

означает, что в Рубрику попадет информация о Дмитрии Медведеве только с сайта twitter.com, или со ссылок, адреса которых содержат слово comments или forum, или название источника (см. последний оператор), содержит слово blogs.

Напомню, что название источника прописывается при его подключении в Мастере на третьей вкладке.

Сделано при реализации заявки Игоря Нежданова, связанной с потребностью разделения потока новостей, попадающих в Рубрики, на составные части такие как: СМИ, ИнформАгентства, Блоги, Микроблоги, Соцсети, Форумы, ПрофПорталы, ... в различных комбинациях. Для этих целей удобно саму тему описать в родительской рубрике, а в дочерних указать параметр "Искать только в родительской" и нужные операторы inurl: и insource:. Возможно, что найдется другое применение этих операторов.

Кроме разложения потока на составляющие, произойдет его упорядочивание по источникам. Порядок не алфавитный, а в соответствии с правилами из дочерних Рубриках.

Ограничение. Не реализовывал пока для этих операторов логическое "НЕ", например, ~inurl:news
Замечание от 22.10.13. В версии SiteSputnik 8.5.6.1 эту конструкцию применять можно, например, правило:

Оборонсервис ~inurl:war ~inurl:weapon ~inurl:arsenal.com/

означает, что содержащие информацию об Оборонсервисе новости, размещенные на ссылках, URL которых включает хотя бы одну из трех лексем не попадут в Рубрику.

Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Работает эффективно. Уже сейчас делю поток по нужному Объекту на составляющие (СМИ и СоцМедиа). По некоторым Объектам деление будет глубже - СМИ, ИнформАгентства, ПрофПорталы, Блоги, Соцсети, МикроБлоги, Форумы.

Составлю словарь-список соответствющих площадок (т.к. этот список довольно длинный) и использую в правилах именно отсылку к этому списку. Так удобнее.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
    Обсуждали в переписке по e-mail с Tungus1973 опцию "Рубрицировать HTML-код".

    Реализовал эту опцию в SiteSputnik Pro+News версии 8.7.2 от 11.06.14.



    Назначение опции
    При её включении анализируется не текстовая составляющая документа, а весь его HTML-код (точнее его значимая часть).

    Если ключевые слова найдены в текстовой части документа, то они выделяются зеленоватым фоном, если в теге html-документа, то они (ключевые слова) выносятся за пределы тега и кроме подзеленения зачеркиваются (потому что их реально в содержании документа в этом месте нет).

    Рекомендуется применять эту опцию только в специальных случаях. Например:

      title /2 Кудрин - отфильтровать ссылки, внутри контента которых есть такой код: <A title="Алексей Кудрин" htef=...>...

      href= /1 (http://sitesputnik.ru/ | www.sitesputnik.ru) - есть обратная ссылка на сайт www.sitesputnik.ru или проще:
      href= /1 sitesputnik.ru

      можно просто искать какой-то тег, например: <noindex

    Следует помнить, что эта опция может изменить расстояние между словами, поскольку теги (они невидимы) могу стоять где угодно и в них бывают пробелы. Например, может быть:

    Алексей Кудрин - текст без Html: расстояние между словами 1 пробел,
    Алексей <b style="...">Кудрин</b> - соответствующий ему Html-код: расстояние между словами 2 пробела.

    Поэтому эту опцию рекомендуется применять только в специальных случаях с учетом всех особенностей HTML-кода

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    В SiteSputnik Pro+News версии 8.7.3.1 от 19.06.14 можно в Правилах рубрикации применить оператор &.

    Например, правило:

      Медведев & Кудрин Антон /1 Силуанов

    означает, что в контенте ссылки слова Медведев и Кудрин должны встретиться в одном предложении и в любом месте ссылки рядом должны ещё быть слова Антон и Силуанов.


Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Полезный оператор - спасибо!

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    В SiteSputnik Pro+News версии 8.8.7 от 30.03.15 можно в Правилах рубрикации применить оператор &&.

    Например, правило:

      Медведев && Кудрин Антон /2 Силуанов

    означает, что в контенте ссылки слова Медведев и Кудрин должны встретиться в одном абзацеи, а также в любом месте ссылки должны ещё быть слова Антон и Силуанов на расстоянии не более двух пробелов (одного слова).



    Пример из реальной жизни от Дмитрия из Владивостока:

      !индекс* /1 ('ММВБ' | 'MICEX') && (!максимум* | !плюсе* | !рост* | !подрос | !подн* | !выше | !прибавил | !повы* | !слабоповы*)
      !индекс* /1 ('ММВБ' | 'MICEX') && (!минимум* | !минус* | !пада* | !сниж* | !сниз* | !просел | !опустил* | 'негативное влияние')
      !индекс* /1 ('ММВБ' | 'MICEX') && (!отметк* | !район* | !пробил* | !поддержк* | !уров* | !предел* | !коррекц* | !сопротивлени*)

    Этo правило применяется для отслеживания трех ситуаций настроения рынка по индексу ММВБ:
    1. Движение ММВБ вверх.
    2. Движение ММВБ вниз.
    3. Боковое движение.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    В SiteSputnik Pro+News версии 8.8.7.3 от 13.04.15 можно в Правилах рубрикации применять скобочную структуру с любой глубиной вложенности (многоуровневая скобочная структура).
    Ранее была реализована только одноуровневая скобочная структура.

    Ранее можно было так:
      (Хорошавин | Сандаков) /5 (махинации | хищения | предъявлено /1 обвинение | предъявлены /1 доказательства)

    Теперь можно так:
      (Хорошавин | Сандаков) /5 (махинации | хищения | предъявлено /1 (обвинение | доказательства))


    Пример, из реальной практики:
      ((нормандская /1 (четверка | четвёрка)) | ( (Владимир /1 !Путин*) & (Ангела /1 Меркель) & (Франсуа /1 Олланд) & ((Петр | Пётр) /1 Порошенко)) ) ('НАТО' | Йенс /1 Столтенберг | 'США' | Барак* /1 Обам* )

    3-уровневая структура. Отслеживание информации по вопросу отношения США и НАТО, с одной стороны, и "нормандской четверки", с другой стороны.

    К слову будет сказано. Иногда правила Рубрикации, описывающие интересующую нас информацию, рационально снабдить комментариями. Здесь, также как и в пакетах запросов, можно применять комментарии. Всё, что правее ^^ - это комментарий. Пробельные строки в правилах рубрикации тоже допускаются. Они просто игнорируются.

<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Рубрики в СайтСпутник(е).
RSS

Последние RSS
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st
Историческое. Агентурная разведка
Open Source Intelligence (OSINT) Tools and Resources Handbook
Top tips on gathering information about companies by using free online sources
Новое на блоге HRразведка
Безопасность данных в MS Access
Слово как улика
20 Recon and Intel Gathering Tools used by InfoSec Professionals
What’s Changed?
10 альтернативных поисковиков
Ситуационный центр главы Республики Коми
Развёртывание ситуационных центров на базе технологии Avalanche
Как принимать сложные решения. Советы бывшего оперативника ЦРУ.
Открытая информация о "Новичке" из сети интернет.
Ген. директор "ОЗХО" Ахмет Узюмдж о "Новичке" и хим. атаке в Сирии
Онлайн-сервисы для Twitter
Коллекция для Twitter
Приложение Opera VPN закрывается

Самые активные 20 тем RSS
Новости блогов
Не все VPN-сервисы одинаково полезны