Мелочи

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Разработчик СайтСпутник, документация, где скачать »   Мелочи
RSS

Мелочи

Небольшие функции программы СайтСпутник, разного назначения

  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 * 10
Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 822
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Алексей Мыльников написал:
[q]
3. Пункт Искать по теме - в стадии проектирования.
[/q]
    В настоящий момент в SiteSputnik Pro версии 9.2.3 от 29.11.16 реализована чисто вспомогательная функция генерации Пакета запросов на основе выделенного абзаца или более длинного фрагмента текста.

    Принцип следующий. Как правило, предложение несет в себе какую-то смысловую нагрузку, соответственно, выделенный фрагмент текста разбивается на предложения, из которых составляются запросы. Запросы посылаются на новостные источники раздельно. Затем делается их "Аналитическое объединение", которое в начало выдачи поднимает ссылки, удовлетворяющие большему количеству запросов.

    Сгенерированный Пакет запросов перед выполнением предварительно показывается Пользователю, который может отредактирвать запросы и прописать их выполнение на других источниках.

    Для этапа поиска, думаю что это довольно-таки практичное решение. Другое дело - этап Рубрикации, который в этой функции не применяется.

    Обращение к данной функции следующее: подменю "Золотого ключика" - Поиск по выделенному тексту - Искать по теме - Сгенерировать Пакет запросов.


Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 822
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Приписать в выдаче к сниппету (ссылке) Источник и Запрос - новый параметр в Настройках, размещён на вкладке Pro.

    Название параметра говорит само за себя: Источник, в котором найден сниппет (ссылка) и запрос, при помощи которого он был найден, приписываются в конец сниппета.

    Этот параметр помогает понять какой Источник, по какому Запросу, какую информацию принес в выдачу. Полезено, когда Пакет запросов состоит из нескольких Источников и нескольких Запросов.

    Другими словами, он помогает "на месте" (не прокручивая выдачу, не заглядывая в Пакет запросов и Настройки) понять какие Источники и Запросы приносят нужную информацию, а какие нет.

    По умолчанию параметр выключен.

    Доступно в SiteSputnik Pro v.9.2.6 от 09.01.17 и выше.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 822
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Два новых параметра, размещены на вкладке +News:

    - Не выводить Правило попадания в Рубрику - в конец Рубрики не дописывается Правило, которому она удовлетворила. Бывает полезным, если Правило очень большое (например, больше самой новости или сообщения) и мешает просмотру результатов работы.

    - Не Рубрицировать офисные и другие не-html-файлы - офисные файлы иногда попадаются очень большие, например, книга на 600 страниц, соотвественно, обработка такого файла ресурсоёмкая, и если точно известно, что в файле не будет нужной информации, например, если "вычисляем" все интервью Трампа за 2016 год, то есть смысл применить этот параметр.

    Доступно в SiteSputnik Pro+News v.9.2.7.3 от 02.02.17 и выше.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 822
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
    Мониторинг страничек в Instagram

    В SiteSputnik News+WebSpider версии 9.3.2 от 20.02.17 добавлены средства мониторинга страничек из Инстаграм (внутрь100грамм).

    Прописать страничку из Инстаграм в Проекте можно следующим образом:

    %ИГ=https://www.instagram.com/mossobyanin/
    или
    https://www.instagram.com/mossobyanin/ +/p/


    Важное замечание.
    Т.к. в Инстаграм комментарии не оформляются отдельной ссылкой, а приписываются в ссылку, создаваемую при первом Посте, то для отслеживания новых комментариев, написанных после последнего выполнения Проекта, следует применить возможности модуля +WebSpiser, а именно, прописать в Проекте оператор ^^WebSpider;.
    В этом случае СайтСпутник будет сравнивать новые и предыдущие состояния ссылок, находить и выделять в них только новые комментарии и отправлять их на Рубрикацию.

    Пример небольшого Проекта для наблюдением сразу за 7 страничками из Инстаграм на предмет отслеживания новых сообщений и комментариев о "Масленице", "Днях рождениях" и "О полиции":


    %ИГ=https://www.instagram.com/alexei_mylnikov/
    %ИГ=https://www.instagram.com/mossobyanin/
    %ИГ=https://www.instagram.com/skyment/
    %ИГ=https://www.instagram.com/roman.romachev/
    %ИГ=https://www.instagram.com/tov.nachoperot/
    %ИГ=https://www.instagram.com/alex.mitrofanov/
    %ИГ=https://www.instagram.com/yushchuk/

    Рубрика://Праздники/Масленица
    Масленица | Масленница | !блины*

    Рубрика://Праздники/День Рождения
    День /1 рождения | Днюха

    Рубрика://МВД/О полиции
    Полиция | Милиция | !мент*

    ^^WebSpider;


    Результат работы на тему "Масленица" представлен на ссылке.
    В качестве одного из Правил попадания информации в Рубрику использовано: Масленница, на случай написания этого слова с грамматической ошибкой.


    Дополнительная информация.
    Если у Вас Internet Explorer 9 (IE 9), то обновите его до IE 11 из самого IE следующим образом: "Справка - Техническая поддержка - ...".

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 822
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Поиск новых Сайтов и Доменов 3-го уровня


    Список Ссылки новые уже сушествует давно.
    Он содержит только новые уникальные ссылки, которые не встречались ещё ни разу ни в одном из предыдущих выполнений Проекта (впервые найденные ссылки).

    Теперь к нему добавлены ещё два списка.

    Сайты новые (Домены 2-го уровня новые)

    Список "Сайты новые" содержит только впервые найденные сайты, то есть, те сайты, ссылки с которых ещё ни разу не были найдены ни в одном из предыдущих выполнений Проекта (Пакета запросов).

    Удобно, например, тогда, когда ищутся сайты, посвященные какой-то теме - Пользователю не придется повторно просматривать ранее найденные сайты.



    Домены 3-го уровня новые

    Список "Домены 3-го уровня новые" содержит только впервые найденные Домены 3-го уровня.

    Удобно, например, тогда, когда нужные темы находятся на таких cайтах как livejournal.com.


    Доступно, начиная с Site Sputnik версии 9.4.4 от 21.09.2017 г.


Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 822
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Сохранение в формате PDF, DOCX, RTF, TXT, MHT, HTM.



    Практически любой файл (Рубрику, Чистый поток, Объединение, Ссылки новые, ...) можно сохранить как документ в форматах, указанных в заголовке топика.

    Обращение: "Главное меню - Файлы - Сохранить как документ ..." (показано на картинке) или про нажатию правой кнопки мышки на нижней Табличке.

    Доступно, начиная с SiteSputnik 9.5.6 от 30.01.2018 г.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 822
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Работа со списками "Сайты новые" и "Домены 3-го уровня новые"


    В топике № 88 из этой темы (см. на два топика выше) сообщалось о создании списков "Сайты новые" (Домены 2-го уровня новые) и "Домены 3-го уровня новые", в которые попадают невстретившиеся (ненайденные) ранее ни разу при выполнении Проекта адреса Сайтов и Доменов 3-го уровня.

    Для удобства работы с этими списками сделаны следующее две функции.


    1. Вручную отправить на Рубрикацию (на модуль +News) ссылки из списков

    На картинке ниже красная и зеленая стрелочки показывают пункты меню, выбрав которые можно применить данную функцию:





    2. Прописать в Проекте работу с Сайтами новыми и Доменами 3-го уровня новыми

    Чтобы не запоминать и не набирать на клавиатуре соответствующий оператор, его можно выбрать так, как показано на картинке ниже:



    Если операторы: ^^Сайты новые; или ^^Домены 3-го уровня новые; применены в теле Проекта, то Рубрикация будет выполнена для ссылок их этих списков, то есть для главных страниц сайтов и доменов 3-го уровня, а не для ссылок из списка "Ссылки новые".

    Допускается применение обоих операторов в одном Проекте.

    Поскольку, в общем случае, для главных страниц сайтов и доменов 3-го уровня выделение значимого контента программным образом не представляется возможным и целесообразным, их текстовый контент в новостную ленту помещается полностью, соответственно, и Рубрикация будет сделана по их полному текстовому содержанию.


    Доступно, начиная с SiteSputnik News версии 9.4.7.1 от 27.02.2018 г.


Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 822
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Доступно в SiteSputnik 9.5.7.3 от 12.03.2018:

    • В "Чистом потоке" (напомню, ЧП - это полнотекстовая новостная лента, в которую попадают контенты всех ссылок, собранных в Проекте) СайтСпутник отмечает галочкой контенты ссылок, которые попали хотя бы в одну Рубрику.

    Соотвественно, непопавшие ни в одну Рубрику ссылки галочкой не отмечаются.


    • Время Рубрикации - добавлено в "Статистика по Источникам текущая" для каждого Источника.


    • Время поиска и время Рубрикации - точность измерения до микросекунд, а не до секунд как было ранее, иначе на некоторых Источниках при исследовании может возникнуть большая погрешность.


Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 822
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Прописка Ящика (папки), в котором выполняется Проект


      1. Статическая прописка.


      Например, если в текcте (в теле) Проекта написано:

      ^^Internet\Поиск в Интернете\СоцСети\Твиттер\Выборы


      то Проект всегда будет выполняться в явно указанном Ящике (папке).

      При этом Ящик уже должен существовать.



      2. Динамическая прописка.


      Например, если в текcте (в теле) Проекта написано:

      Internet://Поиск в Интернете/Объекты/Юрлица


      то Проект всегда будет выполняться в явно указанном Ящике (папке).

      При этом, если Ящик не существует, то он создастся.



      3. Прописка по умолчанию (применяется только при вызове СайтСпутника из других программ).


      Например, если:
      - Ящик в теле Проекта явно не прописан,
      - и Вы вызываете СайтСпутник из другой программы: внешний Планировщик, bat-файл, любая другая программа,
      - и вызываемый Проект размещен в файле Новости\Города и регионы\Сочи,
      то Проект выполнится в следующем Ящике:

      Internet://Поиск в Интернете/Новости/Города и регионы/Сочи


      Соответственно, если Ящик не существует, то он создастся.


    Чтобы не запоминать рассмотренные выше операторы, воспользуйтесь меню для выбора статических и динамических Ящиков:



    Доступно, начиная с SiteSputnik 9.5.8.1 от 20.03.2018 г.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 822
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Элементы мультимедиа в выдаче СайтСпутника

      Начиная с версии SiteSputnik 9.5.9 от 29.03.2018 г., элементы мультимедиа, встроенные в контенты ссылок и сниппетов, можно оставить в выдаче СайтСпутника: в Рубриках, в Чистых потоках, в списках "Ссылки новые", "Объединение" и некоторых других списках.

      Если предпочтительнее работать по-старому (без мультимедиа), то достаточно убрать галочку в: Настройка - Параметры - вкладка Общие - параметр "Сохранять адреса ссылок на изображения и другие мультимедиа" (см. картинку ниже):



  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 * 10
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Разработчик СайтСпутник, документация, где скачать »   Мелочи
RSS

Последние RSS
Онлайн-сервисы для Twitter
Коллекция для Twitter
Приложение Opera VPN закрывается
О работе разведки
Deep web и 11 поисковиков по нему
Об изначальной "лживости" любых документов
Обновление на блоге HRазведка
методическое пособие
Обработка информации из социальных сетей – широко распространенный метод сбора и
Вызов СайтСпутника из других программ
Обработка персональных данных из соцcетей
Одновременное внедрение опции распознавания лиц «ВКонтакте», «Одноклассниками» и
Полезный скрипт
Cистема мониторинга СМИ – «Катюша»
В будущем будет можно регистрировать компанию без офиса
ЗАКРЫТОСТЬ РОССИЙСКОГО БИЗНЕСА РАСТЕТ
«Скелеты в шкафу есть у каждого. Научитесь с ними работать, пока их не нашли кон
New citizens of Malta - searchable database for investigators and analysts
Study and comparison of the unique selling propositions (USPs) of free-to-use mu
Обновление на блоге HRazvedka

Самые активные 20 тем RSS
Онлайн-сервисы для Twitter
Коллекция для Twitter
Приложение Opera VPN закрывается