Поиск плагиата, отслеживание упоминаний своих публикаций

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Программируем пакеты СайтСпутника (для продвинутых юзеров) »   Поиск плагиата, отслеживание упоминаний своих публикаций
RSS

Поиск плагиата, отслеживание упоминаний своих публикаций

<<Назад  Вперед>>Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Используя пакеты запросов, можно систематически просматривать открытые источники интернета на предмет появления в них упоминаний Ваших публикаций и плагиата из Ваших материалов. Пакеты "похожи" друг на друга. Начну с отслеживания публикаций, хотя второй пакет мне кажется предпочтительнее и может быть задействован для обеих целей.

    • A. Поиск упоминаний публикаций.

      Предлагаемый подход к отслеживаю упоминаний Ваших публикаций обладает следующими особенностями:
      а)отслеживаются сразу все публикации,
      б)их поиск осуществляется сразу при помощи нескольких поисковиков,
      в)можно дополнительно подключить поиск по своим специальным источникам,
      г)дубли ссылок, найденных при поиске, будут удаляться,
      д)дубли ссылок, найденных в предыдущих поисках, будут так же удаляться,
      е)действия из а) - д) осуществляются по "одному нажатию кнопки",
      ё)при выходе новых публикаций, Вам достаточно добавить их названия в пакет, - можно в его начало.

      Пользователям, имеющим опыт работы с пакетами программы SiteSputnik, достаточно ознакомиться с п.3, 7 и 8.
      Для начинающих пользователей привожу всю последовательность действий для организации Вашей работы.
      Эти действия выполняются только один раз. Далее работает принцип "одной кнопки".

        1. Создайте в БД "Поиск в интернете" вложенную папку с именем, например, "Публикации".
        2. Создайте текстовый файл с именем, например, "Мои публикации". Можно прямо на рабочем столе.
        3. В него поместите названия Ваших публикаций или тех публикаций, упоминания которых Вы хотите отслеживать.
        Я использую следующий пакет запросов для отслеживания публикаций (своих и на 100%, посвященных СайтСпутнику, других авторов):

          +++"SiteSputnik. Что дает эта программа, зачем мне это нужно"
          +++"SiteSputnik. Простой запрос, пакет запросов, аналитическое объединение"
          +++"SiteSputnik. Сравнительный анализ поисковиков"
          +++"SiteSputnik: итоги развития программы за 2010 год"

          +++"SiteSputnik. Пакеты с параметрами - суть вопроса"
          +++"SiteSputnik. Запросы и пакеты запросов с параметрами"
          +++"SiteSputnik. Сборник типовых поисковых программ"

          +++"SiteSputnik. Ассемблеры: сборка сложного поискового задания"
          +++"SiteSputnik. Ассемблеры: инструкция по применению" +Петров
          +++"SiteSputnik. Планировщик задач: выполнение работ по расписанию"
          +++"SiteSputnik. Формирование, объединение и пересечение потоков информации"

          +++"SiteSputnik News. Основа информационного обеспечения предприятия"
          +++"SiteSputnik News. Как организовать мониторинг потоков информации"
          +++"SiteSputnik. Мониторинг электронных СМИ и новостных источников"
          +++"SiteSputnik. Рубрики: применение в мониторинге СМИ и новостных источников"
          +++"SiteSputnik. Мониторинг интернет-ресурсов"

          +++"SiteSputnik Station. Создание сети коллективного сбора, мониторинга и анализа информации"
          +++"SiteSputnik Station. Круглосуточный мониторинг сайтов с использованием нескольких компьютеров"

          +++"SiteSputnik. Карта сайта sitesputnik.ru, построенная автоматически"
          +++"SiteSputnik. Построение веб-карты сайта, ресурса и искомого объекта"
          +++"SiteSputnik. Невидимый интернет. Поиск невидимых ссылок, папок и файлов"
          +++"СайтСпутник, как инструмент Интернет-разведки"

          +++"SiteSputnik. Мастер подключения новых поисковиков, поисковых и других страниц сайтов, RSS-потоков"
          +++"SiteSputnik. Экспорт-импорт поисковиков и сценариев поиска"

          +++"SiteSputnik. Универсальный поиск"
          +++"SiteSputnik. Процедурный поиск в интернете"
          +++"SiteSputnik. Поиск кэш-копий ссылок в основных поисковиках"
          +++"SiteSputnik. Закон аддитивности и его нарушение в основных поисковиках"
          +++"SiteSputnik. Поиск оптимального поставщика нескольких наименований товара"
          +++"SiteSputnik. Как наиболее полно скачать содержание сайта"
          +++"SiteSputnik. Работа с найденными ссылками"
          +++"SiteSputnik. Инструменты, сервис, опции, настройки"
          +++"SiteSputnik. SEO функции для определения рейтинга сайтов в поисковиках"
          +++"FragmentsFromFiles. Работа с файлами и фрагментами из файлов"

          +++"SiteSputnik. Сбор контактной информации"

          +++"Руководство начинающего пользователя". +Ларина
          +++"Профессиональный поиск в Интернете с помощью пакетов и ассемблеров СайтСпутника"

          +++"Инновации в бизнес-разведке"
          +++"Швейцарский ножик Алексея Мыльникова"
          +++"Полевые испытания программы СайтСпутник" +Ющук
          +++"Сбор и хранение маркетинговой информации при помощи программы SiteSputnik" +Петряшов
          +++"СайтСпутник - новые горизонты" +Нежданов
          +++"Язык как мулета" +Голубицкий
          +++"Коллективно-аналитический пиар" +Голубицкий
          +++"Лучшее поисковое решение для конкурентной разведки в 2008"
          +++"FileForFiles & SiteSputnik: Найти Все и с Гарантией" +РОПКР
          +++"Программа SiteSputnik на сайте 100 брендов"
          +++"Программа SiteSputnik в живом журнале"


        По умолчанию эти 50 запросов СайтСпутник посылает на 7 поисковиков на глубину поиска, прописанную в "Настройке поиска".
        Полученный единый результат не содержит ни одного дубля ссылки как из-за того, что использовались 7 поисковиков, так и из-за того, что одновременно выполнилось 50 запросов. "Внешне" для пользователя это выглядит так, как будто Вы отправили один запрос на один поисковик, имя которого метапоиск.

        4. Если у Вас в папке "Condition Files" нет вложенной папки, то создайте её и назовите как угодно, например, "Мои пакеты".
        5. Поместите в созданную папку "Мои пакеты" Ваш пакет "Мои публикации".
        6. Периодически выполняйте его в БД, созданной в пункте 1. Выбор пакета по "Золотому ключику", кнопка "Пакет", "Обзор", папка "Мои пакеты", файл "Мои публикации", кнопка выпонить "Совместно".


      Пояснения
      7. Первое выполнение пакета, скорее всего, принесёт много ссылок. Они будут собраны в списке "Объединение". Их желательно изучить.
      В следующих выполнениях пакета Вас будет интересовать только список "Новые" . В него будут попадать только те ссылки, которые не были найдены в предыдущих поисках. В частности, не будет ссылок с Вашего сайта, где упомянуты Ваши же источники, поэтому применять операторы вида "-site:вашсайт.ru" совсем необязательно.
      На изучение списка "Новые" уже будет уходить совсем немного времени.

      8. Какие можно придумать усовершенствования.
      1)Можно (иногда и нужно) укоротить названия Ваших публикаций, оставив одну ключевую фразу из него. Можно опытным путем изучить, как поисковики "реагируют" на Ваш запрос, а затем наиболее удачный вариант включить в пакет. Абсолютно не обязательно в пакет вводить заголовки (названия) публикаций. Можно взять из текста публикации какую-то ключевую фразу, можно взять несколько фраз из одной публикации, каждая из которых будет отдельным запросом.
      2)В каких-то публикациях можно добавить фамилии авторов, чтобы отсечь мусор.
      3)Если у Вас есть кроме основных поисковиков другие источники, в которых могут появиться упоминанания Ваши публикаций, то подключите их к программе и пакету.
      4)Можно добавить что-то ещё, например, упоминание Вашего сайта, принадлежащей Вам фирмы, её телефоны, ... - как в запрос для его уточнения, так и в виде отдельного запроса.
      5)Можно на основе Вашего пакета создать пакет с параметрами, в котором прописать, например, глубину поиска.
      6)Можно вместо трёх плюсов, требующих присутствие в сниппете поисковой фразы и увеличивающей точность за счет уменьшения полноты поиска, поставить один плюс.
      7)можно отправить запросы не на метапоиск, а используя особенности языка запросов каждого источника, составить пакет, в котором каждый запрос будет выполняться на конкретном источнике и только на нём.
      8)можно запросы выполнить раздельно, а затем применить операцию "Аналитическое объединение", чтобы определить те страницы, на которых упомянуто больше всего Ваших публикаций.
      9)И так далее и тому подобное, подумайте сами и следуйте рекомендации Александра Кузина, отметившего, что СайтСпутник - это "уникальный продукт, дающий в руки ищущему, добывающему и анализирующему информацию специалисту огромные возможности".

      Для описанных действий достаточно иметь вариант программы SiteSputnik Pro.

    • Б. Поиск плагиата

      6)Каждый пользователь для себя может подумать и усовершенствовать этот пакет для поиска плагиата из своих материалов.
      Для этого следует "тонко" подобрать ключевые фразы из Ваших публикаций и регулярно мониторить их появление в открытых источниках интернета при помощи пакета, составленного по тем же принципам, что и приведенный выше пакет.

      Как только у Вас появятся новые публикации, достаточно будет добавить в пакет запросов ключевые фразы из них.
      Количество искомых фраз теоретически неограничено.

    P.S.

    В вариантах программы SiteSputnik News и разрабатываемом SiteSputnik Station пакетный поиск по Вашим источникам присутствует как одна из составляющих при формировании новостного потока, содержащего нужную Вам информацию, в частности, подключение в пакет поиска на заданную глубину по нужным ключевым словам в Яндекс.Новостях+Гугль.Новости+Яху.Новости+Рамблер.Новости - в некоторых случаях обеспечивает добычу практически всех интересующих новостей из федеральных источников информации.

Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009

Алексей Мыльников написал:
[q]
Каждый пользователь для себя может подумать и усовершенствовать этот пакет для поиска плагиата из своих материалов.
Для этого следует "тонко" подобрать ключевые фразы из Ваших публикаций и регулярно мониторить их появление в открытых источниках интернета при помощи пакета, составленного по тем же принципам, что и приведенный выше пакет.
[/q]

Можно "принудительно" вводить в свои публикации специфические (уникальные) обороты, которые в последствии и отслеживать. Главное чтобы они были "в тему".

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Игорь Нежданов написал:
[q]
Можно "принудительно" вводить в свои публикации специфические (уникальные) обороты, которые в последствии и отслеживать. Главное чтобы они были "в тему".
[/q]

Можно ещё умышленно какую то короткую фразу или два-три ключевых слова в паре мест публикации набирать и на русском, и на английском регистре. Яндекс - это распознавал, где-то год назад проверял, а Google и другие поисковики принимали такие слова как новые. Тогда, если текст не перенабирался вручную, то его можно попытаться найти.

<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Программируем пакеты СайтСпутника (для продвинутых юзеров) »   Поиск плагиата, отслеживание упоминаний своих публикаций
RSS

Последние RSS
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st
Историческое. Агентурная разведка
Open Source Intelligence (OSINT) Tools and Resources Handbook
Top tips on gathering information about companies by using free online sources
Новое на блоге HRразведка
Безопасность данных в MS Access
Слово как улика
20 Recon and Intel Gathering Tools used by InfoSec Professionals
What’s Changed?
10 альтернативных поисковиков
Ситуационный центр главы Республики Коми
Развёртывание ситуационных центров на базе технологии Avalanche
Как принимать сложные решения. Советы бывшего оперативника ЦРУ.
Открытая информация о "Новичке" из сети интернет.
Ген. директор "ОЗХО" Ахмет Узюмдж о "Новичке" и хим. атаке в Сирии
Онлайн-сервисы для Twitter
Коллекция для Twitter
Приложение Opera VPN закрывается

Самые активные 20 тем RSS
Новости блогов
Не все VPN-сервисы одинаково полезны