Аналитическое вычитание

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Аналитическое вычитание
RSS

Аналитическое вычитание

<<Назад  Вперед>>Страницы: 1 2 * 3 4
Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Петряшову.

Озвученная Вами в утвердительной форме моя позиция о программере и ламерах является ошибочной. Я так не думаю.
По поводу пару раз заданного безответного вопроса, отвечаю: "Нет, не полагаю, что форумчане хотят подкинуть никому не нужную работу".
По поводу юзанья программой за свои деньги и бесплатных советов. Здесь мы наравных. Вы ее приобрели больше года назад. За это время в программу были добавлены новые функции, поставляемые и сопровождаемые совершенно бесплато.

По существу.
Недавно овладев операцией "Аналитическое объединение", Вы посчитали, что "Взятие разности" тоже весьма полезно на практике. Я считаю, что теоретически все отлично, плюс можно попиариться, но практического широкого применения не вижу, более того, пытался применять "Взятие разности" - не получал эффективных результатов.
Как только у Вас возникнет конкретный "несекретный" пример (или пример можно придумать), в котором требуется применить "Взятие разности", то выложите его здесь. Мы его выполним и оценим результаты. Если результаты будут плохими, поищем другой пример.

К сожалению, не все проходит гладко на практике. Например, (для этого специально только-что выложил версию 6.2.1.5, в которой приоткрыл более автоматизированный способ вычисления связей ФЛ и связей ЮЛ: "Подменю золотого ключика" - "Ассемблер" - "Связи объектов" - ... Внешне все выглядит привлекательно: вводятся анкетные данные ФЛ или ЮЛ и всё, - но практические примеры приносят слабоватые результаты (над анкетой можно еще, конечно, поработать). Применение ассемблера на пакетах tungus1973 значительно эффективнее. Повторюсь - это не готовая функция, а ее экспериментальный вариант. Возможно, в дальнейшем она будет удалена.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009

Alexei Mylnikov написал:
[q]
практического широкого применения не вижу
[/q]
Почему же? Я и ув.Искендер привели сразу два примера, когда выполнение "Аналитического вычитания" существенно(!), т.е. в 5-10 раз, экономит время поиска информации.

Решение задачи на 4000 тысячах ссылок КРАЙНЕ затруднительно! Лично я в таких случаях перехожу с СайтСпутника на "ручной" поиск (и это весьма обидно - отказываться от удобного инструмента!). Да, я соберу значительно меньше данных, но зато и времени потрачу не 3-4 дня, а гораздо меньше.

Реализация функции "Аналитическое вычитание" (АВ) легко сокращает те самые 3-4 дня до пары часов! А если ожидается такая экономия, то почему бы не автоматизировать этот процесс? Кроме того, реализовав "АВ" мы вновь приближаемся к принципу "Найти всё и с гарантией!"

Alexei Mylnikov написал:
[q]
пытался применять "Взятие разности" - не получал эффективных результатов
[/q]
А вот это мне не понятно - почему? Конечно, для поиска человека с уникальными фамилией и именем, например, Алишера Усманова, эта функция не очень нужна. А вот для поиска людей с распространенными фамилией и именем, когда мы имеем дело с массой однофамильцев - без АВ никуда не деться. По сути, при "ручном" поиске мы делаем то же самое - начинаем сочинять запросы с исключением ненужных результатов:

(Иванов /2 Алексей) -Федорович -Иванович -Кузьмич -Ильич...

Вот только не все поисковики поддерживают длинную строку запроса. Как раз в данном случае СайтСпутник вновь помог бы нам обойти ограничения поисковиков по длине строки!

Alexei Mylnikov написал:
[q]
Как только у Вас возникнет конкретный "несекретный" пример (или пример можно придумать), в котором требуется применить "Взятие разности", то выложите его здесь. Мы его выполним и оценим результаты. Если результаты будут плохими, поищем другой пример.
[/q]
Можем рассмотреть такой пример.
Объект интереса: Николай Андреевич Карамзин, житель Екатеринбурга, 30 лет.
Поиск в Яндексе по полным фамилии, имени и отчеству выдал 39 страниц, на которых упоминается этот человек.
Задача: Найти странички, на которых этот гражданин упоминается в сочетаниях - Николай Карамзин или Карамзин Николай (т.е. без отчества).
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
Да, я соберу значительно меньше данных
[/q]

tungus1973 написал:
[q]
мы вновь приближаемся к принципу "Найти всё и с гарантией!"
[/q]

Явное противоречие. Много информации будет потеряно.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Противоречия нет! :smile:

Первая цитата - речь шла о том, что меньше данных я соберу, если буду выполнять эту задачу без СайтСпутника, т.е. вручную.

Вторая цитата - речь шла о том, что если в СайтСпутнике будет реализована функция "АВ", то мы, тем самым, вновь приблизимся к принципу "Найти всё и с гарантией!"

С функцией "АВ" как раз потерь информации не будет, т.к. мы отсекаем заведомо лишнее, а всё сомнительное остаётся в собранных ссылках. Вот дальше мы перебираем эти ссылки вручную. Да, на это тоже уйдет некоторое время, но гораздо меньшее, чем перебирать все ссылки, собранные без вычитания!
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
Можем рассмотреть такой пример.
Объект интереса: Николай Андреевич Карамзин, житель Екатеринбурга, 30 лет.
Поиск в Яндексе по полным фамилии, имени и отчеству выдал 39 страниц, на которых упоминается этот человек.
Задача: Найти странички, на которых этот гражданин упоминается в сочетаниях - Николай Карамзин или Карамзин Николай (т.е. без отчества).
[/q]

Какие проекты (пакеты) Вы составите? Что из чего будете вычитать?
Судя по первому топику этой темы, Вам достаточно вычитания на двух проектах - если что, то каждый из них может быть получен путем АО из нескольких проектов.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009

Alexei Mylnikov написал:
[q]
Какие проекты (пакеты) Вы составите? Что из чего будете вычитать?
[/q]
1й пакет. Николай Карамзин. Бегло смотрим, какие тёзки повторяются часто.
2й пакет. Николай Михайлович Карамзин.
3й пакет. Николай Карамзин + (историк | писатель)
Затем выполняем "АВ" = "1й пакет" - "2й пакет" - "3й пакет"
При желании можно еще запустить:
4й пакет. Николай Николаевич Карамзин.
"АВ" = "АВ 1" - "4й пакет"
и т.д. пока не останется приемлемое количество ссылок.
Искендер
Администратор

Всего сообщений: 5925
Рейтинг пользователя: 43


Ссылка


Дата регистрации на форуме:
7 июня 2009
Я согласен с уважаемым tungus1973. То, что он описывает - значительно может облегчить поиск. Точнее - фильтрацию результатов. Возьмем, к примеру, губернатора Ненецкого автономного округа Игоря Федорова. Пример абсолютно с потолка, если что, и взят именно из-за распространенной фамилии и очень частого упоминания его имени в Интернете. Губер, все же, медийная персона. Если искать информацию о нем по полному ФИО - "Федоров Игорь Геннадьевич" - выборка будет довольно точной, но очень многое, где он упоминается только по ФИ - "Игорь Федоров" - в выдачу не попадет. Искать по ФИ - завалит "мусорными" ссылками. Для сравнения - по ФИО Гугл выдает 291 000 ссылок, а по ФИ - 1 350 000! Но, где-то среди этой разницы (1 350 000 - 291 000) - есть и полезная нам информация. Но как ее "достать"? Просмотреть весь массив? Понятно - там хватает дублей, их СС удалит, но и без них объем будет ого-го! Через "АВ" мы, действительно, могли бы (пошагово, к примеру, или пакетом) убрать "Сергеевичей", "Михайловичей", "Владимировичей", "Петровичей" и прочих не нужных нам Игорей Федоровых.

---
I`m not a Spy! I can do much better!
Информационные войны "под ключ"
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Искендер написал:
[q]
Через "АВ" мы, действительно, могли бы (пошагово, к примеру, или пакетом) убрать "Сергеевичей", "Михайловичей", "Владимировичей", "Петровичей" и прочих не нужных нам Игорей Федоровых.
[/q]

Да, согласен: это способ убрать из выдачи некоторые заведомо ненужные страницы, причем делать это можно "долго" и "упорно", чего на чистом Гугле не сделаешь, то есть можно добиться более точного результата.
Сделать ее реально.
Еще где-нибуть АВ может быть полезно?

Искендер
Администратор

Всего сообщений: 5925
Рейтинг пользователя: 43


Ссылка


Дата регистрации на форуме:
7 июня 2009

Alexei Mylnikov написал:
[q]

Искендер написал:
[q]
Через "АВ" мы, действительно, могли бы (пошагово, к примеру, или пакетом) убрать "Сергеевичей", "Михайловичей", "Владимировичей", "Петровичей" и прочих не нужных нам Игорей Федоровых.
[/q]
Да, согласен: это способ убрать из выдачи некоторые заведомо ненужные страницы, причем делать это можно "долго" и "упорно", чего на чистом Гугле не сделаешь, то есть можно добиться более точного результата. Сделать ее реально.Еще где-нибуть АВ может быть полезно?
[/q]

Думаю, что похожий пример смог бы привести уважаемый Дмитрий Петряшов. По какой-то товарной номенклатуре.

---
I`m not a Spy! I can do much better!
Информационные войны "под ключ"
petryashov
Администратор

Откуда: Москва
Всего сообщений: 480
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009

Искендер написал:
[q]
Думаю, что похожий пример смог бы привести уважаемый Дмитрий Петряшов. По какой-то товарной номенклатуре.
[/q]

Пара первых попавшихся примеров:

1. Если такая компания Legrand, а есть композитор Мишель Легран. Информации куча и по тому, и по тому. Мишель Легран мне не нужен, надо его "вычесть"

2. При мониторинге по слову GE (General Electric) находится масса грузинских сайтов, у которых домены заканчиваются на .ge. Соответственно, грузинские сайты тоже нужно отметать

И кстати, Алексей, можно ли сделать некой черный список тех сайтов, которые СайтСпутник должен обходить стороной? Например, выкинуть все или некоторые грузинские сайты или все или часть музыкальных сайтов, содержащих информацию о Мишеле Легране?
<<Назад  Вперед>>Страницы: 1 2 * 3 4
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Аналитическое вычитание
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS