Версия для печати

-   Форум Сообщества Практиков Конкурентной разведки (СПКР) http://forum.razved.info/
--  Приемы работы с программой СайтСпутник (SiteSputnik) http://forum.razved.info//index.php?f=38
--- Вычисление связей объектов, увеличение релевантности поиска. http://forum.razved.info//index.php?t=154




-- Алексей Мыльников написал 1 июля 2009 8:05
Предположим, что Вы выполнили несколько запросов или пакетов запросов на заданную тему. Каждый из них принес свое множество ссылок. Операция "Аналитическое объединение" (далее АО) позволяет следующее (рассмотрим два основных ее свойства).
1. Составить объединенный список всех найденных ссылок без повторов.
2. Упорядочить этот список в порядке убывания количества запросов, нашедших конкретную ссылку. При этом для каждой ссылки в объединеном списке указывается перечень нашедших ее запросов.

С точки зрения пользователя, последнее свойство позволяет получить следующие два важных аналитических результата.
А. Вычисление связей искомых объектов.
Б. Увеличение релевантности поиска.

Понятия "искомый объект" и "запрос (пакет запросов)" взаимосвязаны: для того, чтобы найти ссылки, содержащие информацию об искомом объекте, составляются и выполняются запросы или пакеты запросов.

А. Вычисление связей объектов.
Под этим понимается следующее: используя АО, можно находить пересечение (упоминание) искомых объектов на одних вебстраницах (ссылках), ресурсах, папках, сайтах.
Например, если Вы ищите связь маркетолога Иванова А.А. из ООО "Спектр", таможенника Васнецова из Волгограда и директора ООО "Радуга", то собрав информацию о каждом из них и сделав операцию АО, можно получить в первых рядах те ссылки, на которых все три объекта пересекаются (упоминаются).
Для определения реальной связи объектов придется ознакомиться с содержанием ссылок, расположенных в начале списка.

Б. Увеличение релевантности поиска.
Под этим понимается упорядочивание найденных ссылок в порядке близком к их реальной значимости в обход искусственных уловок вебмастеров по продвижению "заказанной" информации вверх в выдаче поисковиков.
Например, если Вы собираете информацию о предприятии, зная название предприятия, ФИО и должности нескольких руководителей, стационарные и мобильные телефоны, электронные адреса и прочую информацию, то задав несколько десятков запросов и применив к ним АО, можно получить список ссылок, первые из которых содержат больше всего искомой информации. В данном случае уже не столь важно на какой позиции в поисковике находится ссылка с искомой информацией, важнее сколькими запросами эта ссылка была найдена.
Таким образом, увеличивается вероятность того, что в первых рядах списка АО будет именно та информация, которую Вы искали.

Подробнее на sitesputnik.ru/Help/SSEMail.htm и ci-razvedka.ru/SiteSputnik.html.


-- Алексей Мыльников написал 19 октября 2009 13:12
В версии 5.5.4.1 появился оператор:
^^АО;
Если его поставить последним в пакете, то операция "Аналитическое объединение" над результатами выполнения запросов из пакета выполнится автоматически.
В этом случае не надо помнить о том, какие действия следует произвести, чтобы выполнить "Аналитическое объединение".
Удобно при сборе информации на одну тему по нескольким запросам.



-- tungus1973 написал 19 октября 2009 14:05
К новой версии программы приложен пакет "Оптимальный поставщик", иллюстрирующий "Аналитическое объединение" и работу оператора ^^АО.
Пакет собирает ссылки на поставщиков товаров определенных наименований. По окончании поиска автоматически выполняется операция "Аналитическое объединение", в результате которой Вы получаете (в порядке снижения значимости):
- ссылки на рекламу поставщиков, предлагающих наибольший ассортимент;
- список доменов, на которых наиболее часто публикуется реклама нужных товаров.

Попробуйте пакет в работе и оцените красоту решения!

Спасибо Алексею Борисовичу за полезную функцию!


-- Алексей Мыльников написал 19 октября 2009 15:10

tungus1973 написал:
[q]
К новой версии программы приложен пакет "Оптимальный поставщик", иллюстрирующий "Аналитическое объединение" и работу оператора ^^АО;.
Пакет собирает ссылки на поставщиков товаров определенных наименований. По окончании поиска автоматически выполняется операция "Аналитическое объединение", в результате которой Вы получаете (в порядке снижения значимости):
- ссылки на рекламу поставщиков, предлагающих наибольший ассортимент;
- список доменов, на которых наиболее часто публикуется реклама нужных товаров.

Попробуйте пакет в работе и оцените красоту решения!
[/q]

Пакет работающий, но пока недоделан. Поэтому не анонсировал его. Назначение пакета - поиск оптимального поставщика. Критерием оптимальности является наличие в прайс-листе поставщика максимального количества наименований искомого товара, и не более того.



-- Алексей Мыльников написал 27 октября 2009 10:23
Начиная с версии SiteSputnik Pro 5.5.4.3, можно создавать пакеты по следующему шаблону.


^^Объект 1. Информация о нем собирается А запросами, а именно:
Запрос 11
Запрос 12
...
Запрос 1A
^^AO; Это выполнится Аналитическое объединение по А запросам для объекта 1 (соберутся уникальные ссылки)

^^Объект 2. Информация о нем собирается B запросами, а именно:
Запрос 21
Запрос 22
...
Запрос 2B
^^AO; Это выполнится Аналитическое объединение по B запросам для объекта 2

...

^^Объект N. Информация о нем собирается Z запросами, а именно:
Запрос N1
Запрос N2
...
Запрос NZ
^^AO; Это выполнится Аналитическое объединение по Z запросам для объекта N

^^AO+; Это выполнится Аналитическое объединение по N Аналитическим объединениям


Остается нажать на кнопку и дождаться окончания выполнения пакета, для того чтобы получить ссылки, на которых пересекаются (упоминаются) объекты 1, 2, ..., N.
В качестве объектов могут быть люди, фирмы, наименования товаров, документы, предметы ...

Здесь задействованы две новые операции, введенные для удобства применения и увеличения степени автоматизации поиска и сбора информации, а именно:
^^AO; - выполнить "Аналитическое объединение" над предшествующими запросами из пакета. О ней говорилось во 2-м топике.
^^AO+; - выполнить "Аналитическое объединение" над предшествующими "Аналитическими объединениями" из пакета.


-- petryashov написал 12 января 2013 15:19
Алексей, возник вопрос по отчетам по аналитическому объединению.

Можете разъяснить, в чем именно заключается различие между отчетами:

1. Ссылки
2. Папки
3. Ресурсы
4. Домены

И второй вопрос, что дает и как пользоваться отчетом "матрица"?. Я запустил три пакета и провел операцию АО. В результате получилась вот такая матрица (см. скриншот). Какую информацию из нее извлечь можно?


-- Алексей Мыльников написал 12 января 2013 20:14
Предположим Вы, собирая информацию по объекту, выполнили 30 разнообразных запросов, пакетов, проектов (далее просто запросов), например, сделали поиски по: ФИО, телефонам, мейлам, фирмам, персональным данным, ... По каждому такому отдельному однородному запросу СайтСпутник соберет ссылки, убрав дубли.

Можно в СайтСпутнике найденные ссылки из разнородных запросов просто объединить, выкинув дубли. Это объединение собранной по объекту информации. Здесь дублей ссылок нет, но всё в "куче".

Можно ссылки объединить, но выкидывая дубли, посчитать сколькими запросами каждая ссылка была найдена и в начало выдачи вывести ссылки, найденные наибольшим количеством запросов. Это в Программе SiteSputnik называется Аналитическим объединение собранной информации.

Отчет Ссылки содержит в каждой строке слева ссылку, а справа номера запросов, нашедших её. Вверху выданы ссылки, найденные самым большим количеством запросов. Далее по убыванию. (В выдаче СайтСпутника ещё есть список Объединение, "забытый" Петряшовым. Это тот же список Ссылки, только со сниппетами. Он менее наглядный, но более удобен и привычен для работы. В конце сниппета есть строка: "Найдена в:". В ней перечисляются запросы, которыми эта ссылка была найдена).

Отчет Папка - здесь слева папки сайтов, а справа номера всех запросов, которые в ней (в этой папке сайта) нашли ссылки.

Отчет Ресурсы - здесь слева ресурс (домен 3-го и более уровня), а справа номера всех запросов, которые на нем нашли ссылки.

Отчет Домен - здесь слева домен 2-го уровня, а справа номера всех запросов, которые на нем нашли ссылки.

Папка Матрицы - это больше для меня (для контроля). Показывает что "общего" у каждого запроса с каждым.

Все списки упорядочены по количеству запросов, нашедших для них информацию.

Переходя на язык математики, АО - это не просто объединение множества найденных в запросах ссылок, а объединение взвешенных ссылок. Вес и значимость ссылки - понятия взаимосвязанные.

Роль АО в получении релевантной выдачи, как правило, очень положительная. Наиболее релевантные ссылки будут вытолкнуты СайтСпутником наверх.

Другое приложение АО - это поиск связи объектов. Например, если мы выполним поиски по четырем объектам по "полной программе" (можно даже, применив АО), а потом проведем над ними операцию АО, то можем найти ссылки, на которых присутствуют все четыре объекта. Если они не присутствуют на одной ссылке, то смотрим папки: может быть объекты присутствуют где-то рядом на сайте. Также иногда могут помочь списки Ресурсы и Домены. Ссылки нужно открывать и смотреть, что конкретно на них написано.

АО, в прямом смысле этого слова, вычислит самые релевантные ссылки по решаемой задаче. Если её применяет квалифицированный Пользователь, то это только может помочь делу.


Этот форум работает на скрипте Intellect Board
© 2004-2007, 4X_Pro, Объединенный Открытый Проект