Версия для печати

-   Форум Сообщества Практиков Конкурентной разведки (СПКР) http://forum.razved.info/
--  Приемы работы с программой СайтСпутник (SiteSputnik) http://forum.razved.info//index.php?f=38
--- Умеет ли СайтСпутник предсказывать будущее? http://forum.razved.info//index.php?t=1853




-- lukamud написал 25 мая 2011 7:16
Имеется некоторый список физических лиц. Количество несколько сотен. О каждом лице имеется информация, представленная в виде не структурированного текста, содержащего ФИО, род занятий, место работы, контакты, некоторые биографические данные.

Требуется наладить добывание и обработку информации о проведении публичных мероприятий и выделить из них мероприятия, возможно представляющие интерес для некоторого лица.

Пример. В тексте, характеризующем лицо содержится информация, что он является активным членом какой-то группы некой социальной сети. Проживает в городе N. В результате мониторинга получена информация, что в N члены группы планируют проведение какого-то мероприятия (митинг, выезд на природу, встречу и т.д.). Можно предположить, что рассматриваемое лицо появится на этой встрече.

Пример2. В тексте характеризующем лицо имеется информация о том, что он является владельцем крупной компьютерной фирмы. Проживает в городе М. В городе М проводится крупная компьютерная выставка. В сети имеется информация, что он несколько раз учавствовал в мероприятия по открытию и/или закрытию аналогичных мероприятий. Можно предположить, что лицо в очередной появится на выставке.

Результат хотелось бы получить в виде текста, таблицы и т.п. вида:

Ф.И.О
Название мероприятия №1
Дата проведения
Место проведения


Название мероприятия №K
Дата проведения
Место проведения


-- Игорь Нежданов написал 25 мая 2011 9:50
Вы описали последовательность действий. Что то можно переложить на соответсвующий софт. Но вот составлять "портрет" объекта и "портрет" возможного мероприятия придется в ручную. Есть программные решения, но они стоят немереных денег (от 300000 евро вроде и выше) , есть в РФ более бюджетный вариант - "Тренд" по моему называется. А если использовать СайтСпутник, то первичные действия нужно проделать в ручную (портреты), подключить соответствующие поисковики (сценарии) и составить нужный пакет и вперед. Собственно примерно тоже проделываю, но по отношению к организациям - где какая может вдруг поучаствовать.


-- Алексей Мыльников написал 25 мая 2011 12:49
Раз речь идет о предсказании будущего, а не исследовании прошлого, то я бы поступил так.

Подход А.
1. Подключил местные источники к SiteSputnik: СМИ, ЖЖ местных "активистов", форумы, спецсайты, группы в сетях, - в первую очередь RSS-потоки и страницы с новостями, где они есть.
2. Сделал три папки в Рубриках:
1-я "ФЛ" - для новостей, в которых упоминается ФЛ. В ней 100-200 вложенных папок о каждом ФЛ.
2-я "Мероприятия" - в ней несколько папок, заточенных под мероприятия: митинги, встречи, выезды на природу, тусовки.
3-я "Интересы" - компьютеры, байкеры, политические наклонности, ...

В Яндексе, Гугле, ... - ловить, на мой взгляд, нечего. Очень много информации. Единственно, что у великолепного Яндекса есть поиск по региону, - нужный регион можно подключить тоже.

Периодически выполнял бы поиск и смотрел в выдаче SiteSputnik список "Ссылка-Рубрики" (сейчас он называется "Ссылка-Правила"). Если в нем есть ссылки, которые попали в три рубрики, то их надо открывать и просматривать. Но, если речь идет о будущем, то этот список будет, как правило, пуст. Нужны дедуктивные правила, которые пока в СайтСпутнике не реализованы. Эти правила будут описывать взаимосвязи объектов и событий, попавших в Рубрики, и выявлять те явления, которые хотелось бы вычислить в первом сообщении, - как бы "додумывать", анализируя то, что попало в Рубрики при помощи дедуктивных правил.

Пока всё. Планирую делать дедуктивные правила, но, желательно, под реальную задачу.

Подход Б.
Обозначен во втором сообщении: через пакетные поиски, аналитическое объединение, получать вспомогательную базовую информацию и "доделывать" задачу вручную.

P.S.
У Нежданова, наверное, небольшая ошибка в цене упомянутого им ПО: к цифре 300 надо приписать ещё три нуля, причём справа.


-- lukamud написал 25 мая 2011 13:58

Игорь Нежданов написал:
[q]

В, есть в РФ более бюджетный вариант - "Тренд" по моему называется.
[/q]

Спасибо, а по-точнее название не припомните?



-- lukamud написал 25 мая 2011 13:59

Алексей Мыльников написал:
[q]
Пока всё. Планирую делать дедуктивные правила, но, желательно, под реальную задачу.
[/q]

Спасибо, подумаем, задача конкретная есть.



-- Игорь Нежданов написал 25 мая 2011 14:26

lukamud написал:
[q]
Спасибо, а по-точнее название не припомните?
[/q]

"Информационно-аналитическая система «Тренд»" (Разработка ООО “Вербин и Партнеры”) есть еще АРИАДНА+

Западные CASCON ; Фэкшенз (не помню как пишется)


-- Игорь Нежданов написал 25 мая 2011 21:13

Алексей Мыльников написал:
[q]
к цифре 300 надо приписать ещё три нуля, причём справа.
[/q]

Да - что то нули не нажались :wonder1: - конечно 300000 евро. :crazy:


-- lukamud написал 25 мая 2011 21:32

Игорь Нежданов написал:
[q]

lukamud написал:
[q]
Спасибо, а по-точнее название не припомните?
[/q]
"Информационно-аналитическая система «Тренд»" (Разработка ООО “Вербин и Партнеры”) есть еще АРИАДНА+Западные CASCON ; Фэкшенз (не помню как пишется)
[/q]

Спасибо.

Есть мысль для разработчиков ПО и др. продуктов. Название должно быть уникальным... Иначе Ваш труд найти будет очень сложно и это негативно отразится на выручке. Есть такая машинка "Nissan Almera", она интересна тем, что Nissan впервые при присвоении имени модели использовало искусственно синтезированное слово, к тому же не защищенное патентами третьих лиц. Поэтому рекомендую всем разработчикам следовать этому алгоритму, Вас быстрее найдут и купят Ваши продукты :laugh:

СайтСпутник вполне удачное название. Но сравните выдачу в Google по правильному названию програмы и названию в котором вставлен пробел. :sad:


Этот форум работает на скрипте Intellect Board
© 2004-2007, 4X_Pro, Объединенный Открытый Проект