Версия для печати
- Форум Сообщества Практиков Конкурентной разведки (СПКР) http://forum.razved.info/
-- Приемы работы с программой СайтСпутник (SiteSputnik) http://forum.razved.info//index.php?f=38
--- Умеет ли СайтСпутник предсказывать будущее? http://forum.razved.info//index.php?t=1853
-- lukamud написал 25 мая 2011 7:16
Имеется некоторый список физических лиц. Количество несколько сотен. О каждом лице имеется информация, представленная в виде не структурированного текста, содержащего ФИО, род занятий, место работы, контакты, некоторые биографические данные.
Требуется наладить добывание и обработку информации о проведении публичных мероприятий и выделить из них мероприятия, возможно представляющие интерес для некоторого лица.
Пример. В тексте, характеризующем лицо содержится информация, что он является активным членом какой-то группы некой социальной сети. Проживает в городе N. В результате мониторинга получена информация, что в N члены группы планируют проведение какого-то мероприятия (митинг, выезд на природу, встречу и т.д.). Можно предположить, что рассматриваемое лицо появится на этой встрече.
Пример2. В тексте характеризующем лицо имеется информация о том, что он является владельцем крупной компьютерной фирмы. Проживает в городе М. В городе М проводится крупная компьютерная выставка. В сети имеется информация, что он несколько раз учавствовал в мероприятия по открытию и/или закрытию аналогичных мероприятий. Можно предположить, что лицо в очередной появится на выставке.
Результат хотелось бы получить в виде текста, таблицы и т.п. вида:
Ф.И.О
Название мероприятия №1
Дата проведения
Место проведения
…
Название мероприятия №K
Дата проведения
Место проведения
-- Игорь Нежданов написал 25 мая 2011 9:50
Вы описали последовательность действий. Что то можно переложить на соответсвующий софт. Но вот составлять "портрет" объекта и "портрет" возможного мероприятия придется в ручную. Есть программные решения, но они стоят немереных денег (от 300000 евро вроде и выше) , есть в РФ более бюджетный вариант - "Тренд" по моему называется. А если использовать СайтСпутник, то первичные действия нужно проделать в ручную (портреты), подключить соответствующие поисковики (сценарии) и составить нужный пакет и вперед. Собственно примерно тоже проделываю, но по отношению к организациям - где какая может вдруг поучаствовать.
-- Алексей Мыльников написал 25 мая 2011 12:49
Раз речь идет о предсказании будущего, а не исследовании прошлого, то я бы поступил так.
Подход А.
1. Подключил местные источники к SiteSputnik: СМИ, ЖЖ местных "активистов", форумы, спецсайты, группы в сетях, - в первую очередь RSS-потоки и страницы с новостями, где они есть.
2. Сделал три папки в Рубриках:
1-я "ФЛ" - для новостей, в которых упоминается ФЛ. В ней 100-200 вложенных папок о каждом ФЛ.
2-я "Мероприятия" - в ней несколько папок, заточенных под мероприятия: митинги, встречи, выезды на природу, тусовки.
3-я "Интересы" - компьютеры, байкеры, политические наклонности, ...
В Яндексе, Гугле, ... - ловить, на мой взгляд, нечего. Очень много информации. Единственно, что у великолепного Яндекса есть поиск по региону, - нужный регион можно подключить тоже.
Периодически выполнял бы поиск и смотрел в выдаче SiteSputnik список "Ссылка-Рубрики" (сейчас он называется "Ссылка-Правила"). Если в нем есть ссылки, которые попали в три рубрики, то их надо открывать и просматривать. Но, если речь идет о будущем, то этот список будет, как правило, пуст. Нужны дедуктивные правила, которые пока в СайтСпутнике не реализованы. Эти правила будут описывать взаимосвязи объектов и событий, попавших в Рубрики, и выявлять те явления, которые хотелось бы вычислить в первом сообщении, - как бы "додумывать", анализируя то, что попало в Рубрики при помощи дедуктивных правил.
Пока всё. Планирую делать дедуктивные правила, но, желательно, под реальную задачу.
Подход Б.
Обозначен во втором сообщении: через пакетные поиски, аналитическое объединение, получать вспомогательную базовую информацию и "доделывать" задачу вручную.
P.S.
У Нежданова, наверное, небольшая ошибка в цене упомянутого им ПО: к цифре 300 надо приписать ещё три нуля, причём справа.
-- lukamud написал 25 мая 2011 13:58
Игорь Нежданов написал:[q]
В, есть в РФ более бюджетный вариант - "Тренд" по моему называется. [/q]
Спасибо, а по-точнее название не припомните?
-- lukamud написал 25 мая 2011 13:59
Алексей Мыльников написал:[q]
Пока всё. Планирую делать дедуктивные правила, но, желательно, под реальную задачу.[/q]
Спасибо, подумаем, задача конкретная есть.
-- Игорь Нежданов написал 25 мая 2011 14:26
lukamud написал:[q]
Спасибо, а по-точнее название не припомните? [/q]
"Информационно-аналитическая система «Тренд»" (Разработка ООО “Вербин и Партнеры”) есть еще АРИАДНА+
Западные CASCON ; Фэкшенз (не помню как пишется)
-- Игорь Нежданов написал 25 мая 2011 21:13
Алексей Мыльников написал:[q]
к цифре 300 надо приписать ещё три нуля, причём справа. [/q]
Да - что то нули не нажались
- конечно 300000 евро.
-- lukamud написал 25 мая 2011 21:32
Игорь Нежданов написал:[q]
lukamud написал:[q]
Спасибо, а по-точнее название не припомните? [/q]
"Информационно-аналитическая система «Тренд»" (Разработка ООО “Вербин и Партнеры”) есть еще АРИАДНА+Западные CASCON ; Фэкшенз (не помню как пишется) [/q]
Спасибо.
Есть мысль для разработчиков ПО и др. продуктов. Название должно быть уникальным... Иначе Ваш труд найти будет очень сложно и это негативно отразится на выручке. Есть такая машинка "Nissan Almera", она интересна тем, что Nissan впервые при присвоении имени модели использовало искусственно синтезированное слово, к тому же не защищенное патентами третьих лиц. Поэтому рекомендую всем разработчикам следовать этому алгоритму, Вас быстрее найдут и купят Ваши продукты
СайтСпутник вполне удачное название. Но сравните выдачу в Google по правильному названию програмы и названию в котором вставлен пробел.
Этот форум работает на скрипте Intellect Board
© 2004-2007, 4X_Pro, Объединенный Открытый Проект