Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » Умеет ли СайтСпутник предсказывать будущее? |
<<Назад Вперед>> | Печать |
lukamud
Долгожитель форума
Всего сообщений: 494 Рейтинг пользователя: 8 Ссылка Дата регистрации на форуме: 15 окт. 2010 |
Имеется некоторый список физических лиц. Количество несколько сотен. О каждом лице имеется информация, представленная в виде не структурированного текста, содержащего ФИО, род занятий, место работы, контакты, некоторые биографические данные. Требуется наладить добывание и обработку информации о проведении публичных мероприятий и выделить из них мероприятия, возможно представляющие интерес для некоторого лица. Пример. В тексте, характеризующем лицо содержится информация, что он является активным членом какой-то группы некой социальной сети. Проживает в городе N. В результате мониторинга получена информация, что в N члены группы планируют проведение какого-то мероприятия (митинг, выезд на природу, встречу и т.д.). Можно предположить, что рассматриваемое лицо появится на этой встрече. Пример2. В тексте характеризующем лицо имеется информация о том, что он является владельцем крупной компьютерной фирмы. Проживает в городе М. В городе М проводится крупная компьютерная выставка. В сети имеется информация, что он несколько раз учавствовал в мероприятия по открытию и/или закрытию аналогичных мероприятий. Можно предположить, что лицо в очередной появится на выставке. Результат хотелось бы получить в виде текста, таблицы и т.п. вида: Ф.И.О Название мероприятия №1 Дата проведения Место проведения … Название мероприятия №K Дата проведения Место проведения |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 25 мая 2011 9:50 Сообщение отредактировано: 14 августа 2011 13:30
Вы описали последовательность действий. Что то можно переложить на соответсвующий софт. Но вот составлять "портрет" объекта и "портрет" возможного мероприятия придется в ручную. Есть программные решения, но они стоят немереных денег (от 300000 евро вроде и выше) , есть в РФ более бюджетный вариант - "Тренд" по моему называется. А если использовать СайтСпутник, то первичные действия нужно проделать в ручную (портреты), подключить соответствующие поисковики (сценарии) и составить нужный пакет и вперед. Собственно примерно тоже проделываю, но по отношению к организациям - где какая может вдруг поучаствовать. ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Раз речь идет о предсказании будущего, а не исследовании прошлого, то я бы поступил так. Подход А. 1. Подключил местные источники к SiteSputnik: СМИ, ЖЖ местных "активистов", форумы, спецсайты, группы в сетях, - в первую очередь RSS-потоки и страницы с новостями, где они есть. 2. Сделал три папки в Рубриках: 1-я "ФЛ" - для новостей, в которых упоминается ФЛ. В ней 100-200 вложенных папок о каждом ФЛ. 2-я "Мероприятия" - в ней несколько папок, заточенных под мероприятия: митинги, встречи, выезды на природу, тусовки. 3-я "Интересы" - компьютеры, байкеры, политические наклонности, ... В Яндексе, Гугле, ... - ловить, на мой взгляд, нечего. Очень много информации. Единственно, что у великолепного Яндекса есть поиск по региону, - нужный регион можно подключить тоже. Периодически выполнял бы поиск и смотрел в выдаче SiteSputnik список "Ссылка-Рубрики" (сейчас он называется "Ссылка-Правила"). Если в нем есть ссылки, которые попали в три рубрики, то их надо открывать и просматривать. Но, если речь идет о будущем, то этот список будет, как правило, пуст. Нужны дедуктивные правила, которые пока в СайтСпутнике не реализованы. Эти правила будут описывать взаимосвязи объектов и событий, попавших в Рубрики, и выявлять те явления, которые хотелось бы вычислить в первом сообщении, - как бы "додумывать", анализируя то, что попало в Рубрики при помощи дедуктивных правил. Пока всё. Планирую делать дедуктивные правила, но, желательно, под реальную задачу. Подход Б. Обозначен во втором сообщении: через пакетные поиски, аналитическое объединение, получать вспомогательную базовую информацию и "доделывать" задачу вручную. P.S. У Нежданова, наверное, небольшая ошибка в цене упомянутого им ПО: к цифре 300 надо приписать ещё три нуля, причём справа. |
lukamud
Долгожитель форума
Всего сообщений: 494 Рейтинг пользователя: 8 Ссылка Дата регистрации на форуме: 15 окт. 2010 |
Игорь Нежданов написал:
Спасибо, а по-точнее название не припомните? |
lukamud
Долгожитель форума
Всего сообщений: 494 Рейтинг пользователя: 8 Ссылка Дата регистрации на форуме: 15 окт. 2010 |
Алексей Мыльников написал: Пока всё. Планирую делать дедуктивные правила, но, желательно, под реальную задачу. Спасибо, подумаем, задача конкретная есть. |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 25 мая 2011 14:26 Сообщение отредактировано: 25 мая 2011 14:31 lukamud написал: Спасибо, а по-точнее название не припомните? "Информационно-аналитическая система «Тренд»" (Разработка ООО “Вербин и Партнеры”) есть еще АРИАДНА+ Западные CASCON ; Фэкшенз (не помню как пишется) ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Алексей Мыльников написал: к цифре 300 надо приписать ещё три нуля, причём справа. Да - что то нули не нажались - конечно 300000 евро. ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
lukamud
Долгожитель форума
Всего сообщений: 494 Рейтинг пользователя: 8 Ссылка Дата регистрации на форуме: 15 окт. 2010 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 25 мая 2011 21:32 Сообщение отредактировано: 25 мая 2011 21:33 Игорь Нежданов написал:
Спасибо. Есть мысль для разработчиков ПО и др. продуктов. Название должно быть уникальным... Иначе Ваш труд найти будет очень сложно и это негативно отразится на выручке. Есть такая машинка "Nissan Almera", она интересна тем, что Nissan впервые при присвоении имени модели использовало искусственно синтезированное слово, к тому же не защищенное патентами третьих лиц. Поэтому рекомендую всем разработчикам следовать этому алгоритму, Вас быстрее найдут и купят Ваши продукты СайтСпутник вполне удачное название. Но сравните выдачу в Google по правильному названию програмы и названию в котором вставлен пробел. |
<<Назад Вперед>> | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » Умеет ли СайтСпутник предсказывать будущее? |
Самые активные 20 тем | |