ДВатсон

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Софт для конкурентной разведки »   ДВатсон
RSS

ДВатсон

программа для анализа текстовой информации

<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 10
Печать
 
Max_Otto
Молчун

Откуда: Минск
Всего сообщений: 15
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
10 июня 2014
Каким образом лучше создать атрибуты для объектов типа "физический объект"???? К примеру танк "Т 72". Каким образом решается вопрос синонимии и омонимии?
Max_Otto
Молчун

Откуда: Минск
Всего сообщений: 15
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
10 июня 2014
В контенте на других языках объекты не выделяются?
Max_Otto
Молчун

Откуда: Минск
Всего сообщений: 15
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
10 июня 2014
Допустим мы создали новый объект типа "событие" - как сделать его визуализацию на графе??????
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009

Max_Otto написал:
[q]
Считаю целесообразным создание связи через глагол
[/q]

Часть семантики так и работает.


Max_Otto написал:
[q]
Было бы неплохо связать географические объекты с геосервером
[/q]

Как дополнительный сарвис - наверное да. Но практической ценности пока не вижу.


Max_Otto написал:
[q]
Каким образом лучше создать атрибуты для объектов типа "физический объект"?
[/q]

Создаете новый тип объектов и с этом типе создаете нужные вам атрибуты.


Max_Otto написал:
[q]
Каким образом решается вопрос синонимии и омонимии?
[/q]

При заполнении атрибутов объекта создайте столько атрибутов одного типа, сколько синонимов можете придумать.


Max_Otto написал:
[q]
Допустим мы создали новый объект типа "событие" - как сделать его визуализацию на графе?
[/q]

Что значит "его визуализация на графе"?

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Max_Otto
Молчун

Откуда: Минск
Всего сообщений: 15
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
10 июня 2014
В данном варианте система слишком ручная. Для того чтобы повысить уровень автоматизации и создаются алгоритмы автоматического выделения связей между объектами через глагол или факт (факт - объекты встречаются в одном предложении - значит они связаны через факт). Графы красивые со связями можно и в Visio рисовать и в MindManager. Вопрос в автоматизации корректного выделения объектов и связей. Система довольно корректно выделяет персоны и организации на русском языке. Но выделение связей настолько аскетично, что пункт №1 теряет смысл.
Каким образом создается алгоритм автом выделения объектов новых типов (типа физический объект)? Или только ручной алгоритм? Еще очень неудобно то, что открытой карточки создаваемого объекта нельзя копипастить текст из левого окна с текстом в карточку. Не совсем понятна интеграция с БД. Как производить поиск по атрибутам объектов?

Но в целом - для начинающего журналиста или какого нибудь исследователя индивидуала толковый и недорогой инструмент.
Max_Otto
Молчун

Откуда: Минск
Всего сообщений: 15
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
10 июня 2014
Интеграция с геосервером нужна для того, чтобы создавать отчет на карте объектов типа "событие" у которого есть аттрибут время (период события) и место события (координаты на карте). Имея совокупность событий мы можем строить подобные иногда оч полезные отчеты.

Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009

Max_Otto написал:
[q]
Для того чтобы повысить уровень автоматизации и создаются алгоритмы автоматического выделения связей между объектами через глагол или факт (факт - объекты встречаются в одном предложении - значит они связаны через факт).
[/q]

А вы можете пояснить детальнее? На конкретном примере. Есть текст (из одного предложения): "Василий из Перми купил мопед, ну прям как Николай из Ростова, который купил недавно мотоцикл."

Если выделять связи между объектами исходя из двух условий:
- они находятся в одном предложении;
- через глагол.;
то получается, что объект Василий связан не только с объектом мопед, но и с объектом Николай, и с объектом мотоцикл. Или правила всё же сложнее?


Max_Otto написал:
[q]
Интеграция с геосервером нужна для того, чтобы создавать отчет на карте объектов типа "событие" у которого есть аттрибут время (период события) и место события (координаты на карте). Имея совокупность событий мы можем строить подобные иногда оч полезные отчеты.
[/q]

Вновь хотелось-бы подробностей - как вариант конкретный пример практической пользы такого отчета.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Max_Otto
Молчун

Откуда: Минск
Всего сообщений: 15
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
10 июня 2014
Ну к примеру, анализируем события связанные с террористической активностью КРП в какой то период. Смотрим все это дело на карте и видим, что зона действия активности удивительно совпадает с маршрутом газопровода Набукко, а даты событий совпадают датами событий, связанных с принятием решений по участию-неучастию основных инвесторов проекта Набукко. Которые еще не приняли решение куда инвестировать в ЮП или в Набукко. Делаем выводы))))))) Только пример. Ничего личного.



Есть журналистика факта, а есть журналистика мнения. Так вот могу отметить, что для автоматического алгоритма сбора и анализа информации предпочтительны источники, основанные на фактах. Статьи в таких источниках, как правило,строго структурированы. По правилу т.н. "журналисткой пирамиды". Предложения в таких источниках, как правило простой, а не сложно подчиненной структуры. А тот пример про Василия и НИколая - он из другой оперы.
Примеры правильных источников:

и т.п. Можно анализировать инфу и из т.н. аналитических источников, но только уже в ручном режиме. А для этого и Mindmanager вполне пригоден.
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009

Max_Otto написал:
[q]
Есть журналистика факта, а есть журналистика мнения. Так вот могу отметить, что для автоматического алгоритма сбора и анализа информации предпочтительны источники, основанные на фактах. Статьи в таких источниках, как правило,строго структурированы. По правилу т.н. "журналисткой пирамиды". Предложения в таких источниках, как правило простой, а не сложно подчиненной структуры. А тот пример про Василия и НИколая - он из другой оперы.
[/q]

Мой опыт показывает, что источников "из другой оперы" гораздо больше, чем состоящих из простых предложений. В такой ситуации программа, работающая по предложенной вами схеме будет выдавать такое число ложных срабатываний, что на их вычищение уйдет больше времени, чем на ручную прорисовку. И тот самый смысл автоматизации пропадает.


Max_Otto написал:
[q]
Ну к примеру, анализируем события связанные с террористической активностью КРП в какой то период. Смотрим все это дело на карте и видим, что зона действия активности удивительно совпадает с маршрутом газопровода Набукко, а даты событий совпадают датами событий, связанных с принятием решений по участию-неучастию основных инвесторов проекта Набукко. Которые еще не приняли решение куда инвестировать в ЮП или в Набукко. Делаем выводы))))))) Только пример. Ничего личного.
[/q]

Возможно пригодится - на заметку взяли.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Max_Otto
Молчун

Откуда: Минск
Всего сообщений: 15
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
10 июня 2014
Секрет вот еще в чем - аналитик как правило работает в какой то узкой предметной области. В процессе работы он создает БД объектов. И интересны связи в перую очередь между ними. Но жизнь ведь не стоит на месте и появляются новые объекты, которые и выделяет система. Но пока оператор не принял решения о включении потенциальных объектов в БД, то связи с ними можно вообще не отображать. Вернее правильнее сделать режим отображения и тех и тех, режим отображения объектов из БД. Так же и со связями можно отображать все, а можно только между реальными объектами. Можно только ручные связи - они самые релевантные. Вы правы бестолковая автоматизация ведет к множественным ошибкам, которые надо в ручную вычищать. Но ведь их можно не отображать, а потом месяца через 3, если их не подтвердит оператор, как-то автоматически уничтожить. К примеру, не востребованный потенциальный объект (не подтвержденный) уничтожается со всеми своими атрибутами и связями.
<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 10
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Софт для конкурентной разведки »   ДВатсон
RSS

Последние RSS
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
ВС разрешил пропускать работу без разрешения работодателя
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS