ДВатсон

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Софт для конкурентной разведки »   ДВатсон
RSS

ДВатсон

программа для анализа текстовой информации

<<Назад  Вперед>>Страницы: 1 2 3 * 4 5 6 7 8 9 10
Печать
 
NVK63
Почетный участник

Всего сообщений: 153
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
27 мая 2012
Вопросы:

1)Есть ли смысл при создании нового проекта еще до загрузки исследуемых тестов создать центральный объект исследования и заранее известные нам связанные объекты. То есть создать некую первичную структурку. Может ли это повлиять на процесс анализа текстов? В положительную сторону? В отрицательную?

2) Имхо, полагал бы полезным добавить возможность добавления "всех документов из указанной папки". Это было бы полезным при большом количестве загружаемых исследуемых файлов.

---
Главное - быть, а не казаться...
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009

NVK63 написал:
[q]
Есть ли смысл при создании нового проекта еще до загрузки исследуемых тестов создать центральный объект исследования и заранее известные нам связанные объекты. То есть создать некую первичную структурку.
[/q]

По идее, если уже есть описание Объекта, как минимум разные варианты его ФИО или названия, то эти данные используются для его идентификации в тексте. Но алгоритм не линейный. Мало того такая последовательность действий сама по себе интересна - мы подумаем, попробуем и тогда отпишусь. Но идея правильная. Постараемся ее реализовать.


---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Skyment
Почетный участник

Откуда: Питер
Всего сообщений: 143
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
20 сен. 2010
...Только не бейте ногами!!! :wink:
Ну привычка у меня такая дурная!...
Интересный продукт - стал "в топку" закидывать всякую хр... от сказок, басен, до Уставов и других "стандартизированных" документов - результат :good: :wink:
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Ты-б еще на анекдоты его натравил... :)

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Александр Митрофанов
Участник

Откуда: Москва
Всего сообщений: 17
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
8 дек. 2009
А что, классно, выборка из анекдотов про Вовочку в виде графа связей. Тут можно, связывая еще не связанные вершины графа, прогнозировать создание новых анекдотов. )))
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009

NVK63 написал:
[q]
Есть ли смысл при создании нового проекта еще до загрузки исследуемых тестов создать центральный объект исследования и заранее известные нам связанные объекты. То есть создать некую первичную структурку. Может ли это повлиять на процесс анализа текстов?
[/q]

Да - смысл в этом есть, т.к. заполняя атрибуты Объекта, для которых есть алгоритмы автоматического выявления, указываем программе, что Это также имеет отношение к изучаемому Объекту. Правда зависимость не совсем линейная, но всё же.

При этом поступить можно и чуть иначе. Вначале проанализировать текст "первым проходом". Затем заполнить карточки интересующих вас Объектов - добавить атрибуты. поправить имеющиеся, убрать задвоения и т.п.. После чего провести повторный анализ текста - вот тут программа препарирует тот же текст, но уже используя внесенные и откорректированные вами данные.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
NVK63
Почетный участник

Всего сообщений: 153
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
27 мая 2012

Игорь Нежданов написал:
[q]
При этом поступить можно и чуть иначе. Вначале проанализировать текст "первым проходом". Затем заполнить карточки интересующих вас Объектов - добавить атрибуты. поправить имеющиеся, убрать задвоения и т.п.. После чего провести повторный анализ текста - вот тут программа препарирует тот же текст, но уже используя внесенные и откорректированные вами данные.
[/q]

Ну, это уже как у Корбина и Страусса: открытое, осевое и избирательное кодирование! Так что, практика и теория не разрывны! Лишний показывает, что подход правильный.

---
Главное - быть, а не казаться...
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Благодаря советам коллег (вашим советам) и творцу кода, который воплощает эти советы, ДВатсон совершенствуется. Например есть возможность создать Шаблон проекта. В него войдут необходимые вам сущности (объекты), которые вы насоздаете, с их атрибутами, типы связей, варианты диаграмм и шаблоны отчетов. Это работает так же как шаблон в PowerPoint. Вы его открываете и нужные вам настройки уже готовы. например можно создать шаблоны для исследования Человека, или Организации, или События, или последовательности событий...

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
NVK63
Почетный участник

Всего сообщений: 153
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
27 мая 2012

Игорь Нежданов написал:
[q]
Например есть возможность создать Шаблон проекта. В него войдут необходимые вам сущности (объекты), которые вы насоздаете, с их атрибутами, типы связей, варианты диаграмм и шаблоны отчетов.
[/q]


Это интересно для специализации шаблонов под конкретные предметные области: отраслевые, географические и т.д.
Один и тот же "Василий Ветров" в одной отраслевой области будет "Васька Ветров- Рваное ухо", а в другой "Василий Васильевич Ветров, лауреат... и создатель....". Локализации в предметной области снижает уровень ошибок в идентификации объектов при автоматическом разпознании.
Стремление к глобальным банкам не всегда "есть гуд", имхо, лично для меня симпатичнее для оперработы система банков , организованных по отраслевому или географическому делению (или сочетание того и другого вместе)

---
Главное - быть, а не казаться...
Александр Митрофанов
Участник

Откуда: Москва
Всего сообщений: 17
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
8 дек. 2009
Программа дает возможность создавать не только шаблоны, но и вести базы (проекты) по разным предметным областям. Нужно только в шаблонах поменять атрибуты и виды связей на желаемые.
<<Назад  Вперед>>Страницы: 1 2 3 * 4 5 6 7 8 9 10
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Софт для конкурентной разведки »   ДВатсон
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS