Форум Сообщества Практиков Конкурентной разведки (СПКР) » Софт для конкурентной разведки » ДВатсон |
<<Назад Вперед>> | Страницы: 1 2 3 * 4 5 6 7 8 9 10 | Печать |
NVK63
Почетный участник
Всего сообщений: 153 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 27 мая 2012 |
Вопросы: 1)Есть ли смысл при создании нового проекта еще до загрузки исследуемых тестов создать центральный объект исследования и заранее известные нам связанные объекты. То есть создать некую первичную структурку. Может ли это повлиять на процесс анализа текстов? В положительную сторону? В отрицательную? 2) Имхо, полагал бы полезным добавить возможность добавления "всех документов из указанной папки". Это было бы полезным при большом количестве загружаемых исследуемых файлов. ---
Главное - быть, а не казаться... |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
NVK63 написал: Есть ли смысл при создании нового проекта еще до загрузки исследуемых тестов создать центральный объект исследования и заранее известные нам связанные объекты. То есть создать некую первичную структурку. По идее, если уже есть описание Объекта, как минимум разные варианты его ФИО или названия, то эти данные используются для его идентификации в тексте. Но алгоритм не линейный. Мало того такая последовательность действий сама по себе интересна - мы подумаем, попробуем и тогда отпишусь. Но идея правильная. Постараемся ее реализовать. ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
Skyment
Почетный участник
Откуда: Питер Всего сообщений: 143 Рейтинг пользователя: 2 Ссылка Дата регистрации на форуме: 20 сен. 2010 |
...Только не бейте ногами!!! Ну привычка у меня такая дурная!... Интересный продукт - стал "в топку" закидывать всякую хр... от сказок, басен, до Уставов и других "стандартизированных" документов - результат |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Ты-б еще на анекдоты его натравил... :) ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
Александр Митрофанов
Участник
Откуда: Москва Всего сообщений: 17 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 дек. 2009 |
А что, классно, выборка из анекдотов про Вовочку в виде графа связей. Тут можно, связывая еще не связанные вершины графа, прогнозировать создание новых анекдотов. ))) |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
NVK63 написал: Есть ли смысл при создании нового проекта еще до загрузки исследуемых тестов создать центральный объект исследования и заранее известные нам связанные объекты. То есть создать некую первичную структурку. Может ли это повлиять на процесс анализа текстов? Да - смысл в этом есть, т.к. заполняя атрибуты Объекта, для которых есть алгоритмы автоматического выявления, указываем программе, что Это также имеет отношение к изучаемому Объекту. Правда зависимость не совсем линейная, но всё же. При этом поступить можно и чуть иначе. Вначале проанализировать текст "первым проходом". Затем заполнить карточки интересующих вас Объектов - добавить атрибуты. поправить имеющиеся, убрать задвоения и т.п.. После чего провести повторный анализ текста - вот тут программа препарирует тот же текст, но уже используя внесенные и откорректированные вами данные. ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
NVK63
Почетный участник
Всего сообщений: 153 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 27 мая 2012 |
Игорь Нежданов написал: При этом поступить можно и чуть иначе. Вначале проанализировать текст "первым проходом". Затем заполнить карточки интересующих вас Объектов - добавить атрибуты. поправить имеющиеся, убрать задвоения и т.п.. После чего провести повторный анализ текста - вот тут программа препарирует тот же текст, но уже используя внесенные и откорректированные вами данные. Ну, это уже как у Корбина и Страусса: открытое, осевое и избирательное кодирование! Так что, практика и теория не разрывны! Лишний показывает, что подход правильный. ---
Главное - быть, а не казаться... |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Благодаря советам коллег (вашим советам) и творцу кода, который воплощает эти советы, ДВатсон совершенствуется. Например есть возможность создать Шаблон проекта. В него войдут необходимые вам сущности (объекты), которые вы насоздаете, с их атрибутами, типы связей, варианты диаграмм и шаблоны отчетов. Это работает так же как шаблон в PowerPoint. Вы его открываете и нужные вам настройки уже готовы. например можно создать шаблоны для исследования Человека, или Организации, или События, или последовательности событий... ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
NVK63
Почетный участник
Всего сообщений: 153 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 27 мая 2012 |
Игорь Нежданов написал: Например есть возможность создать Шаблон проекта. В него войдут необходимые вам сущности (объекты), которые вы насоздаете, с их атрибутами, типы связей, варианты диаграмм и шаблоны отчетов. Это интересно для специализации шаблонов под конкретные предметные области: отраслевые, географические и т.д. Один и тот же "Василий Ветров" в одной отраслевой области будет "Васька Ветров- Рваное ухо", а в другой "Василий Васильевич Ветров, лауреат... и создатель....". Локализации в предметной области снижает уровень ошибок в идентификации объектов при автоматическом разпознании. Стремление к глобальным банкам не всегда "есть гуд", имхо, лично для меня симпатичнее для оперработы система банков , организованных по отраслевому или географическому делению (или сочетание того и другого вместе) ---
Главное - быть, а не казаться... |
Александр Митрофанов
Участник
Откуда: Москва Всего сообщений: 17 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 дек. 2009 |
Программа дает возможность создавать не только шаблоны, но и вести базы (проекты) по разным предметным областям. Нужно только в шаблонах поменять атрибуты и виды связей на желаемые. |
<<Назад Вперед>> | Страницы: 1 2 3 * 4 5 6 7 8 9 10 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Софт для конкурентной разведки » ДВатсон |
Самые активные 20 тем | |