Предложение по совершенствованию Объектов

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Предложение по совершенствованию Объектов
RSS

Предложение по совершенствованию Объектов

<<Назад  Вперед>>Печать
 
petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Предлагаю расширить функционал поиска Объектов в новостях. Сейчас выделяется два класса Объектов: юридические и физические лица. Целесообразно, на мой взгляд, выделить и третий класс с условным названием "в кавычках". В данный класс объектов должны попадать все объекты, удовлетворяющие двум условиям: они должны находиться в кавычках и начинаться с заглавной буквы. Например: "Тополь", "Эльбрус" и т.п. Это позволит пользователю автоматизировать процесс поиска торговых марок, названий компаний без указания их организационно - правовой формы и так далее.

Предлагаю также создать четвёртый класс объектов с условным названием "иностранные слова". Это позволит выделять названия компаний, торговых марок и фамилии- имена иностранцев, упомянутых в публикациях. Признаком, говорящим, что перед нами именно названия и фамилии, а не англоязычный текст, к примеру, может служить наличие рядом кириллического текста. Пример: "как сказал основатель компании Microsoft Билл Гейтс (Bill Gates), новые технологии творят чудеса". В этом случае будет выявлено два объекта класса "иностранные слова" (Bill Gates и Microsoft) и один объект класса Физические лица" (Билл Гейтс).

Будет много мусора, но алгоритм мотом можно будет усовершенствовать.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Вы имеете ввиду добавить ещё два типа объектов в третий столбец справа?


petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009

Алексей Мыльников написал:
[q]
Вы имеете ввиду добавить ещё два типа объектов в третий столбец справа?
[/q]

Да

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

petryashov написал:
[q]
Да
[/q]

    Добавил два объекта:

    1) НОО - НеОпознанные Объекты. Это слово или фраза в кавычках. Первое слово начинается с заглавной буквы, язык русский.

    2) ИнЯз - иностранные слова. Это иностранные слово или фраза в документах на русском языке. Все слова начинаются с заглавной буквы. Кавычки могут быть, могут не быть.

    Доспупно в версии 8.8.8.3 от12.10.15.

<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Предложение по совершенствованию Объектов
RSS

Последние RSS
Open Source Intelligence (OSINT) Tools and Resources Handbook
Top tips on gathering information about companies by using free online sources
Новое на блоге HRразведка
Безопасность данных в MS Access
Слово как улика
20 Recon and Intel Gathering Tools used by InfoSec Professionals
What’s Changed?
10 альтернативных поисковиков
Ситуационный центр главы Республики Коми
Развёртывание ситуационных центров на базе технологии Avalanche
Как принимать сложные решения. Советы бывшего оперативника ЦРУ.
Открытая информация о "Новичке" из сети интернет.
Ген. директор "ОЗХО" Ахмет Узюмдж о "Новичке" и хим. атаке в Сирии
Онлайн-сервисы для Twitter
Коллекция для Twitter
Приложение Opera VPN закрывается
О работе разведки
Deep web и 11 поисковиков по нему
Об изначальной "лживости" любых документов
Обновление на блоге HRазведка

Самые активные 20 тем RSS
Стандартные источники информации в СайтСпутнике
Слово как улика
Open Source Intelligence (OSINT) Tools and Resources Handbook