Предложение по совершенствованию Объектов

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Предложение по совершенствованию Объектов
RSS

Предложение по совершенствованию Объектов

<<Назад  Вперед>>Печать
 
petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Предлагаю расширить функционал поиска Объектов в новостях. Сейчас выделяется два класса Объектов: юридические и физические лица. Целесообразно, на мой взгляд, выделить и третий класс с условным названием "в кавычках". В данный класс объектов должны попадать все объекты, удовлетворяющие двум условиям: они должны находиться в кавычках и начинаться с заглавной буквы. Например: "Тополь", "Эльбрус" и т.п. Это позволит пользователю автоматизировать процесс поиска торговых марок, названий компаний без указания их организационно - правовой формы и так далее.

Предлагаю также создать четвёртый класс объектов с условным названием "иностранные слова". Это позволит выделять названия компаний, торговых марок и фамилии- имена иностранцев, упомянутых в публикациях. Признаком, говорящим, что перед нами именно названия и фамилии, а не англоязычный текст, к примеру, может служить наличие рядом кириллического текста. Пример: "как сказал основатель компании Microsoft Билл Гейтс (Bill Gates), новые технологии творят чудеса". В этом случае будет выявлено два объекта класса "иностранные слова" (Bill Gates и Microsoft) и один объект класса Физические лица" (Билл Гейтс).

Будет много мусора, но алгоритм мотом можно будет усовершенствовать.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Вы имеете ввиду добавить ещё два типа объектов в третий столбец справа?


petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009

Алексей Мыльников написал:
[q]
Вы имеете ввиду добавить ещё два типа объектов в третий столбец справа?
[/q]

Да

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 833
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

petryashov написал:
[q]
Да
[/q]

    Добавил два объекта:

    1) НОО - НеОпознанные Объекты. Это слово или фраза в кавычках. Первое слово начинается с заглавной буквы, язык русский.

    2) ИнЯз - иностранные слова. Это иностранные слово или фраза в документах на русском языке. Все слова начинаются с заглавной буквы. Кавычки могут быть, могут не быть.

    Доспупно в версии 8.8.8.3 от12.10.15.

<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Предложение по совершенствованию Объектов
RSS

Последние RSS
SiteSputnik. Об одном подходе к мониторингу Телеграм
Безопасность при работе на ПК
Книги о критическом мышлении
Наказывать за вмешательство в частную жизнь, Верховный суд
CI Academic Materials
CiMi.CON Evolution USA
Поиск в КЭШ поисковиков по запросу и пакету запросов
СайтСпутник: Многоязычность, Юникод, MS ACCESS
Новый курс OSINT от АИС
Год тюрьмы за отказ удалять
Книга "Строим доверие по методикам спецслужб"
аналог "Консультанта" о зарубежном законодательстве
Открытые данные ФНС
Получаем информацию по VIN
Competitive-Market Intelligence Conference, Berlin 2018
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st
Историческое. Агентурная разведка
Open Source Intelligence (OSINT) Tools and Resources Handbook

Самые активные 20 тем RSS
Мелочи