Предложение по совершенствованию Объектов

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Предложение по совершенствованию Объектов
RSS

Предложение по совершенствованию Объектов

<<Назад  Вперед>>Печать
 
petryashov
Администратор

Откуда: Москва
Всего сообщений: 480
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Предлагаю расширить функционал поиска Объектов в новостях. Сейчас выделяется два класса Объектов: юридические и физические лица. Целесообразно, на мой взгляд, выделить и третий класс с условным названием "в кавычках". В данный класс объектов должны попадать все объекты, удовлетворяющие двум условиям: они должны находиться в кавычках и начинаться с заглавной буквы. Например: "Тополь", "Эльбрус" и т.п. Это позволит пользователю автоматизировать процесс поиска торговых марок, названий компаний без указания их организационно - правовой формы и так далее.

Предлагаю также создать четвёртый класс объектов с условным названием "иностранные слова". Это позволит выделять названия компаний, торговых марок и фамилии- имена иностранцев, упомянутых в публикациях. Признаком, говорящим, что перед нами именно названия и фамилии, а не англоязычный текст, к примеру, может служить наличие рядом кириллического текста. Пример: "как сказал основатель компании Microsoft Билл Гейтс (Bill Gates), новые технологии творят чудеса". В этом случае будет выявлено два объекта класса "иностранные слова" (Bill Gates и Microsoft) и один объект класса Физические лица" (Билл Гейтс).

Будет много мусора, но алгоритм мотом можно будет усовершенствовать.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Вы имеете ввиду добавить ещё два типа объектов в третий столбец справа?


petryashov
Администратор

Откуда: Москва
Всего сообщений: 480
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009

Алексей Мыльников написал:
[q]
Вы имеете ввиду добавить ещё два типа объектов в третий столбец справа?
[/q]

Да

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

petryashov написал:
[q]
Да
[/q]

    Добавил два объекта:

    1) НОО - НеОпознанные Объекты. Это слово или фраза в кавычках. Первое слово начинается с заглавной буквы, язык русский.

    2) ИнЯз - иностранные слова. Это иностранные слово или фраза в документах на русском языке. Все слова начинаются с заглавной буквы. Кавычки могут быть, могут не быть.

    Доспупно в версии 8.8.8.3 от12.10.15.

<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Предложения по программе для допроса Интернета СайтСпутник »   Предложение по совершенствованию Объектов
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS