Версия для печати

-   Форум Сообщества Практиков Конкурентной разведки (СПКР) http://forum.razved.info/
--  Предложения по программе для допроса Интернета СайтСпутник http://forum.razved.info//index.php?f=40
--- Предложение по совершенствованию Объектов http://forum.razved.info//index.php?t=5666




-- petryashov написал 7 октября 2015 13:54
Предлагаю расширить функционал поиска Объектов в новостях. Сейчас выделяется два класса Объектов: юридические и физические лица. Целесообразно, на мой взгляд, выделить и третий класс с условным названием "в кавычках". В данный класс объектов должны попадать все объекты, удовлетворяющие двум условиям: они должны находиться в кавычках и начинаться с заглавной буквы. Например: "Тополь", "Эльбрус" и т.п. Это позволит пользователю автоматизировать процесс поиска торговых марок, названий компаний без указания их организационно - правовой формы и так далее.

Предлагаю также создать четвёртый класс объектов с условным названием "иностранные слова". Это позволит выделять названия компаний, торговых марок и фамилии- имена иностранцев, упомянутых в публикациях. Признаком, говорящим, что перед нами именно названия и фамилии, а не англоязычный текст, к примеру, может служить наличие рядом кириллического текста. Пример: "как сказал основатель компании Microsoft Билл Гейтс (Bill Gates), новые технологии творят чудеса". В этом случае будет выявлено два объекта класса "иностранные слова" (Bill Gates и Microsoft) и один объект класса Физические лица" (Билл Гейтс).

Будет много мусора, но алгоритм мотом можно будет усовершенствовать.


-- Алексей Мыльников написал 8 октября 2015 8:14
Вы имеете ввиду добавить ещё два типа объектов в третий столбец справа?

(http://sitesputnik.ru/Help/Pic/F/Table_Streem.jpg)


-- petryashov написал 8 октября 2015 10:05

Алексей Мыльников написал:
[q]
Вы имеете ввиду добавить ещё два типа объектов в третий столбец справа?
[/q]

Да



-- Алексей Мыльников написал 12 октября 2015 1:19

petryashov написал:
[q]
Да
[/q]



Этот форум работает на скрипте Intellect Board
© 2004-2007, 4X_Pro, Объединенный Открытый Проект