Определение тональности в текстах

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Управление информационными потоками »   Определение тональности в текстах
RSS

Определение тональности в текстах

<<Назад  Вперед>>Страницы: 1 2 * 3 4 5 6 7 8
Печать
 
Sergey
Долгожитель форума

Всего сообщений: 640
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
9 июня 2010

Искендер написал:
[q]

Хотелось бы взглянуть на результаты.
[/q]

Что-то меня не покидают сомнения... что там все для "англицкого" языка.
Искендер
Администратор

Всего сообщений: 5913
Рейтинг пользователя: 43


Ссылка


Дата регистрации на форуме:
7 июня 2009

Sergey написал:
[q]
эмоции (не путать с тональностями)
[/q]

А я намеренно написал не "тональность", а именно "эмоциональность". Поскольку в рассматриваемом примере оценка тональности всецело зависит от эмоциональности оценивающего. Для стороннего человека - она нейтральна. Для позитивно относящегося к Иванову - она будет другой (не факт, что позитивной, но другой), для негативно относящегося - третьей (не факт, что негативно, но тоже - иной). А "окрашенное" отношение к объекту - это уже его эмоциональная оценка.

---
I`m not a Spy! I can do much better!
Информационные войны "под ключ"
Искендер
Администратор

Всего сообщений: 5913
Рейтинг пользователя: 43


Ссылка


Дата регистрации на форуме:
7 июня 2009

Sergey написал:
[q]
Что-то меня не покидают сомнения... что там все для "англицкого" языка.
[/q]

А меня не покидают сомнения, что это будет лишь "фишка". For fun.

---
I`m not a Spy! I can do much better!
Информационные войны "под ключ"
Sergey
Долгожитель форума

Всего сообщений: 640
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
9 июня 2010

Искендер написал:
[q]

А я намеренно написал не "тональность", а именно "эмоциональность". Поскольку в рассматриваемом примере оценка тональности всецело зависит от эмоциональности оценивающего. Для стороннего человека - она нейтральна. Для позитивно относящегося к Иванову - она будет другой (не факт, что позитивной, но другой), для негативно относящегося - третьей (не факт, что негативно, но тоже - иной). А "окрашенное" отношение к объекту - это уже его эмоциональная оценка.
[/q]

Нельзя не согласиться, с точки зрения оценки текста человеком-аналитиком. С точки зрения алгоритмов оценки эмоций - данный текст был бы отнесен к нейтральным т.к. эмоций в нем нет, только фактаж.
Для эмоций в нем не хватает эмоциональной составляющей. Например, удивления, что он выздоровел.
Например: Удивительно, что после долгой и тяжелой болезни Иванов ушел в долгожданный отпуск.
Эмоции: удивление
Искендер
Администратор

Всего сообщений: 5913
Рейтинг пользователя: 43


Ссылка


Дата регистрации на форуме:
7 июня 2009

Sergey написал:
[q]
С точки зрения алгоритмов оценки эмоций - данный текст был бы отнесен к нейтральным т.к. эмоций в нем нет, только фактаж.
[/q]

Вооот... Что возвращает нас к...


Искендер написал:
[q]
Сомнительно, чтобы программными средствами возможно было оценивать тональность таких сложных (как в приведенном примере с Ивановым) случаев. Поскольку, как справедливо отмечено выше, оценка зависит от позиции заказчика мониторинга.
[/q]


---
I`m not a Spy! I can do much better!
Информационные войны "под ключ"
Sergey
Долгожитель форума

Всего сообщений: 640
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
9 июня 2010
ну да... на что был примерно такой ответ:
[q]

причем понимая достаточно ответственно, что это просто "фишка". Но, почти любой договор на мониторинг содержит требование на подобные оценки. Если суточная выборка тысячи единиц, то визуально не отработать. Чем больше выборка, тем % погрешности более приемлем (теорема Чебышева в действии).
Если не требуется потекстовая расшифровка, то еще можно крутиться. А вот если нужна ... вот тут и нужно разбираться в алгоритмах
[/q]


Естественно, что при оценки тональности единичного текста заменить аналитика пока невозможно. (Я это и в предыдущее обсуждения говорил).
Но, хотелось бы усовершенствовать механизмы оценки в больших выборках, чтобы уменьшить общий процент погрешности. Тут есть что обсуждать.
Искендер
Администратор

Всего сообщений: 5913
Рейтинг пользователя: 43


Ссылка


Дата регистрации на форуме:
7 июня 2009

Sergey написал:
[q]
Но, хотелось бы усовершенствовать механизмы оценки в больших выборках, чтобы уменьшить общий процент погрешности. Тут есть что обсуждать.
[/q]

Когда-нибудь, наверное, AI таки создадут. :smile:

---
I`m not a Spy! I can do much better!
Информационные войны "под ключ"
Sergey
Долгожитель форума

Всего сообщений: 640
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
9 июня 2010

Игорь Нежданов написал:
[q]

Смешение негатива и позитива или многомерные настроения: присутствие позитива и негатива в одном предложении (фразе). Пример: «Мне нравится астрономия, но меня раздражают слабые преподаватели».
[/q]

Это пример анализа текста целиком. Не определен объект исследования.
Если объект астрономия, то в отношении него - позитив.
Если объект преподаватели - негатив

Это оговаривалось "во первых строках письма" т.е. исследование всего контента, без уточнение отношения к определенному объекту/объектов смысла не имеет.

Игорь Нежданов написал:
[q]

Будущий негатив: это связано с действиями, которые могут произойти в будущем, а могут и не произойти. Пример: клиент не раздражен в данный момент, но говорит, что будет недоволен, если приобретенный товар выйдет из строя через несколько месяцев.
[/q]

В данном случае, если объект клиент или товар - негатив, не важно что "негатив отложенный"

Игорь Нежданов написал:
[q]

Сравнение — не прямой негатив, но вполне может иметь отрицательный окрас. Пример: «Я предпочитаю Андроид», что хорошо для Google, но не для MS или Apple.
[/q]

Один из самых сложных случаев. Алгоритмы тут с большой вероятностью дадут "нейтрально"


Игорь Нежданов написал:
[q]

Неоднозначные негативные слова: их смысл зависит от того, в «окружении» какого находиться фраза. Например: «Какой прыжок, с ума сойти!» можно истолковать как негатив или позитив в зависимости от окружающего текста. «Какой прыжок, с ума сойти! Как всё красиво, как весело – обязательно повторю.» или «Какой прыжок, с ума сойти! Тот что в оранжевом костюме вряд ли захочет повторить, а того что в синем до сих пор ищут.»
[/q]

Двусмысленность целостных, устоявшихся фраз решается путем создания словарей с заранее оговоренной трактовкой. Опять же, в примере должен быть объект. Основная сложность тут будет привязать объект исследования к фразеологизму, не спутав отношение фразеологизма к некому другому объекту.
Sergey
Долгожитель форума

Всего сообщений: 640
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
9 июня 2010

Искендер написал:
[q]

Когда-нибудь, наверное, AI таки создадут.
[/q]

"Они есть и их много". На форуме уже приводились некие продукты (не повторяю названия т.к. цель не реклама, а обсуждение принципов, теории).
Вопрос в другом. Как снизить% погрешности на выборку.
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1024
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009


Sergey написал:
[q]

Игорь Нежданов написал:
[q]

Смешение негатива и позитива или многомерные настроения: присутствие позитива и негатива в одном предложении (фразе). Пример: «Мне нравится астрономия, но меня раздражают слабые преподаватели».
[/q]

Это пример анализа текста целиком. Не определен объект исследования.
Если объект астрономия, то в отношении него - позитив.
Если объект преподаватели - негатив

Это оговаривалось "во первых строках письма" т.е. исследование всего контента, без уточнение отношения к определенному объекту/объектов смысла не имеет.
[/q]

А разве было обратное утверждение?



Sergey написал:
[q]

Игорь Нежданов написал:
[q]

Будущий негатив: это связано с действиями, которые могут произойти в будущем, а могут и не произойти. Пример: клиент не раздражен в данный момент, но говорит, что будет недоволен, если приобретенный товар выйдет из строя через несколько месяцев.
[/q]

В данном случае, если объект клиент или товар - негатив, не важно что "негатив отложенный"
[/q]

Почему? – ведь на данный момент клиент доволен.



Sergey написал:
[q]

Игорь Нежданов написал:
[q]

Сравнение — не прямой негатив, но вполне может иметь отрицательный окрас. Пример: «Я предпочитаю Андроид», что хорошо для Google, но не для MS или Apple.
[/q]

Один из самых сложных случаев. Алгоритмы тут с большой вероятностью дадут "нейтрально"
[/q]

А такого встречается достаточно много.



Sergey написал:
[q]

Игорь Нежданов написал:
[q]

Неоднозначные негативные слова: их смысл зависит от того, в «окружении» какого находиться фраза. Например: «Какой прыжок, с ума сойти!» можно истолковать как негатив или позитив в зависимости от окружающего текста. «Какой прыжок, с ума сойти! Как всё красиво, как весело – обязательно повторю.» или «Какой прыжок, с ума сойти! Тот что в оранжевом костюме вряд ли захочет повторить, а того что в синем до сих пор ищут.»
[/q]

Двусмысленность целостных, устоявшихся фраз решается путем создания словарей с заранее оговоренной трактовкой. Опять же, в примере должен быть объект. Основная сложность тут будет привязать объект исследования к фразеологизму, не спутав отношение фразеологизма к некому другому объекту.
[/q]

Только при условии, что фраза именно устоявшаяся. А в том и сложность языка, что фраза может быть и не устоявшаяся. Или есть словари со всеми вариантами сочетаний слов? – вряд ли.


В общем и целом – проблема пока что не решаема. Можно облегчить жизнь оператору, и то только до определенного уровня. Или полагаться на «авось». По принципу если определили 90% то ничего страшного в оставшихся 10% не будет.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
<<Назад  Вперед>>Страницы: 1 2 * 3 4 5 6 7 8
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Управление информационными потоками »   Определение тональности в текстах
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Лог-файл в программе СайтСпутник
шантаж, угрозы по Интернету

Самые активные 20 тем RSS