Определение тональности в текстах

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Управление информационными потоками »   Определение тональности в текстах
RSS

Определение тональности в текстах

<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8
Печать
 
hound
Гость

Ссылка

[q=Vinni]Мацкевич.[/q]
Я полагаю, он сказал правду. СВР нужна (если нужна) определенно версия stand-alone, а там только серверы будут стоить больше.
А на исследования - да, достаточно.
Vinni
Администратор

Всего сообщений: 2126
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Вот-вот. :yes: Тем более обычный порядок какой - сначала НИР, а уж потом ОКР :wink:
Sergey
Долгожитель форума

Всего сообщений: 640
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
9 июня 2010

Vinni написал:
[q]

Глава "Итеранет" опроверг данные о работе по мониторингу соцсетей
[/q]

Почему-то я не удивлен...
Я бы удивился, если бы сказали: "да,мы это делаем."
В таких делах огласка - это лишнее. Можно и заказы потерять от ведомства. Поэтому, будут открещиваться до последнего.
hound
Гость

Ссылка

[q=Sergey]Я бы удивился, если бы сказали: "да,мы это делаем."[/q]
Я бы тоже - за указанные деньги.
Искендер
Администратор

Всего сообщений: 5913
Рейтинг пользователя: 43


Ссылка


Дата регистрации на форуме:
7 июня 2009
Ну так журы в своем репертуаре: начали с "Как стало известно "Ъ", в январе 2012 года Служба внешней разведки (СВР) объявила три закрытых тендера на сумму свыше 30 млн руб., цель которых — выработать новые методики мониторинга блогосферы".
Продолжили о том же: "По сведениям "Ъ", тендеры на исследования с кодовыми обозначениями "Шторм-12", "Монитор-3" и "Диспут" были проведены в январе-феврале 2012 года".
Но тут жур чего-то хлебнул (или нюхнул) и понеслася: "разработка специального программного комплекса автоматизированного распространения информации в крупных социальных сетях и организации информационной поддержки мероприятий по подготовленным сценариям воздействия на заданную массовую аудиторию социальных сетей"

:bottle:

---
I`m not a Spy! I can do much better!
Информационные войны "под ключ"
Sergey
Долгожитель форума

Всего сообщений: 640
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
9 июня 2010

hound написал:
[q]

В интернете весьма часто встречается такой оборот речи, как сарказм. Люди его, как правило, понимают. А вот интересно - есть ли роботы, способные определить сарказм?Ну например:Путинский суд дал пуськам 2 года. Какая прелесть!
[/q]


Интересный тест, по сути.
Но, сразу возникает вопрос. В отношении кого исследуем тональность?
1) путинский суд
2) пуськи
Далее, как сам исследователь оценивает фактаж события?
т.к. сразу возникают варианты.
Вспомним упомянутый выше объект "Б" на уровне леммы: исследование тональности корректно, когда определен объект исследования и субъект относительно которого исследуется заданный объект.
Как пример, рассмотрим текст с разных позиций заказчика оценки

Hound: подразумевает сарказм. Подоплека: много дали, должны были простить и извиниться.
X: подразумевает негатив, т.к. он негодует. Мало дали! Нужно было осудить и стерилизовать (см. тему Пусек на форуме)
Y: подразумевает позитив. Он опасался, что их могут отпустить, но ура! Их осудили!
Таким образом, однозначности не получилось, хотя в предпосылке должен был получиться однозначный сарказм!

Как отработают существующие механизмы.
1. алгоритм отрабатывающий весь текст, без выделения объекта: 50% негатив, 50% позитив. В зависимости от приоритетов и распределения весов в спорных ситуациях: нейтрально или негатив
2. алгоритм отрабатывающий объекты. Если объект задан как «путинский суд», то выдаст 100% позитив. Если объект пуськи, то вариант п.1
3. алгоритм вычисляющий относительные соотношения, примерно такой расклад:
негатив~28%, позитив~44%,ирония~28%. Тут можно играться с отображением, но, по сути, итог - позитив.

Для анализа результата важно насколько массовые группы H, X, Y для оценки совпадения позиций групп с оценкой алгоритма. Отсюда следует, как учесть вектор массивности настроения общества в алгоритмах тональности?
hound
Гость

Ссылка

[q=Sergey]Hound: подразумевает сарказм. Подоплека: много дали, должны были простить и извиниться.
X: подразумевает негатив, т.к. он негодует. Мало дали! Нужно было осудить и стерилизовать (см. тему Пусек на форуме)
Y: подразумевает позитив. Он опасался, что их могут отпустить, но ура! Их осудили!
Таким образом, однозначности не получилось, хотя в предпосылке должен был получиться однозначный сарказм![/q]

Вот видите, даже люди по-разному могут оценить это предложение. А что уж говорить о роботе...
Поэтому мне представляется интересным (для заказчика) 2 вещи (вместе или поодиночке):
1. Понять позицию автора предложения
2. Понять, какое воздействие это предложение оказывает на аудиторию
Во втором случае - да, уже проценты. Возможно, робот и справится с этим (в чем я лично сомневаюсь). А вот с первым - вряд ли. Как Вы правильно заметили, возможна совершенно разная трактовка фразы.
Sergey
Долгожитель форума

Всего сообщений: 640
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
9 июня 2010

hound написал:
[q]

1. Понять позицию автора предложения 2. Понять, какое воздействие это предложение оказывает на аудиториюВо втором случае - да, уже проценты. Возможно, робот и справится с этим (в чем я лично сомневаюсь). А вот с первым - вряд ли. Как Вы правильно заметили, возможна совершенно разная трактовка фразы.
[/q]


Позиция автора.
В реальности, сам автор может путаться в своей позиции по ходу тексту, особенно, если это журналист. :laugh:
Опять же в реальности, алгоритм может исследовать окружение фразы, что расширяет вероятностные характеристики оценки.
Причем, некоторые тексты резко уходят в область не правильно определенной тональности, но на большинстве процент достоверности будет повышен.
А вот исследовать(прогнозировать) воздействие - это уже целый новый пласт! Это нужно обсуждать подробно, долго и отдельно. Получить такой инструмент в свои руки - мечта любого маркетолога, политолога, аналитика,......
p.s.
можно и попытаться.... :cool:
hound
Гость

Ссылка

[q=Sergey]Позиция автора.[/q]
Вот человек, на мой взгляд, однозначно в этом плане воспримет указанную фразу как саркастическую (негативную). Поторму что там присутствует выражение "путинский суд". Сторонник Путина так никогда не напишет. А сами по себе оба слова - и "путинский", и "суд" - совершенно нейтральны.
А в словосочетании - негатив. И таких словосочетаний ведь очень много, все в программу вряд ли вобьешь.
Sergey
Долгожитель форума

Всего сообщений: 640
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
9 июня 2010

hound написал:
[q]

Sergey написал:
[q]
Позиция автора.
[/q]
Вот человек, на мой взгляд, однозначно в этом плане воспримет указанную фразу как саркастическую (негативную). Поторму что там присутствует выражение "путинский суд". Сторонник Путина так никогда не напишет. А сами по себе оба слова - и "путинский", и "суд" - совершенно нейтральны.А в словосочетании - негатив. И таких словосочетаний ведь очень много, все в программу вряд ли вобьешь.
[/q]


Человек может быть православным, оскорбленным действием пусек, но не быть приверженцем Путина. Например, активно ходить на "болото" и орать долой Путина! Для него этот суд "путинский". Вполне вероятно, что этот же суд ему самому, чуть ранее впаивал суток 15 за хождение с белыми шариками не в то время и не в том месте... Но, в то же время он приветствует осуждение пусек, мало того, считает, что им дали очень и очень мало.
p.s.
теоретически, слово Путинский, в теории, вообще может означать название района, где находится суд.
Например, Хамовнический суд может ассоциироваться кем-то с неким Иваном Петровичем Хамовниковым.

Я к тому, что любому алгоритму такие ассоциации не под силу. Мы говорим исключительно о достижении некого приемлемого соответствия результата, с ожидаемой погрешностью на исследуемой выборке.
<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Управление информационными потоками »   Определение тональности в текстах
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Лог-файл в программе СайтСпутник
шантаж, угрозы по Интернету

Самые активные 20 тем RSS