IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Софт для конкурентной разведки »   IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.
RSS

IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.

<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Печать
 
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

hound написал:
[q]
А пусть лучше они сами сюда придут. Заодно и посмотрим - насколько эффективно они мониторят инфу по самим себе.
[/q]

Тоже логично. Юскан пришел сам.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

CI-KP написал:
[q]
Есть что дополнить/поправить?
[/q]


Я бы добавил все-таки оценку Игоря про 50-70% ошибок при оценке тональности при настройках по умолчанию.

Плюс упущено предложение Игоря различать общую тональность сообщения и тональность отношения автора к объекту
[q]

Повторюсь - есть общая тональность сообщения, а есть отношение автора к объекту, упоминаемому в этом сообщении. Это две разные вещи. Здесь речь об общей тональности сообщений (материалов). С этим криво-косо получается что то определить.

Поэтому не смотря ни на какие нюансы - не в состоянии машина понимать намеки, юмор, сарказм и прочие оттенки настроения человека, основываясь на его тексте.
[/q]


Плюс надо показать причины ошибок определения тональности при текущем подходе в айкубазе и других подобных системах, как это верно подметил Игорь
[q]

Определить общую тональность сообщения можно. С разным процентом ошибок, но можно и это делается. А вот как определить что негатив в каком то сообщении относиться именно к вашему объекту интереса? По наличию негатива и упоминания объекта? Но негатив может не относиться к объекту. По наличию негатива + упоминание объекта + расстояние в тексте от объекта до негатива? но это тоже не дает ничего, чему примеры приведены выше. Получается, что нельзя определить сообщение негативно или нет по отношению к конкретному объекту. Причем ни на уровне единичных сообщений, ни на уровне "потока" информации.
...
Теперь по поводу словаря негатива. Я очень надеюсь, что участвующим в диспуте доводилось составлять такой словарь. По тому что когда начинаешь его составлять, понимаешь, что гибкость русского языка позволяет многие слова использовать как негативные. А уж словосочетания это вообще отдельная песня. Интересующиеся могут почитать соответствующую работу (очень краткую и общую) "Метод определения эмоций в тестах на русском языке" авторы Пазельская А.Г. и Соловьев А.Н. (по названию легко найдете)
[/q]



Надо акцентировать внимание на том, что правильное построение запроса позволяет серьезно улучшить качество результатов :wink:
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Vinni написал:
[q]
Я бы добавил все-таки оценку Игоря про 50-70% ошибок при оценке тональности при настройках по умолчанию.

Плюс упущено предложение Игоря различать общую тональность сообщения и тональность отношения автора к объекту

Надо акцентировать внимание на том, что правильное построение запроса позволяет серьезно улучшить качество результатов :wink:
[/q]


Поправил. Теперь выглядит вот так. Нормально?

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

CI-KP написал:
[q]
Поправил. Теперь выглядит вот так. Нормально?
[/q]


На мой взгляд - еще нет. :wonder1:

[q]

4. Айкубаз полезен, преимущественно, для оценки эмоционального отношения автора к конкретному объекту в тексте, а не для эмоциональной оценки "текста в целом".
[/q]

ИМХО Игорь Нежданов наоборот говорил о том, что тональность текста в-целом можно определить, а отношение автора к объектам тяжело.


Также не описана реализация в IqBuzz определения тональности (расстояние между упоминанием слова из запроса и эмоциоанльным словом не более заданного) и ее следствие - большое число ошибок (последняя цитата Игоря Нежданова)
Плюс указывал при этом на литературу в качестве обоснования. :wink:
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Vinni написал:
[q]
ИМХО Игорь Нежданов наоборот говорил о том, что тональность текста в-целом можно определить, а отношение автора к объектам тяжело.
[/q]

Я вижу (и >показал на реальном примере<) что это абсолютно не так. Именно по этой причине, я просил Игоря показать - на какой фактуре основано его утверждение. Выяснилось, что Игорь создал запрос, в котором даже человеку невозможно определить отношение к объекту - потому что этих объектов там несколько штук одновременно.

Кроме того, что такое "тональность текста вообще" - мне не совсем понятно. Но еще менее понятно мне - кому нужна в практической работе "тональность текста вообще". Допускаю, что я просто с этим не сталкивался. Однако и Игорь этого не объяснил на понятных примерах.

Я не знаю, почему Игорь решил, что выбранный им для анализа тональности по отношению к Путину запрос (>вот этот<) должен выражать отношение именно к Путину. Там, кроме Путина, оказалось полно разнородных объектов, при этом расстояния между словами большие, а синтаксис самого запроса не факт что правильный. Соответственно, и обозначенные Игорем "38%" - непонятно о чем.

Зато мне абсолютно понятно, что если смотреть эпитеты на расстоянии двух слов от одного массово обсуждаемого объекта (в приведенном примере - Путина ), то картина получается вполне нормальная. С помощью такой картины реально можно корректировать информационное воздействие, которое мы сами проводим, или оценивать чужое. Мне понятно, как и зачем это может работать. Это я и показал >в своем примере<, а потом и написал в выводах.


Vinni написал:
[q]
Также не описана реализация в IqBuzz определения тональности (расстояние между упоминанием слова из запроса и эмоциоанльным словом не более заданного) и ее следствие - большое число ошибок (последняя цитата Игоря Нежданова)
[/q]

Варьировал расстоянием в запросе я, а не Игорь. Игорь обошел это молчанием. Дважды.
Игорь просто пренебрег настройкой расстояния (если не вообще задал его в 20(!) слов от множества объектов одновременно). В результате, он получил не особо годный результат, но обвинил в этом Айкубаз, а не пренебрежение настройками.

Вы вообще, хотя бы для себя, можете представить как "вручную", человеческими мозгами то есть, а не машинными, определять тональность по отношению сразу к десятку объектов, расположенных на расстоянии в 20 слов друг от друга? Да вдобавок - когда эмоционально окрашенный эпитет должен быть на расстоянии еще в пять слов.
Это произнести-то непросто, а представить, по-моему, вообще крайне затруднительно. Даже человеку. Что уж говорить о машине. Кто от кого в скольких словах в результате будет находиться, и что будет оцениваться - я при таком раскладе не понимаю. Но вряд ли все же отношение к Путину.

Как я варьировал расстоянием между словами - показано на скриншоте в моем посте. Зачем - описано там же. Результат положительного влияния настройки расстояния на повышение релевантности там виден невооруженным глазом.
Поэтому в выводах я прямо сказал о необходимости такого маневра.
Ну, а вся подробная конкретика - в хэлпе и в интерфейсе.


Vinni написал:
[q]
Плюс указывал при этом на литературу в качестве обоснования. :wink:
[/q]

Я вижу противоречие заявлений Игоря практике. Я показал как можно добиться работоспособности Айкубаза в целях, которые также описал.А также написал, для каких целей Айкубаз хорош, а для каких - плох.

Я вижу также, что Игорь продрейфовал в своих мнениях от "это обман" к "там 38% достоверности", затем к "ну да, процентов 50-70 оно дает, ну и что", и затем "90% - это не аргумент".

Если я вижу на практике, что некая система работает, и понимаю как ее использовать, а некто, пусть даже очень уважаемый, списком литературы пытается мне теоретически доказать обратное - я предпочитаю верить своим глазам, а не списку литературы.
Вполне возможно, это литература о другом вопросе, как и запрос, который был якобы "про Путина", а оказался про многочегоразногосразу. А, может быть, есть и иные причины. Я этого не знаю.

Но я хорошо знаю, что мне нужен инструмент для конкретной работы. Вижу, что он есть, и знаю, как им в его нынешнем виде эту работу выполнять. Вот это для меня является - определяющим. Я все же практик в значительно большей степени, чем теоретик.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009
Попробую показать на примере аналогии - как и зачем может помочь Айкубаз на практике. Конкретно - в практике оценки трендов при информационных воздействиях, о которых я и говорю в этом топике.

Вот группа демонстрантов.
Я пронумеровал их цифрами от 1 до 4. Мы не знаем - кто они, не знаем их настроя, не знаем, что они будут делать в следующую минуту. Мы лишь фиксируем "картинку". Делаем "моментальную фотографию". Относительно нее будет оцениваться развитие ситуации. Обратите внимание, что под цифрой "2" - не один человек, а группа.




А вот это - проводится воздействие на поле.


Видно, что в результате проведенного воздействия, группа №2 явно негативно настроена к происходящему, но резко уменьшилась. Группа №1 осталась в поле воздействия, но индифферентна к происходящему. А группы №3 и 4 вообще исчезли с поля.

При этом, нас абсолютно не интересует - кто эти люди, о чем они думают, что конкретно хотели сказать. Нам неинтересны тембр их голоса или красота стиля. Нам даже их точное количество неинтересно. Нам интересно изменение количества негативно настроенных под влиянием воздействия. И всё.

Вот, в Интернете нас примерно то же самое интересует.

А вот ответ на вопрос "Куда бежит толпа?" - от нас или к нам, чтобы побить, к примеру.
Мы выбираем из толпы несколько ориентиров ("реперов"), которые явно типичны для поведения толпы в целом


и отслеживаем их движение (разумеется, не забывая сверяться, что их движение соответствует движению толпы, а также не забывая оценивать динамику общей численности толпы)


И вновь обращаю внимание на то, что нас не интересуют конкретные персоны и нам не нужна абсолютная точность. У нас иная задача и нас устраивает примерная точность в данном случае. Главное - верно отфильтровать ориентиры.

При работе "в позитив" задача принципиально та же, но просто позитивом тогда будет повышение лояльности, а не понижение внимания к нам.

Собственно, вот.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009
Да, и еще один момент.

Решение Игоря целенаправленно исключить короткие тексты из анализа я, в контексте рассматриваемой задачи, расцениваю исключительно как попытку подтасовки результатов.
Если я неправ, то пусть мне кто-нибудь объяснит - в чем может заключаться практическая ценность расширения поиска эмоции в тексте на 20 слов, а то и больше - учитывая, что там множество объектов и эмоция может относиться к любому из них. Моя практика не позволяет мне этого понять, но, возможно, у кого-то есть иная практика.

Почему я предположил (возможно, ошибочно), что Игорь занимался подтасовкой? Дело в том, что когда нас интересует массовка - а я неустанно говорю именно об этой ситуации, т.к. именно эта ситуация без машины не решаема - Твиттер, комментарии и форумы играют довольно большую роль.
Именно Твиттер и комментарии - жанры краткие, но часто содержащие эмоции.

Исключение Твиттера и комментариев из оценки - это уже не количественное, а качественное искажение информационного поля, когда речь идет об анализе массовки.

Сделанное Игорем искусственное расширение контекста на 20 слов под лозунгом анализа только длинных текстов - это заведомое зашумление пространства.

Но, как оказалось, настройка Айкубаза позволяет решить даже эту проблему и даже на больших текстах - уменьшив в настройках дистанцию между объектом и "эмоцией". В случае с Путиным - до двух слов.

На менее обсуждаемых, чем Путин, объектах такое уменьшение может и не понадобиться. Скажем, малоизвестный еще вчера объект, который вдруг оказывается в центре внимания, причем на негативе - вряд ли нуждается в такой корректировке.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

CI-KP написал:
[q]
Кроме того, что такое "тональность текста вообще" - мне не совсем понятно. Но еще менее понятно мне - кому нужна в практической работе "тональность текста вообще". Допускаю, что я просто с этим не сталкивался. Однако и Игорь этого не объяснил на понятных примерах.
[/q]

Посмотрел педивикию про Анализ тональности текста
Там нет тональности вообще -
[q]

тональность текста определяется тремя факторами: 1) субъект тональности; 2) собственно тональная оценка (позитив/нейтрально/негатив); 3) объект тональности. Под субъектом тональности подразумевается автор статьи (автор цитаты, прямой или косвенной речи), под объектом тональности — тот, о ком он высказывается и под тональной оценкой — эмоциональное отношение автора к такому объекту.
[/q]

Зато там описано несколько методов оценки тональности (а не только тот, что применен в IqBuzz. Не знаю что в Youscan :wink: )
Как минимум на эту статью надо сослаться :wink:

Видимо тональность текста вообще - это его эмоциональная окрашенность в-целом безотносительно отношения субъекта к объекту
Для КР понятное дело важнее отношение субъекта тональности к объекту тональности.


CI-KP написал:
[q]
Поэтому в выводах я прямо сказал о необходимости такого маневра.
Ну, а вся подробная конкретика - в хэлпе и в интерфейсе.
[/q]

Понятно, что практика - критерий истины :laugh:
Так эти примеры как раз и показывают, что даже специалисты КР могут ошибаться при составлении запросов, что влияет на эффективность оценки тональности.
И Ваши примеры :super-puper , Евгений, как раз и показывают, что ПМСМ стоит все-таки в одном-двух предложениях описать модель определения тональности для понимания :wink:
Я бы поэтому еще кратко описал бы типовые ошибки при составлении запросов и требования к правильным запросам :yes:
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Кстати, нашел другую интересную (и которая будет показывать более хорошие результаты, чем Айкубазз, так как модель более серьезная :wink: ) реализацию определения тональности в "Аналитическом курьере"- тест компонента и описание модели определения тональности

Elena_Larina
Модератор форума

Всего сообщений: 223
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
25 нояб. 2010
Модель классная, только сам продукт в целом очень дорогой, находится в совершенно другой ценовой нише, нежели Айкубазз.

---
Вопрос к блондинке. Какова вероятность встретить на улице динозавра? Блондинка отвечает...
Мы ищем правильных людей, а не правильные резюме
<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Софт для конкурентной разведки »   IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS