Форум Сообщества Практиков Конкурентной разведки (СПКР) » Софт для конкурентной разведки » IQBuzz (Айкубаз). Автоматизация мониторинга и анализа. |
<<Назад Вперед>> | Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | Печать |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
hound написал: А пусть лучше они сами сюда придут. Заодно и посмотрим - насколько эффективно они мониторят инфу по самим себе. Тоже логично. Юскан пришел сам. ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
CI-KP написал: Есть что дополнить/поправить? Я бы добавил все-таки оценку Игоря про 50-70% ошибок при оценке тональности при настройках по умолчанию. Плюс упущено предложение Игоря различать общую тональность сообщения и тональность отношения автора к объекту
Плюс надо показать причины ошибок определения тональности при текущем подходе в айкубазе и других подобных системах, как это верно подметил Игорь
Надо акцентировать внимание на том, что правильное построение запроса позволяет серьезно улучшить качество результатов |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Vinni написал: Я бы добавил все-таки оценку Игоря про 50-70% ошибок при оценке тональности при настройках по умолчанию. Поправил. Теперь выглядит вот так. Нормально? ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
CI-KP написал: Поправил. Теперь выглядит вот так. Нормально? На мой взгляд - еще нет.
ИМХО Игорь Нежданов наоборот говорил о том, что тональность текста в-целом можно определить, а отношение автора к объектам тяжело. Также не описана реализация в IqBuzz определения тональности (расстояние между упоминанием слова из запроса и эмоциоанльным словом не более заданного) и ее следствие - большое число ошибок (последняя цитата Игоря Нежданова) Плюс указывал при этом на литературу в качестве обоснования. |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 8 марта 2012 23:37 Сообщение отредактировано: 9 марта 2012 1:42 Vinni написал: ИМХО Игорь Нежданов наоборот говорил о том, что тональность текста в-целом можно определить, а отношение автора к объектам тяжело. Я вижу (и >показал на реальном примере<) что это абсолютно не так. Именно по этой причине, я просил Игоря показать - на какой фактуре основано его утверждение. Выяснилось, что Игорь создал запрос, в котором даже человеку невозможно определить отношение к объекту - потому что этих объектов там несколько штук одновременно. Кроме того, что такое "тональность текста вообще" - мне не совсем понятно. Но еще менее понятно мне - кому нужна в практической работе "тональность текста вообще". Допускаю, что я просто с этим не сталкивался. Однако и Игорь этого не объяснил на понятных примерах. Я не знаю, почему Игорь решил, что выбранный им для анализа тональности по отношению к Путину запрос (>вот этот<) должен выражать отношение именно к Путину. Там, кроме Путина, оказалось полно разнородных объектов, при этом расстояния между словами большие, а синтаксис самого запроса не факт что правильный. Соответственно, и обозначенные Игорем "38%" - непонятно о чем. Зато мне абсолютно понятно, что если смотреть эпитеты на расстоянии двух слов от одного массово обсуждаемого объекта (в приведенном примере - Путина ), то картина получается вполне нормальная. С помощью такой картины реально можно корректировать информационное воздействие, которое мы сами проводим, или оценивать чужое. Мне понятно, как и зачем это может работать. Это я и показал >в своем примере<, а потом и написал в выводах. Vinni написал: Также не описана реализация в IqBuzz определения тональности (расстояние между упоминанием слова из запроса и эмоциоанльным словом не более заданного) и ее следствие - большое число ошибок (последняя цитата Игоря Нежданова) Варьировал расстоянием в запросе я, а не Игорь. Игорь обошел это молчанием. Дважды. Игорь просто пренебрег настройкой расстояния (если не вообще задал его в 20(!) слов от множества объектов одновременно). В результате, он получил не особо годный результат, но обвинил в этом Айкубаз, а не пренебрежение настройками. Вы вообще, хотя бы для себя, можете представить как "вручную", человеческими мозгами то есть, а не машинными, определять тональность по отношению сразу к десятку объектов, расположенных на расстоянии в 20 слов друг от друга? Да вдобавок - когда эмоционально окрашенный эпитет должен быть на расстоянии еще в пять слов. Это произнести-то непросто, а представить, по-моему, вообще крайне затруднительно. Даже человеку. Что уж говорить о машине. Кто от кого в скольких словах в результате будет находиться, и что будет оцениваться - я при таком раскладе не понимаю. Но вряд ли все же отношение к Путину. Как я варьировал расстоянием между словами - показано на скриншоте в моем посте. Зачем - описано там же. Результат положительного влияния настройки расстояния на повышение релевантности там виден невооруженным глазом. Поэтому в выводах я прямо сказал о необходимости такого маневра. Ну, а вся подробная конкретика - в хэлпе и в интерфейсе. Vinni написал: Плюс указывал при этом на литературу в качестве обоснования. Я вижу противоречие заявлений Игоря практике. Я показал как можно добиться работоспособности Айкубаза в целях, которые также описал.А также написал, для каких целей Айкубаз хорош, а для каких - плох. Я вижу также, что Игорь продрейфовал в своих мнениях от "это обман" к "там 38% достоверности", затем к "ну да, процентов 50-70 оно дает, ну и что", и затем "90% - это не аргумент". Если я вижу на практике, что некая система работает, и понимаю как ее использовать, а некто, пусть даже очень уважаемый, списком литературы пытается мне теоретически доказать обратное - я предпочитаю верить своим глазам, а не списку литературы. Вполне возможно, это литература о другом вопросе, как и запрос, который был якобы "про Путина", а оказался про многочегоразногосразу. А, может быть, есть и иные причины. Я этого не знаю. Но я хорошо знаю, что мне нужен инструмент для конкретной работы. Вижу, что он есть, и знаю, как им в его нынешнем виде эту работу выполнять. Вот это для меня является - определяющим. Я все же практик в значительно большей степени, чем теоретик. ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 9 марта 2012 0:48 Сообщение отредактировано: 9 марта 2012 1:00
Попробую показать на примере аналогии - как и зачем может помочь Айкубаз на практике. Конкретно - в практике оценки трендов при информационных воздействиях, о которых я и говорю в этом топике. Вот группа демонстрантов. Я пронумеровал их цифрами от 1 до 4. Мы не знаем - кто они, не знаем их настроя, не знаем, что они будут делать в следующую минуту. Мы лишь фиксируем "картинку". Делаем "моментальную фотографию". Относительно нее будет оцениваться развитие ситуации. Обратите внимание, что под цифрой "2" - не один человек, а группа. А вот это - проводится воздействие на поле. Видно, что в результате проведенного воздействия, группа №2 явно негативно настроена к происходящему, но резко уменьшилась. Группа №1 осталась в поле воздействия, но индифферентна к происходящему. А группы №3 и 4 вообще исчезли с поля. При этом, нас абсолютно не интересует - кто эти люди, о чем они думают, что конкретно хотели сказать. Нам неинтересны тембр их голоса или красота стиля. Нам даже их точное количество неинтересно. Нам интересно изменение количества негативно настроенных под влиянием воздействия. И всё. Вот, в Интернете нас примерно то же самое интересует. А вот ответ на вопрос "Куда бежит толпа?" - от нас или к нам, чтобы побить, к примеру. Мы выбираем из толпы несколько ориентиров ("реперов"), которые явно типичны для поведения толпы в целом и отслеживаем их движение (разумеется, не забывая сверяться, что их движение соответствует движению толпы, а также не забывая оценивать динамику общей численности толпы) И вновь обращаю внимание на то, что нас не интересуют конкретные персоны и нам не нужна абсолютная точность. У нас иная задача и нас устраивает примерная точность в данном случае. Главное - верно отфильтровать ориентиры. При работе "в позитив" задача принципиально та же, но просто позитивом тогда будет повышение лояльности, а не понижение внимания к нам. Собственно, вот. ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 9 марта 2012 9:46 Сообщение отредактировано: 9 марта 2012 9:49
Да, и еще один момент. Решение Игоря целенаправленно исключить короткие тексты из анализа я, в контексте рассматриваемой задачи, расцениваю исключительно как попытку подтасовки результатов. Если я неправ, то пусть мне кто-нибудь объяснит - в чем может заключаться практическая ценность расширения поиска эмоции в тексте на 20 слов, а то и больше - учитывая, что там множество объектов и эмоция может относиться к любому из них. Моя практика не позволяет мне этого понять, но, возможно, у кого-то есть иная практика. Почему я предположил (возможно, ошибочно), что Игорь занимался подтасовкой? Дело в том, что когда нас интересует массовка - а я неустанно говорю именно об этой ситуации, т.к. именно эта ситуация без машины не решаема - Твиттер, комментарии и форумы играют довольно большую роль. Именно Твиттер и комментарии - жанры краткие, но часто содержащие эмоции. Исключение Твиттера и комментариев из оценки - это уже не количественное, а качественное искажение информационного поля, когда речь идет об анализе массовки. Сделанное Игорем искусственное расширение контекста на 20 слов под лозунгом анализа только длинных текстов - это заведомое зашумление пространства. Но, как оказалось, настройка Айкубаза позволяет решить даже эту проблему и даже на больших текстах - уменьшив в настройках дистанцию между объектом и "эмоцией". В случае с Путиным - до двух слов. На менее обсуждаемых, чем Путин, объектах такое уменьшение может и не понадобиться. Скажем, малоизвестный еще вчера объект, который вдруг оказывается в центре внимания, причем на негативе - вряд ли нуждается в такой корректировке. ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
CI-KP написал: Кроме того, что такое "тональность текста вообще" - мне не совсем понятно. Но еще менее понятно мне - кому нужна в практической работе "тональность текста вообще". Допускаю, что я просто с этим не сталкивался. Однако и Игорь этого не объяснил на понятных примерах. Посмотрел педивикию про Анализ тональности текста Там нет тональности вообще -
Зато там описано несколько методов оценки тональности (а не только тот, что применен в IqBuzz. Не знаю что в Youscan ) Как минимум на эту статью надо сослаться Видимо тональность текста вообще - это его эмоциональная окрашенность в-целом безотносительно отношения субъекта к объекту Для КР понятное дело важнее отношение субъекта тональности к объекту тональности. CI-KP написал: Поэтому в выводах я прямо сказал о необходимости такого маневра. Понятно, что практика - критерий истины Так эти примеры как раз и показывают, что даже специалисты КР могут ошибаться при составлении запросов, что влияет на эффективность оценки тональности. И Ваши примеры , Евгений, как раз и показывают, что ПМСМ стоит все-таки в одном-двух предложениях описать модель определения тональности для понимания Я бы поэтому еще кратко описал бы типовые ошибки при составлении запросов и требования к правильным запросам |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Кстати, нашел другую интересную (и которая будет показывать более хорошие результаты, чем Айкубазз, так как модель более серьезная ) реализацию определения тональности в "Аналитическом курьере"- тест компонента и описание модели определения тональности |
Elena_Larina
Модератор форума
Всего сообщений: 223 Рейтинг пользователя: 9 Ссылка Дата регистрации на форуме: 25 нояб. 2010 |
Модель классная, только сам продукт в целом очень дорогой, находится в совершенно другой ценовой нише, нежели Айкубазз. ---
Вопрос к блондинке. Какова вероятность встретить на улице динозавра? Блондинка отвечает... Мы ищем правильных людей, а не правильные резюме |
<<Назад Вперед>> | Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Софт для конкурентной разведки » IQBuzz (Айкубаз). Автоматизация мониторинга и анализа. |
Самые активные 20 тем | |