IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Софт для конкурентной разведки »   IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.
RSS

IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.

<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 10 * 11 12 13 14 15 16
Печать
 
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009
Да, и еще один момент.

Решение Игоря целенаправленно исключить короткие тексты из анализа я, в контексте рассматриваемой задачи, расцениваю исключительно как попытку подтасовки результатов.
Если я неправ, то пусть мне кто-нибудь объяснит - в чем может заключаться практическая ценность расширения поиска эмоции в тексте на 20 слов, а то и больше - учитывая, что там множество объектов и эмоция может относиться к любому из них. Моя практика не позволяет мне этого понять, но, возможно, у кого-то есть иная практика.

Почему я предположил (возможно, ошибочно), что Игорь занимался подтасовкой? Дело в том, что когда нас интересует массовка - а я неустанно говорю именно об этой ситуации, т.к. именно эта ситуация без машины не решаема - Твиттер, комментарии и форумы играют довольно большую роль.
Именно Твиттер и комментарии - жанры краткие, но часто содержащие эмоции.

Исключение Твиттера и комментариев из оценки - это уже не количественное, а качественное искажение информационного поля, когда речь идет об анализе массовки.

Сделанное Игорем искусственное расширение контекста на 20 слов под лозунгом анализа только длинных текстов - это заведомое зашумление пространства.

Но, как оказалось, настройка Айкубаза позволяет решить даже эту проблему и даже на больших текстах - уменьшив в настройках дистанцию между объектом и "эмоцией". В случае с Путиным - до двух слов.

На менее обсуждаемых, чем Путин, объектах такое уменьшение может и не понадобиться. Скажем, малоизвестный еще вчера объект, который вдруг оказывается в центре внимания, причем на негативе - вряд ли нуждается в такой корректировке.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

CI-KP написал:
[q]
Кроме того, что такое "тональность текста вообще" - мне не совсем понятно. Но еще менее понятно мне - кому нужна в практической работе "тональность текста вообще". Допускаю, что я просто с этим не сталкивался. Однако и Игорь этого не объяснил на понятных примерах.
[/q]

Посмотрел педивикию про Анализ тональности текста
Там нет тональности вообще -
[q]

тональность текста определяется тремя факторами: 1) субъект тональности; 2) собственно тональная оценка (позитив/нейтрально/негатив); 3) объект тональности. Под субъектом тональности подразумевается автор статьи (автор цитаты, прямой или косвенной речи), под объектом тональности — тот, о ком он высказывается и под тональной оценкой — эмоциональное отношение автора к такому объекту.
[/q]

Зато там описано несколько методов оценки тональности (а не только тот, что применен в IqBuzz. Не знаю что в Youscan :wink: )
Как минимум на эту статью надо сослаться :wink:

Видимо тональность текста вообще - это его эмоциональная окрашенность в-целом безотносительно отношения субъекта к объекту
Для КР понятное дело важнее отношение субъекта тональности к объекту тональности.


CI-KP написал:
[q]
Поэтому в выводах я прямо сказал о необходимости такого маневра.
Ну, а вся подробная конкретика - в хэлпе и в интерфейсе.
[/q]

Понятно, что практика - критерий истины :laugh:
Так эти примеры как раз и показывают, что даже специалисты КР могут ошибаться при составлении запросов, что влияет на эффективность оценки тональности.
И Ваши примеры :super-puper , Евгений, как раз и показывают, что ПМСМ стоит все-таки в одном-двух предложениях описать модель определения тональности для понимания :wink:
Я бы поэтому еще кратко описал бы типовые ошибки при составлении запросов и требования к правильным запросам :yes:
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Кстати, нашел другую интересную (и которая будет показывать более хорошие результаты, чем Айкубазз, так как модель более серьезная :wink: ) реализацию определения тональности в "Аналитическом курьере"- тест компонента и описание модели определения тональности

Elena_Larina
Модератор форума

Всего сообщений: 223
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
25 нояб. 2010
Модель классная, только сам продукт в целом очень дорогой, находится в совершенно другой ценовой нише, нежели Айкубазз.

---
Вопрос к блондинке. Какова вероятность встретить на улице динозавра? Блондинка отвечает...
Мы ищем правильных людей, а не правильные резюме
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Vinni написал:
[q]
Видимо тональность текста вообще - это его эмоциональная окрашенность в-целом безотносительно отношения субъекта к объекту
Для КР понятное дело важнее отношение субъекта тональности к объекту тональности.
[/q]

Вот и я считаю, что для практических целей (а иные мною не рассматриваются в данном случае) нужно отношение к объекту. А потому исследования "сферического коня в вакууме", на мой взгляд. надо оставить теоретикам и сосредоточиться на практике.


Vinni написал:
[q]
Как минимум на эту статью надо сослаться :wink:
[/q]

Я так не считаю. Все по той же причине: практикам нужен инструмент. Покупая молоток, никто ведь обычно не просит приложить к нему справочник по материаловедению и курсовую по сопромату.

Но если Айкубаз или иные системы будут кем-то использоваться в теоретических изысканиях - я не сомневаюсь, что там в списке литературы будет и эта статья, и еще десятка три других статей и монографий. Но это уже не наш вопрос.


Vinni написал:
[q]
даже специалисты КР могут ошибаться при составлении запросов, что влияет на эффективность оценки тональности.
[/q]

Ошибаться может кто угодно - это нормально.
О важности правильного составления запроса я написал. Написал кратко. В принципе, практически все подобные сервисы обычно помогают клиенту составить запрос. Некоторые даже за него пытаются это делать - что, на мой взгляд, неправильно, т.к. хорошее знание синтаксиса запросов не более важно, чем понимание задачи, без которой невозможно оценить результат.
Поэтому подучиться пользованию сервисом, конечно, надо каждому.


Vinni написал:
[q]
Я бы поэтому еще кратко описал бы типовые ошибки при составлении запросов и требования к правильным запросам :yes:
[/q]

Мне кажется, это бесполезно. Проще допускать до системы тех, кто хотя бы по минимуму понимает что такое булева алгебра, потом дать им получить некий результат, а уже потом - проверить их запрос. Тогда именно их ошибка будет исправлена. Это всем сэкономит массу времени.

Я на это насмотрелся при обучении поиску - там каждые делает примерно одну-две из 20 типовых ошибок, но у каждого это свои одна-две ошибки. пока он их не сделает и ему их не исправят - не научится. Именно по этой причине, обучение поиску по книгам не дает такого результата, как очная кратковременная учеба.

И отдельное спасибо за ценные подсказки, ув. Vinni :hi:

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009
На меня, кстати, со ссылкой на эту ветку только что вышел SemanticForce. Будем посмотреть.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Vinni
Администратор

Всего сообщений: 2136
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
По-хорошему, уже пора делать сравнительный анализ таких систем :wink:
Предлагаю включить в него как минимум раздел про технологии тональности и следующие параметры в нем
-технология определения тональности
-процент правльного определения тональности при настройках по умолчанию
-параметры, которыми можно управлять
-начальный объем словарей позитива и негатива
-требования к запросу
-типы отчетов с указанием тональности


CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Vinni написал:
[q]
По-хорошему, уже пора делать сравнительный анализ таких систем :wink:
Предлагаю включить в него как минимум раздел про технологии тональности и следующие параметры в нем
-технология определения тональности
-процент правльного определения тональности при настройках по умолчанию
-параметры, которыми можно управлять
-начальный объем словарей позитива и негатива
-требования к запросу
-типы отчетов с указанием тональности
[/q]

Ну, я в бета-тестеры, уж извините, не буду записываться. У меня нет на это времени. Я могу сделать (и сделаю) примерно одинаковую работу на каждой из систем и покажу результат. А также расскажу свои субъективные ощущения от эргономики и от результатов. По-умному, это называется "экспертной оценкой".

А устраивать скрупулезные замеры, да еще с научным описанием - это работа для какого-нибудь аналога "общества защиты прав потребителей" или передачи ""Контрольная закупка", который живет с этого.

Я глазами пользователя, которому надо делать реальное дело посмотрю на системы. И который это дело умеет делать и понимает. Не более того. Но и не менее.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Семёныч
Модератор форума
Городской Охотник
Всего сообщений: 926
Рейтинг пользователя: 10


Ссылка


Дата регистрации на форуме:
8 июня 2009

CI-KP написал:
[q]
А устраивать скрупулезные замеры, да еще с научным описанием
[/q]

Почему бы такие вещи не делать самим производителям продукта? Вспомните, сколько раз на форуме появлялся тот или иной разработчик софта. Дабы показать, что его продукт стоящий, его просили дать сравнительный анализ своего продукта с аналогами. Некоторые это демонстрировали. Я понимаю, что частный разработчик и целая компания - вещи разные (и по амбициям, и по принципам продвижения продукта, и прочее), но не могу поверить, что такие компании в тихаря "не меряются между собой пиписьками". А вот публиковать такие замеры - бздят. Нечем похвастаться? Вряд ли. У каждого продукта будут свои достоинства и недостатки. Типа, для разной рыбалки нужны разные удочки. Ну, так есть среди этих "пирожков" хоть один с яйцами, или все только с капустой?

---
Нет такой безвыходной ситуации,в которую невозможно вляпаться... (с)
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Семёныч написал:
[q]
Почему бы такие вещи не делать самим производителям продукта?
[/q]

На мой взгляд, есть, как минимум, две причины:

1. Засудят остальные производители за нарушение закона о рекламе - если тесты окажутся ему "в плюс". Запрещено сравнение себя с конкурентами.

2. Если отдать это на аутсорсинг - "Обществу защиты прав потребителей" - придется заплатить. А какое доверие проплаченным исследованиям?

Кроме того, на мой взгляд, есть и еще одно серьезное обстоятельство: программы все примерно похожи друг на друга по техническим возможностям. Но ТТХ - не единственная, а порой и не главная характеристика продукта. Ест еще такие немаловажные факторы, как маркетинговая политика, качество техподдержки и т.п.

И есть, как мне кажется, еще один момент: на следующий день после выхода сравнительного обзора ситуация может просто измениться: кто-то поработал над ошибками, а у кого-то руководитель группы разработчиков уехал жить в тибетский монастырь.

Учитывая, что продукты далеко не массовые, может оказаться намного проще (для производителя) продавать свой товар и не заниматься публичным сравнением, которое все равно мало кем будет востребовано. А непубличные сравнения наверняка ведутся ежедневно. Они у любого продавца ведутся - даже если он этого не планировал делать.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 10 * 11 12 13 14 15 16
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Софт для конкурентной разведки »   IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS