IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Софт для конкурентной разведки »   IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.
RSS

IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.

<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 ... 11 12 13 14 15 16
Печать
 
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Семёныч написал:
[q]
Вот вычислить этот процент точности и тогда станет понятно - есть инструмент или есть иллюзия инструмента. Принцип "лучше хоть что-то, чем ничего" в данной ситуации, мне кажется не подходящим. При высоком проценте погрешности такой "инструмент" не только не поможет, но и навредит
[/q]

Ув. hound ведь правильно сказал ув. Игорю, который утверждает, что погрешность составляет 50%: надо просто продемонстрировать это на конкретном примере из жизни, включающем в себя большую популяцию. Сразу станет понятно - в каких случаях такая проблема действительно существует, и как ее решать

Вот, мой личный опыт говорит о том, что Айкубаз вполне справляется с оценкой изменения трендов. Причина прозаична: сарказм свойственен очень небольшому числу людей, а подавляющее большинство говорит прямо. И, также подавляющее большинство, употребляет эпитет применительно к человеку не на следующей странице от его имени, а неподалеку, т.е. - на расстоянии нескольких слов. У этого большинства, надо сказать, весь текст зачастую в несколько слов и укладывается.

Кроме того, количество сарказма (кстати, имеющего направленность в обе стороны - и в позитив, и в негатив. что приводит к его взаимной нейтрализации) - величина примерно одинаковая, поэтому ИЗМЕНЕНИЯ тональности нормально отслеживаются на одной и той же популяции. Там, по сути, берешь за "нулевую отметку" текущую ситуацию вместе со всеми ее сарказмами, опечатками и аллегориями - и смотришь изменения в этом конкретном срезе. Для практических целей - абсолютно достаточно.

Это всё, по сути, и говорит ув. Хаунд. И это полностью соответствует моему личному ПРАКТИЧЕСКОМУ опыту. Айкубаз, Медиалогия и прочие программные продукты по оценке тональности больших текстовых массивов - это рабочие инструменты. Их сфера применения - прежде всего, практика, а не теория.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Sergey написал:
[q]
Важна тональность по изданиям, по регионам. Иначе, ни о каком контент-анализе не может и речи идти.
[/q]

Вы не пробовали посмотреть "на пальцах" динамику комментаторов Навального (числом тысяч в 10) под влиянием информационных воздействий? Очень, скажу я Вам, увлекательное занятие. Особенно когда это не единственная задача, а одна из многих.

Конечно, "на пальцах" можно сделать всё. Вопрос во времени, бюджете и точности. А также - в визуализации, которая, кстати, и выявляет тренды более-менее объективно, в отличие от "среднепотолочной" экспертной оценки.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Sergey
Долгожитель форума

Всего сообщений: 640
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
9 июня 2010
Насчет практики.
Все зависит от цели. Лично для себя - да, вполне достаточно "автомата", чтобы +-тенденция была.
Если это коммерческая работа - то нет, не достаточно.
Могу утверждать т.к. в среднем издаем более 2000 различных подобных обзоров в год т.ч. можно говорить и о "практике", и о точности....
p.s.
Общая тенденция мало кого интересует без привязки и разбивки. А вот когда эта привязка и разбивка сделана, то и общий результат (тенденция) явна, наглядна и достоверна (да и суммируется уже без проблем).
hound
Гость

Ссылка

[q=Sergey]А насчет 1000 сообщений и невозможности их обработать... опять же все нет так и не разрешимо. По сути, из этой 1000 уникальных будет единицы, все остальное перепечатки и перетасовка слов. Достаточно иметь механизмы определения уникальности и идентичности. Группируем и получаем не 1000, а 10. [/q]
Не всегда... Я приведу еще один пример.
Вот на каком-то значимом информресурсе (высокопосещаемом интернет-СМИ) делается вброс некой информации в виде статьи. Обычно у них есть опция "комментирование". И вот - эту статью начинают комментировать. Число коментов может составлять сотни. Далее - эта статья начинает в том или ином видет копипаститься по сети. Опять же - там есть опции "кооментирование". Ну и вот так число оригинальных коментов доходит до тысяч.
А ведь очень интересно посмотреть, какую реакцию у аудитории вызвало появление этой информации. Вручную обработать практически нереально.
Sergey
Долгожитель форума

Всего сообщений: 640
Рейтинг пользователя: 2


Ссылка


Дата регистрации на форуме:
9 июня 2010

hound написал:
[q]

]Не всегда... Я приведу еще один пример.Вот на каком-то значимом информресурсе (высокопосещаемом интернет-СМИ) делается вброс некой информации в виде статьи. Обычно у них есть опция "комментирование". И вот - эту статью начинают комментировать. Число коментов может составлять сотни. Далее - эта статья начинает в том или ином видет копипаститься по сети. Опять же - там есть опции "кооментирование". Ну и вот так число оригинальных коментов доходит до тысяч.А ведь очень интересно посмотреть, какую реакцию у аудитории вызвало появление этой информации. Вручную обработать практически нереально.
[/q]


Нужно разделять:
- событие (уникальность новости)
- информационный шум
hound
Гость

Ссылка

[q=Sergey]Нужно разделять:- событие (уникальность новости)- информационный шум [/q]
Конечно, надо. Но интересует - какую реакцию у аудитории вызывало появление информации. Ну как обойтись без автоматизации, если реакция значительна (откликнулись тысячи людей)?
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Sergey написал:
[q]
Все зависит от цели. Лично для себя - да, вполне достаточно "автомата", чтобы +-тенденция была.
Если это коммерческая работа - то нет, не достаточно.
Могу утверждать т.к. в среднем издаем более 2000 различных подобных обзоров в год т.ч. можно говорить и о "практике", и о точности....
[/q]



Sergey написал:
[q]
Общая тенденция мало кого интересует без привязки и разбивки. А вот когда эта привязка и разбивка сделана, то и общий результат (тенденция) явна, наглядна и достоверна (да и суммируется уже без проблем).
[/q]

Я думаю, это еще сильно зависит от того, у кого какая коммерческая работа.

Например, в нашей работе то, что Вы назвали "для себя" - это как раз то, что и надо нам, чтобы скорректировать свои действия (результативность которых и оплачивается заказчиком). Ему неинтересны даже все эти разбивки. Он их может вообще не видеть. Ему надо чтобы результат был.
И нам разбивки интересны очень относительно - т.к. для нас это, по сути, функция "прицеливания" в каждый конкретный момент времени. Т.е., результаты отслеживания тренда - это чисто техническая информация "для себя" которая обеспечивает нам выполнение основной коммерческой работы.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009

hound написал:
[q]
Игорь Нежданов написал:
[q]

50 на 50, а то и еще хуже
[/q]

Спасибо, понятно. Я так понял, это не "из общих соображений", а Вы тестировали Айкубаз (возможно, и другие программы) по этому параметру. Не могли бы выложить соответствующий пример - ну, примерно так, как это сделал при тестировании Айкубаза уважаемый CI-KP.
[/q]


Согласен - всегда нужны доказательства. Даже не смотря на то, что тестирование системы уже проводилось на этом форуме причем дважды. За прошедшее время могло что то измениться.

Тестировал систему на способность определять негатив. Объектом взял Путина, благо за последнее время материала в сети достаточно. Ограничил изучение блогами. Прошел первые две страницы выдачи системы. Если у кого есть желание - можете углубиться.

Результат - из 18 сообщений отнесенных системой IQbuzz к негативным, действительно негативными оказались только 7 на всякий случай, на картинках, рядом с совсем не понятными материалами сделал врезки цитат - чтоб было понятно.

Это 38,9% попаданий

Ни о каком определении трендов/тенденций говорить не приходится.

Прикрепленный файл (Путин негат%, 251044 байт, скачан: 757 раз)
---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
следующее

Прикрепленный файл (Путин негат%, 235140 байт, скачан: 739 раз)
---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1025
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
и еще

Прикрепленный файл (Путин негат%, 243098 байт, скачан: 783 раза)
---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 ... 11 12 13 14 15 16
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Софт для конкурентной разведки »   IQBuzz (Айкубаз). Автоматизация мониторинга и анализа.
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS