Форум Сообщества Практиков Конкурентной разведки (СПКР) » Софт для конкурентной разведки » IQBuzz (Айкубаз). Автоматизация мониторинга и анализа. |
<<Назад Вперед>> | Страницы: 1 2 3 4 5 6 7 8 9 ... 11 12 13 14 15 16 | Печать |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 5 марта 2012 14:23 Сообщение отредактировано: 5 марта 2012 14:24 Семёныч написал: Вот вычислить этот процент точности и тогда станет понятно - есть инструмент или есть иллюзия инструмента. Принцип "лучше хоть что-то, чем ничего" в данной ситуации, мне кажется не подходящим. При высоком проценте погрешности такой "инструмент" не только не поможет, но и навредит Ув. hound ведь правильно сказал ув. Игорю, который утверждает, что погрешность составляет 50%: надо просто продемонстрировать это на конкретном примере из жизни, включающем в себя большую популяцию. Сразу станет понятно - в каких случаях такая проблема действительно существует, и как ее решать Вот, мой личный опыт говорит о том, что Айкубаз вполне справляется с оценкой изменения трендов. Причина прозаична: сарказм свойственен очень небольшому числу людей, а подавляющее большинство говорит прямо. И, также подавляющее большинство, употребляет эпитет применительно к человеку не на следующей странице от его имени, а неподалеку, т.е. - на расстоянии нескольких слов. У этого большинства, надо сказать, весь текст зачастую в несколько слов и укладывается. Кроме того, количество сарказма (кстати, имеющего направленность в обе стороны - и в позитив, и в негатив. что приводит к его взаимной нейтрализации) - величина примерно одинаковая, поэтому ИЗМЕНЕНИЯ тональности нормально отслеживаются на одной и той же популяции. Там, по сути, берешь за "нулевую отметку" текущую ситуацию вместе со всеми ее сарказмами, опечатками и аллегориями - и смотришь изменения в этом конкретном срезе. Для практических целей - абсолютно достаточно. Это всё, по сути, и говорит ув. Хаунд. И это полностью соответствует моему личному ПРАКТИЧЕСКОМУ опыту. Айкубаз, Медиалогия и прочие программные продукты по оценке тональности больших текстовых массивов - это рабочие инструменты. Их сфера применения - прежде всего, практика, а не теория. ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Sergey написал: Важна тональность по изданиям, по регионам. Иначе, ни о каком контент-анализе не может и речи идти. Вы не пробовали посмотреть "на пальцах" динамику комментаторов Навального (числом тысяч в 10) под влиянием информационных воздействий? Очень, скажу я Вам, увлекательное занятие. Особенно когда это не единственная задача, а одна из многих. Конечно, "на пальцах" можно сделать всё. Вопрос во времени, бюджете и точности. А также - в визуализации, которая, кстати, и выявляет тренды более-менее объективно, в отличие от "среднепотолочной" экспертной оценки. ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
Sergey
Долгожитель форума
Всего сообщений: 640 Рейтинг пользователя: 2 Ссылка Дата регистрации на форуме: 9 июня 2010 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 5 марта 2012 14:32 Сообщение отредактировано: 5 марта 2012 14:34
Насчет практики. Все зависит от цели. Лично для себя - да, вполне достаточно "автомата", чтобы +-тенденция была. Если это коммерческая работа - то нет, не достаточно. Могу утверждать т.к. в среднем издаем более 2000 различных подобных обзоров в год т.ч. можно говорить и о "практике", и о точности.... p.s. Общая тенденция мало кого интересует без привязки и разбивки. А вот когда эта привязка и разбивка сделана, то и общий результат (тенденция) явна, наглядна и достоверна (да и суммируется уже без проблем). |
hound |
[q=Sergey]А насчет 1000 сообщений и невозможности их обработать... опять же все нет так и не разрешимо. По сути, из этой 1000 уникальных будет единицы, все остальное перепечатки и перетасовка слов. Достаточно иметь механизмы определения уникальности и идентичности. Группируем и получаем не 1000, а 10. [/q] Не всегда... Я приведу еще один пример. Вот на каком-то значимом информресурсе (высокопосещаемом интернет-СМИ) делается вброс некой информации в виде статьи. Обычно у них есть опция "комментирование". И вот - эту статью начинают комментировать. Число коментов может составлять сотни. Далее - эта статья начинает в том или ином видет копипаститься по сети. Опять же - там есть опции "кооментирование". Ну и вот так число оригинальных коментов доходит до тысяч. А ведь очень интересно посмотреть, какую реакцию у аудитории вызвало появление этой информации. Вручную обработать практически нереально. |
Sergey
Долгожитель форума
Всего сообщений: 640 Рейтинг пользователя: 2 Ссылка Дата регистрации на форуме: 9 июня 2010 |
hound написал:
Нужно разделять: - событие (уникальность новости) - информационный шум |
hound |
[q=Sergey]Нужно разделять:- событие (уникальность новости)- информационный шум [/q] Конечно, надо. Но интересует - какую реакцию у аудитории вызывало появление информации. Ну как обойтись без автоматизации, если реакция значительна (откликнулись тысячи людей)? |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Sergey написал: Все зависит от цели. Лично для себя - да, вполне достаточно "автомата", чтобы +-тенденция была. Sergey написал: Общая тенденция мало кого интересует без привязки и разбивки. А вот когда эта привязка и разбивка сделана, то и общий результат (тенденция) явна, наглядна и достоверна (да и суммируется уже без проблем). Я думаю, это еще сильно зависит от того, у кого какая коммерческая работа. Например, в нашей работе то, что Вы назвали "для себя" - это как раз то, что и надо нам, чтобы скорректировать свои действия (результативность которых и оплачивается заказчиком). Ему неинтересны даже все эти разбивки. Он их может вообще не видеть. Ему надо чтобы результат был. И нам разбивки интересны очень относительно - т.к. для нас это, по сути, функция "прицеливания" в каждый конкретный момент времени. Т.е., результаты отслеживания тренда - это чисто техническая информация "для себя" которая обеспечивает нам выполнение основной коммерческой работы. ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
hound написал: Игорь Нежданов написал: Согласен - всегда нужны доказательства. Даже не смотря на то, что тестирование системы уже проводилось на этом форуме причем дважды. За прошедшее время могло что то измениться. Тестировал систему на способность определять негатив. Объектом взял Путина, благо за последнее время материала в сети достаточно. Ограничил изучение блогами. Прошел первые две страницы выдачи системы. Если у кого есть желание - можете углубиться. Результат - из 18 сообщений отнесенных системой IQbuzz к негативным, действительно негативными оказались только 7 на всякий случай, на картинках, рядом с совсем не понятными материалами сделал врезки цитат - чтоб было понятно. Это 38,9% попаданий Ни о каком определении трендов/тенденций говорить не приходится. ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
следующее ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
и еще ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
<<Назад Вперед>> | Страницы: 1 2 3 4 5 6 7 8 9 ... 11 12 13 14 15 16 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Софт для конкурентной разведки » IQBuzz (Айкубаз). Автоматизация мониторинга и анализа. |
Самые активные 20 тем | |