<?xml version="1.0" encoding="windows-1251" ?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/">
<channel>
<title>Регулярные выражения в Рубриках программы SiteSputnik</title>
<link>http://forum.razved.info//index.php?t=5258</link>
<description>Регулярные выражения как логические величины в Правилах попадания в Рубрики</description>
<language>ru</language>
<item><guid>http://forum.razved.info//index.php?t=5258&amp;p=53455#pp53455</guid><title></title>
<link>http://forum.razved.info//index.php?t=5258&amp;p=53455#pp53455</link>
<description>  &lt;br&gt;Алексей Мыльников написал:&lt;blockquote&gt;&lt;div style="height:1px;width:1px;overflow:hidden"&gt;[q]&lt;/div&gt;... со временем, при реальной необходимости, сделаю сам и встрою с СайтСпутник утилиту для проверки регулярных выражений ...&lt;div style="height:1px;width:1px;overflow:hidden"&gt;[/q]&lt;/div&gt;&lt;/blockquote&gt;&lt;ul&gt;&lt;br /&gt;В &lt;b&gt;программе SiteSputnik&lt;/b&gt; в версии 8.8.3.10 от 05.11.14 появилась утилита для проверки &lt;b&gt;Регулярных выражений&lt;/b&gt; один-в-один как они интерпретируются СайтСпутником.&lt;br /&gt;&lt;br /&gt;К ней можно обратиться, находясь на вкладке "Рубрики", из подменю на правой кнопке: "Специальные функции - РегВыражения" или, как показано ниже, с самой картинки оформления Рубрики по кнопке "РВ" (см. черную стрелку):&lt;br /&gt;&lt;br /&gt;&lt;a href="http://sitesputnik.ru/Help/Pic/SSRub.GIF" target=_blank&gt;&lt;img src="http://sitesputnik.ru/Help/Pic/SSRub.GIF" alt="" name="itag" border=none&gt;&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Кстати, еще сделал кнопку "ЭП" (элементарное правило). По ней можно сложное &lt;u&gt;Правило попадания в Рубрики&lt;/u&gt; преобразовать к Элементарным правилам. Это помогает найти синтаксические и семантические ошибки в сложных Правилах, в частности, раскрываются круглые скобки, подставляются реальные значения из задействованных в Правиле словарей, ....&lt;br /&gt;&lt;br /&gt;Само окно проверки регулярных выражений таково:&lt;br /&gt;&lt;br /&gt;&lt;a href="http://sitesputnik.ru/Help/Pic/RegEx.jpg" target=_blank&gt;&lt;img src="http://sitesputnik.ru/Help/Pic/RegEx.jpg" alt="" name="itag" border=none&gt;&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;В первом окне можно задавать разные варианты текста, во втором разные варианты регулярных выражений и по кнопке "Применить" проверять: удовлетворяет ли заданный текст заданному регулярному выражению.&lt;br /&gt;&lt;/ul&gt;  </description>
<dc:creator>Алексей Мыльников</dc:creator>
<pubDate>Wed, 05 Nov 2014 12:43:18 +0300</pubDate>
</item><item><guid>http://forum.razved.info//index.php?t=5258&amp;p=53112#pp53112</guid><title></title>
<link>http://forum.razved.info//index.php?t=5258&amp;p=53112#pp53112</link>
<description>  &lt;br&gt;Алексей Мыльников написал:&lt;blockquote&gt;&lt;div style="height:1px;width:1px;overflow:hidden"&gt;[q]&lt;/div&gt;"Золотой ключик"  позволяет получать простым способом простые результаты. &lt;div style="height:1px;width:1px;overflow:hidden"&gt;[/q]&lt;/div&gt;&lt;/blockquote&gt;&lt;br /&gt;&lt;b&gt;Ещё несколько слов о простоте и мощности.&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;"Золотой ключик" можно применить как простое средство в SiteSputnik Pro.&lt;br /&gt;Если же Вы работаете с новостями (в SiteSputnik Pro+News) и Вам нужен просто агрегатор, то окрываете новый новостной Проект и просто впишите в него нужные RSS-адреса. Всё агрегатор готов. Ничего сложного. Результаты агрегации в "Чистом потоке".&lt;br /&gt;&lt;br /&gt;Если Вам нужно этот поток проанализировать на несколько тем, одна их которых Василий Шукшин, то создаете для этой темы Рубрику с правилом: &lt;br /&gt;&lt;br /&gt;&lt;font color="blue"&gt;(Василий /2 Шукшин | 'Калина красная' кинофильм | ещё что-нибудь) &lt;/font&gt;&lt;br /&gt;&lt;br /&gt;Сложнее? Да, но и выдача будет то, что нужно.&lt;br /&gt;Если Вам нужно, чтобы публикация была именно о Шукшине, а не упоминание его вскользь, то можно как вариант добавить через "логическое И" РВ &lt;font color="blue"&gt;{(Шукшин.{1,}){7,}}&lt;/font&gt;. Это выдаст публикации, где Шукшин упомянут не менее 7 раз. Кое-что &lt;b&gt;Vinni&lt;/b&gt; пояснил по работе РВ. Добалю от себя на популярном языке о работе этого РВ следующее. Оно ползёт по анализируемому тексту, попадает на Шукшин. Пока всё нормально. Далее видит .{1,} и понимает, что можно ползти далее и найти такую конструкцию нужно не менее 7 раз потому что на ней прописано {7,}. Если это удалось, то анализируемый текст удовлетворяет этому РВ.&lt;br /&gt;Все правило будет выглядеть так:&lt;font color="blue"&gt; {(Шукшин.{1,}){7,}} (Василий /2 Шукшин | 'Калина красная' кинофильм | ещё что-нибудь) &lt;/font&gt;&lt;br /&gt;&lt;br /&gt;Если Вам, чтобы сделать нужные выводы, надо что-то посмотреть в базе данных Кронос, или в Excel, или информация лежит на сайте и надо выйти через интернет на этот сайт..., в этом случае РВ Вам не помощник (оно не всемогуще) - то примените Внешние функции. Это ещё сложнее, но позволяет улучшить выдачу.&lt;br /&gt;&lt;br /&gt;Если источник информации не RSS-поток, а там где речь идет об "очень интересных вещах", RSS-ок точно нет, то сэмумируйте поток без &lt;a href="http://sitesputnik.ru/Help/SSMaster.htm" target=_blank&gt;Мастера&lt;/a&gt; подключения источников. Это чуть сложнее, чем просто вписать адрес RSS, но потоки, попадающие на анализ улучшатся.&lt;br /&gt;Если это не дает нужные ссылки, то примените Мастер. Это сложнее, но позволяет достать те данные, которые не достанешь через RSS и его эмуляцию.&lt;br /&gt;&lt;br /&gt;&lt;u&gt;Важно.&lt;/u&gt;&lt;br /&gt;1. Всё, что в &lt;b&gt;однокнопочных &lt;/b&gt;системах делаеся по одной кнопке в СайтСпутнике тоже делается по одной кнопке. &lt;br /&gt;2. Да, где-то что-то в сложных случаях можно сделать проще, точнее кому-то это будет проще, кому-то нет. Этими вопросами занимаюсь постоянно. У Вас есть эти где-то и что-то?  Если да, то пишите на форум или по е-майлу.&lt;br /&gt;  </description>
<dc:creator>Алексей Мыльников</dc:creator>
<pubDate>Tue, 16 Sep 2014 13:15:41 +0400</pubDate>
</item><item><guid>http://forum.razved.info//index.php?t=5258&amp;p=53109#pp53109</guid><title></title>
<link>http://forum.razved.info//index.php?t=5258&amp;p=53109#pp53109</link>
<description>  Благодарю!  &lt;img src="http://forum.razved.info//smiles/hi.gif"  align=absmiddle alt=":hi:"&gt; &lt;br /&gt;Действительно, не так и много. Но выглядит - аж жуть!!! &lt;br /&gt;Придётся "осиливать дорогу", а шо рабiць?  </description>
<dc:creator>Семёныч</dc:creator>
<pubDate>Tue, 16 Sep 2014 12:46:38 +0400</pubDate>
</item><item><guid>http://forum.razved.info//index.php?t=5258&amp;p=53106#pp53106</guid><title></title>
<link>http://forum.razved.info//index.php?t=5258&amp;p=53106#pp53106</link>
<description>  Еще один популярный метасимвол - точка (.). Он обозначает любой символ. Плюс иногда используют \d - это любая цифра. &lt;br /&gt;Символ + после метасимвола (или того, что заключено в круглые скобки) означает произвольное число повторений. \s+  -это и один пробел и десять пробелов&lt;br /&gt;Конструкция {число,число} - это явное ограничение на число повторений метасимвола или какой-то конструкции. Первое число - минимальное число повторений, а второе максимальное.&lt;br /&gt;\s{1,3} - это одного до трех пробелов .&lt;br /&gt;&lt;br /&gt;Собственно вот и все возможности. которые были использованы в примере  &lt;img src="http://forum.razved.info//smiles/wonder1.gif"  align=absmiddle alt=":wonder1:"&gt; &lt;br /&gt;&lt;br /&gt;  </description>
<dc:creator>Vinni</dc:creator>
<pubDate>Tue, 16 Sep 2014 12:03:57 +0400</pubDate>
</item><item><guid>http://forum.razved.info//index.php?t=5258&amp;p=53105#pp53105</guid><title></title>
<link>http://forum.razved.info//index.php?t=5258&amp;p=53105#pp53105</link>
<description>  &lt;br&gt;Семёныч написал:&lt;blockquote&gt;&lt;div style="height:1px;width:1px;overflow:hidden"&gt;[q]&lt;/div&gt;Простите, что так из далека захожу, но в нашем случае разработчик программы не будет каждому помогать составлять эти РВ. Даже, наверняка, не проблема их составить, проблема правильно их составить, а в приведённом мной выше примере пропуск какого-нибудь значка приведёт к хреновому результату или к никакому. &lt;div style="height:1px;width:1px;overflow:hidden"&gt;[/q]&lt;/div&gt;&lt;/blockquote&gt;&lt;br /&gt;&lt;br /&gt;Да - с РВ ошибка в одном символе может дорого стоить.  &lt;img src="http://forum.razved.info//smiles/goodbuy.gif"  align=absmiddle alt=":goodbuy:"&gt; &lt;br /&gt;Поэтому я сам сначала беру несколько текстовых строк, на которых отлаживаю РВ в интерактивном режиме &lt;br /&gt;И только потом использую полученное РВ.&lt;br /&gt;&lt;br /&gt;На самом деле базовых конструкций РВ не так уж много - после некоторой практики (дорогу осилит идущий  &lt;img src="http://forum.razved.info//smiles/wink.gif"  align=absmiddle alt=":wink:"&gt; ) Вы освоите их и сможете легко использовать.  &lt;img src="http://forum.razved.info//smiles/yes.gif"  align=absmiddle alt=":yes:"&gt; &lt;br /&gt;&lt;br /&gt;&lt;blockquote&gt;&lt;div style="height:1px;width:1px;overflow:hidden"&gt;[q]&lt;/div&gt;&lt;br /&gt;(Украина |ДНР |ЛНР) {(\sПутин\s.{1,}){3,}} - удовлетворяют контенты ссылок, в которых речь идет об Украине, или ДНР или ЛНР и Путин в именительном падеже упомянут не менее 3-х раз. Здесь одно РВ применено совместно с обычными величинами.&lt;br /&gt;(Украина | {(\s|")(Д|Л)НР(\s|")}) {(\sПутин\s.{1,}){3,}} - тот же самый результат, но задействованы два РВ. Вместо 'ДНР' | 'ЛНР' использовано {(\s|")(Д|Л)НР(\s|")}.&lt;br /&gt;&lt;div style="height:1px;width:1px;overflow:hidden"&gt;[/q]&lt;/div&gt;&lt;/blockquote&gt;&lt;br /&gt;&lt;br /&gt; Давайте разберем на этом примере некоторые возможности.&lt;br /&gt; Нам нужно найти тексты, в которых говорится об определенной тематике. В таких текстах будут использоваться определенные слова-маркеры (не обязательно все сразу). &lt;br /&gt;Мы выбрали три таких слова - Украина, ЛНР и ДНР. Конструкция &lt;font color="blue"&gt;(Украина | 'ДНР' | 'ЛНР')&lt;/font&gt; означает, что в результате использования этого РВ будут возвращаться тексты, содержащие хотя бы одно из этих слов (символ |  -это на самом деле ИЛИ). Круглые скобки - это ограничитель вариантов (надо же указать, где начало первого варианта и конец последнего).&lt;br /&gt;&lt;br /&gt;так как слова ДНР и ЛНР похожи (отличаются на одну букву), то можно оптимизировать список вариантов и (ДНР|ЛНР) написать как ((Д|Л)НР). То есть бвудут искаться строки, начинающиеся либо с Л либо с Д, за которыми идет строка НР.&lt;br /&gt;&lt;br /&gt;Еще одна возможность РВ - метасимволы и возможность указывать сразу группу символов при поиске в тексте. Обычно используют символ&lt;font color="blue"&gt; \s&lt;/font&gt; для описания символов-разделителей слов (пробел, табуляция и т.д.) и &lt;font color="purple"&gt;\S&lt;/font&gt; для описания букв и цифр (значимые символы).  &lt;br /&gt;Поэтому конструкция \sПутин\s означает отдельное слово Путин с пробелами или другими разделителями слов перед ним и после него, а не "Путина" и т.д.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt; &lt;br /&gt;  </description>
<dc:creator>Vinni</dc:creator>
<pubDate>Tue, 16 Sep 2014 11:59:06 +0400</pubDate>
</item><item><guid>http://forum.razved.info//index.php?t=5258&amp;p=53104#pp53104</guid><title></title>
<link>http://forum.razved.info//index.php?t=5258&amp;p=53104#pp53104</link>
<description>  &lt;br&gt;Семёныч написал:&lt;blockquote&gt;&lt;div style="height:1px;width:1px;overflow:hidden"&gt;[q]&lt;/div&gt;разработчик программы не будет каждому помогать составлять эти РВ&lt;div style="height:1px;width:1px;overflow:hidden"&gt;[/q]&lt;/div&gt;&lt;/blockquote&gt;&lt;br /&gt;1. Почему не будет помогать, - помогу я или, надеюсь, другие. Не думаю, что в день будет по 5 запросов на новые сложные РВ. У Вас есть хоть один? &lt;br /&gt;&lt;br /&gt;2. РВ бывают не только сложные, но и простые.&lt;br /&gt;&lt;br /&gt;3. Никто никого не принуждает писать РВ, Вы же как-то жили без этого. Всё что было ранее - работает. Никто ничего не отменял.&lt;br /&gt;&lt;br /&gt;4. Кстати, есть и более сложные чем РВ вещи в СайтСпутнике - это &lt;a href="http://sitesputnik.ru/Help/SSNewsEF.htm" target=_blank&gt;Внешние функции&lt;/a&gt;, и есть Пользователи, которые их применяют.&lt;br /&gt;&lt;br /&gt;Мне как сделать одну кнопку на программе, Вы нажмете на неё и получите то, что Вам нужно в данный момент? Такая кнопка есть - это "Золотой ключик", но он позволяет получать простым способом только простые результаты.  </description>
<dc:creator>Алексей Мыльников</dc:creator>
<pubDate>Tue, 16 Sep 2014 09:48:28 +0400</pubDate>
</item><item><guid>http://forum.razved.info//index.php?t=5258&amp;p=53103#pp53103</guid><title></title>
<link>http://forum.razved.info//index.php?t=5258&amp;p=53103#pp53103</link>
<description>  Если честно, то я себя считал знатоком программы СайтСпутник по уровню чуть выше среднего. &lt;br /&gt;Но вот после таких запросов &lt;b&gt;(Украина | {(\s|")(Д|Л)НР(\s|")}) {(\sПутин\s.{1,}){3,}} &lt;/b&gt; у меня зубы морщатся и морда чешется.&lt;br /&gt;Знаете, что мне это напоминает? Вот есть спортивный болид, есть на него гонщик и есть группа механиков. Кто-то отвечает за подвеску, кто-то за настройку коробки передач, кто-о за систему впрыска и т.д. Но есть один супер механик - "дядя Вася" (в нашем случае это Алексей мыльников), который может через воздушный фильтр влезть, пробраться через двигатель и топливную систему, а из выхлопной трубы вылезть. И счастье гонщика, что такой д.Вася в его команде и всегда под рукой.&lt;br /&gt;Простите, что так из далека захожу, но в нашем случае разработчик программы не будет каждому помогать составлять эти РВ. Даже, наверняка, не проблема их составить, проблема &lt;b&gt;правильно&lt;/b&gt; их составить, а в приведённом мной выше примере пропуск какого-нибудь значка приведёт к хреновому результату или к никакому. &lt;br /&gt;Когда появились пакеты запросов, то в скором времени появились и стандартные пакеты запросов. Может и с РВ они в скорости появятся. Я реально сомневаюсь, что эта тема под силу малоопытному пользователю СайтСпутника. И даже опытному ошибиться в составлении - пара пустяков.  </description>
<dc:creator>Семёныч</dc:creator>
<pubDate>Tue, 16 Sep 2014 09:14:07 +0400</pubDate>
</item><item><guid>http://forum.razved.info//index.php?t=5258&amp;p=53083#pp53083</guid><title></title>
<link>http://forum.razved.info//index.php?t=5258&amp;p=53083#pp53083</link>
<description>  &lt;br&gt;Алексей Мыльников написал:&lt;blockquote&gt;&lt;div style="height:1px;width:1px;overflow:hidden"&gt;[q]&lt;/div&gt;Поэтому если есть нормальный инстумент для отладки РВ, то подскажите Пользователям, &lt;div style="height:1px;width:1px;overflow:hidden"&gt;[/q]&lt;/div&gt;&lt;/blockquote&gt;&lt;br /&gt;&lt;br /&gt;Хм. Я как раз рекомендовал инструмент для отладки РВ. Вы его сначала посмотрите, а потом уж делайте выводы  &lt;img src="http://forum.razved.info//smiles/wink.gif"  align=absmiddle alt=":wink:"&gt; &lt;br /&gt;&lt;br /&gt;  </description>
<dc:creator>Vinni</dc:creator>
<pubDate>Mon, 15 Sep 2014 13:32:29 +0400</pubDate>
</item><item><guid>http://forum.razved.info//index.php?t=5258&amp;p=53076#pp53076</guid><title></title>
<link>http://forum.razved.info//index.php?t=5258&amp;p=53076#pp53076</link>
<description>  Физическое лицо и только физическое лицо регулярным выражением из текста не выделишь. Как фильтр грубой очисти РВ для этого пригодно, но не более того.   </description>
<dc:creator>Алексей Мыльников</dc:creator>
<pubDate>Sun, 14 Sep 2014 21:22:53 +0400</pubDate>
</item><item><guid>http://forum.razved.info//index.php?t=5258&amp;p=53072#pp53072</guid><title></title>
<link>http://forum.razved.info//index.php?t=5258&amp;p=53072#pp53072</link>
<description>  &lt;br&gt;tungus1973 написал:&lt;blockquote&gt;&lt;div style="height:1px;width:1px;overflow:hidden"&gt;[q]&lt;/div&gt;Для: Игорь Нежданов&lt;br /&gt;А можно привести какой-нибудь несложный пример? &lt;div style="height:1px;width:1px;overflow:hidden"&gt;[/q]&lt;/div&gt;&lt;/blockquote&gt;&lt;br /&gt;Можно, но он вряд ли поможет в случае с СайтСпутником - мы используем другой семантический движок. А пример правила вот:&lt;br /&gt;&lt;br /&gt;Для выявления указаний на человека (ФИО, ФИ, Ф, И, ИО) с использованием (или без) разного рода обращений&lt;br /&gt;ProperName -&amp;gt;  Word&amp;lt;h-reg1&amp;gt;+;&lt;br /&gt;Person -&amp;gt; ProperName | 'человек';&lt;br /&gt;FormOfAddress -&amp;gt; 'товарищ' | 'мистер' | 'господин' | 'сэр' | 'сударь' | 'госпожа' | 'мадам' | 'сударыня';  // тут целый словарь вариантов обращений, в том числе сокращенных, неуважительных и т.п..&lt;br /&gt;AdjCoord -&amp;gt; Adj;&lt;br /&gt;AdjCoord -&amp;gt; AdjCoord&amp;lt;gnc-agr[1]&amp;gt; ',' Adj&amp;lt;gnc-agr[1]&amp;gt;;&lt;br /&gt;AdjCoord -&amp;gt; AdjCoord&amp;lt;gnc-agr[1]&amp;gt; 'и' Adj&amp;lt;gnc-agr[1]&amp;gt;;&lt;br /&gt;S -&amp;gt; Adj+ (FormOfAddress) Person;&lt;br /&gt;S -&amp;gt; AdjCoord (FormOfAddress) Person;  </description>
<dc:creator>Игорь Нежданов</dc:creator>
<pubDate>Sun, 14 Sep 2014 12:00:23 +0400</pubDate>
</item></channel>
</rss>