Текущая версия от 18:17, 14 мая 2023

Перевод: Максим Кузьмин

Проверка/Оформление/Редактирование: Мякишев Е.А.

Модуль ure – простые регулярные выражения^[1]

В этом модуле реализована часть функционала соответствующего модуля CPython. Более подробно читайте в документации к CPython о модуле re.

В этом модуле реализованы операции с регулярными выражениями. Если точнее, часть синтаксиса регулярных выражений из CPython’овского модуля re (по сути, это расширенные регулярные выражения POSIX).

Операторы и специальные последовательности, поддерживаемые в модуле ure:

. – соответствует любому символу.
[...] – соответствует набору символов. Поддерживаются как отдельные символы, так и диапазоны символов, включая наборы с отрицанием (например, [^a-c]).
^ – соответствует началу строки.
$ – соответствует концу строки.
? – соответствует нулю или одному повторению последнего символа из шаблона слева.
* – соответствует нулю или более повторений последнего символа из шаблона слева.
+ – соответствует одному или более повторений последнего символа из шаблона слева.
?? – не жадная (ленивая) версия ?; соответствует нулю или одному повторению последнего символа из шаблона слева (с предпочтением к нулю повторений).
*? – не жадная (ленивая) версия *; соответствует нулю или более повторений последнего символа из шаблона слева (с предпочтением к наиболее короткому повторению).
+? – не жадная (ленивая) версия +; соответствует одному или более повторений последнего символа из шаблона слева (с предпочтением к наиболее короткому повторению).
| – соответствует левой или правой части шаблона.
(...) – группировка регулярных выражений. Доступ к подстрокам, выловленным с помощью группировки, можно получить при помощи метода match.group().
\d – соответствует любой цифре. Эквивалент [0-9].
\D – соответствует любому нечисловому значению. Эквивалент [^0-9].
\s – соответствует любому пробельному символу. Эквивалент [ \t-\r].
\S – соответствует любому непробельному символу. Эквивалент [^ \t-\r].
\w – соответствует любому «словообразующему» символу, то есть букве, цифре или нижнему подчеркиванию (только ASCII). Эквивалент [A-Za-z0-9_].
\W – соответствует любому символу, не являющемуся «словообразующим» (только ASCII). Эквивалент [^A-Za-z0-9_].
\ – символ экранирования. Любой символ, идущий за \, будет воспринят буквально (за исключением перечисленных ниже). Благодаря этому символы, описанные выше, можно будет использовать для сравнения. Например, \* будет эквивалентом буквальному * (то есть * не будет восприниматься как оператор). К управляющим символам \r, \n и так далее не применяется никакого особого подхода, поэтому они будут эквивалентами r, n и т.д. По этой причине в регулярных выражениях не рекомендуется использовать неформатированные Python-строки (r""). Например, если задать в регулярном выражении r"\r\n", это будет эквивалентом "rn". Поэтому, если вам нужно задать в регулярном выражении символ возврата каретки (CR), за которым идет символ перевода строки (LF), используйте "\r\n".

НЕ ПОДДЕРЖИВАЮТСЯ:

{m,n} – количество повторений от m до n
(?P<название>...) – именованные группы
(?:...) – группы без захвата
\b, \B – продвинутые специальные наборы символов
экранирование специальных символов вроде \r, \n и так далее – используйте для этого Python’овское экранирование
и т.д.

Пример:

import ure

# Поскольку в модуле «ure» не поддерживается 
# экранирование управляющих символов, 
# строки r"" использовать не рекомендуется:
regex = ure.compile("[\r\n]")

regex.split("line1\rline2\nline3\r\n")

# Результат:
# ['line1', 'line2', 'line3', '', '']

Функции

ure.compile(regex_str[, flags]) – компилирует регулярное выражение, возвращает объект regex.
ure.match(regex_str, string) – компилирует регулярное выражение regex_str и сопоставляет его со строкой string. Сопоставление всегда выполняется в начале строки.
ure.search(regex_str, string) – компилирует regex_str и ищет его в строке string. В отличие от match(), эта функция ищет заданный шаблон не только в начале строки, а по всей строке, и возвращает самое первое обнаруженное совпадение. Впрочем, если регулярное выражение привязано к началу строки, найденное совпадение все равно может находиться на 0-ой позиции.
ure.sub(regex_str, replace, string, count=0, flags=0, /) – компилирует regex_str и ищет его в строке string , заменяя все совпадения на replace и возвращая новую строку.

Значение в аргументе replace может быть строкой или функцией. Если это строка, то в ней можно воспользоваться экранированными последовательностями вроде \<number> и \g<number>, чтобы вставить в строку содержимое группы (если совпадений по группам не будет, в эти места будут вставлены пустые строки). Если это функция, то у нее должен быть только один аргумент (объект match), а ее возвращаемым значением должна быть строка, которой будут заменяться найденные совпадения. В аргументе count должно быть ненулевое значение, и в нем задается то, сколько раз нужно выполнить замену. Аргумент flags игнорируется. Доступность: Эта функция есть не во всех MicroPython-портах.

ure.DEBUG – флаговое значение. Показывает отладочную информацию о скомпилированном выражении.

Доступность: Эта функция есть не во всех MicroPython-портах.

Объекты «regex»

Скомпилированное регулярное выражение. Экземпляры этого класса создаются при помощи ure.compile().

regex.match(string) – работает аналогично функции ure.match().
regex.search(string) – работает аналогично функции ure.search().
regex.sub(replace, string, count=0, flags=0, /) – работает аналогично функции ure.sub().

Для повышения эффективности при работе с методами regex.match(string), regex.search(string) и regex.sub(), используйте для разных строк один и тот же объект regex.

regex.split(string, max_split=-1, /) – разбивает строку при помощи regex. В аргументе max_split задается максимальное количество разбиений. Возвращает список строк (количество возвращаемых элементов может быть max_split+1).

Объекты «match»

Объекты match возвращаются методами match() и search() и передаются функции replace в методе sub().

match.group(index) – возвращает совпавшие подстроки. Если задать в аргументе index значение «0», это вернет весь match целиком, а если «1» и больше, это вернет совпадение, соответствующее номеру заданной группы. Поддерживаются только числовые группы.
match.groups() – возвращает кортеж, содержащий все подстроки-группы объекта match.

Доступность: Эта функция есть не во всех MicroPython-портах.

match.start([index]) – возвращает индекс исходной строки, где находится начало заданной подстроки-группы index. По умолчанию обрабатывается весь match целиком, или же в group можно задать номер группы и таким образом выбрать именно ее.
match.end([index]) – возвращает индекс исходной строки, где находится конец заданной подстроки-группы index. По умолчанию обрабатывается весь match целиком, или же в index можно задать номер группы и таким образом выбрать именно ее.

Доступность: Функции match.start() и match.end() есть не во всех MicroPython-портах.

match.span([index]) – возвращает кортеж с 2 элементами (match.start(index), match.end(index)).

Доступность: Эта функция есть не во всех MicroPython-портах.

См.также

Внешние ссылки

↑ docs.micropython.org - ure – simple regular expressions

[1] s.micropython.org - ure – simple regular expressions

[1]

@@ Строка 41: / Строка 41: @@
 Пример:
-<syntaxhighlight lang="python" enclose="div">
+<syntaxhighlight lang="python">
 import ure

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

MicroPython:Библиотеки/ure: различия между версиями

Текущая версия от 18:17, 14 мая 2023

Содержание

Модуль ure – простые регулярные выражения^[1]

Функции

Объекты «regex»

Объекты «match»

См.также

Внешние ссылки

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты

MicroPython:Библиотеки/ure: различия между версиями

Текущая версия от 18:17, 14 мая 2023

Модуль ure – простые регулярные выражения[1]

Функции

Объекты «regex»

Объекты «match»

См.также

Внешние ссылки

Навигация

Поиск

Модуль ure – простые регулярные выражения^[1]