JavaScript | Синтаксис регулярных выражений

Синтаксис регулярных выражений

Последнее обновление: 27.10.2023

Определение классов символов

Для определения регулярных выражений мы можем использовать классы символов. Для определения класса символов применяются квадратные скобки:

[xyz] (альтернативное соответствие): соответствует одному из символов: x, y или z (аналог x|y|z)
[^xyz] (отрицание): соответствует тексту, который содержит любые символы КРОМЕ x, y или z
[a-zA-Z] (диапазон): соответствует любому символу из диапазона a-z или A-Z

Например, нам надо проверить, есть ли в тексте символы "a", "b" или "c":

const exp = /[abc]/;    // соответствует либо "a", либо "b", либо "c"

const str1 = "JavaScript";
const str2 = "Pascal";
const str3 = "Python";
console.log(exp.test(str1));   // true
console.log(exp.test(str2));   // true
console.log(exp.test(str3));   // false

Выражение [abc] указывает на то, что строка должна иметь одну из трех букв. Выражение "[abc]" также эквивалентно выражению "a|b|c".

Возьмем более практический пример. Допустим, у нас есть 4-х символьные pin-коды, и нам надо проверить, что pin-код содержит только цифры:

const exp = /[0-9][0-9][0-9][0-9]/;    // соответствует четырем цифрам подряд

const code1 = "1234";
const code2 = "jav5";
const code3 = "3452";
console.log(exp.test(code1));   // true
console.log(exp.test(code2));   // false
console.log(exp.test(code3));   // true

Выражение [0-9][0-9][0-9][0-9] соответствует любой последовательности из 4 цифр подряд. Например, такому шаблону соответствует строка "3452", но НЕ соответствует строка "jav5" (здесь только одна цифра). Строка "jav5" соответстветствовала бы шаблону "[a-z][a-z][a-z][0-9]" (первые три алфафитных символа в нижнем регистре, за которыми идет цифра).

Сразу стоит отметить, что выражение [0-9][0-9][0-9][0-9] не оптимально, и далее мы посмотрим, как его можно упростить.

Еще один пример - применим отрицание:

const exp = /[^a-z]/;    // соответствует любым символам, кроме символов из диапазона a-z

const code1 = "zorro";
const code2 = "zorro5";
const code3 = "34521";
console.log(exp.test(code1));   // false
console.log(exp.test(code2));   // true
console.log(exp.test(code3));   // true

Здесь строки проверяются на соответствие выражению "[^a-z]", которое соответствует любым символам, кроме символов из диапазона a-z. Например, строка "zorro" НЕ соответствует этому выражению. Однако ему соответствует строка "zorro5", потому что в ней есть символ, не входящий в диапазон "a-z".

При необходимости мы можем собирать комбинации выражений:

const exp = /[дт]о[нм]/;    // соответствует строкам "дом", "том", "дон", "тон"

const str1 = "дома";
const str2 = "сома";
const str3 = "тона";
console.log(exp.test(str1));   // true
console.log(exp.test(str2));   // false
console.log(exp.test(str3));   // true

Выражение [дт]о[нм] указывает на те строки, которые могут содержать подстроки "дом", "том", "дон", "тон".

Метасимволы

Вместо определения своих классов символов мы можем использовать встроенные, которые еще называют метасимволы - символы, которые имеют определенный смысл:

\d: соответствует любой цифре от 0 до 9. Аналогичен выражению [0-9]
\D: соответствует любому символу, который не является цифрой. Аналогичен выражению [^0-9]
\w: соответствует любой букве, цифре или символу подчеркивания (диапазоны A–Z, a–z, 0–9). Аналогичен выражению [a-zA-Z_0-9]
\W: соответствует любому символу, который не является буквой, цифрой или символом подчеркивания (то есть не находится в следующих диапазонах A–Z, a–z, 0–9). Аналогичен выражению [^\w]
\s: соответствует пробелу. Аналогичен выражению [\t\n\x0B\f\r]
\S: соответствует любому символу, который не является пробелом. Аналогичен выражению [^\s]
.: соответствует любому символу

Здесь надо заметить, что метасимвол \w применяется только для букв латинского алфавита, кириллические символы для него не подходят.

Так, выше для проверки, что код имеет только 4 цифры, использовалось выражение /[0-9][0-9][0-9][0-9]/. Мы его можем сократить, используя метасимвол "\d":

const exp = /\d\d\d\d/;    // соответствует четырем цифрам подряд

const code1 = "1234";
const code2 = "jav5";
const code3 = "3452";
console.log(exp.test(code1));   // true
console.log(exp.test(code2));   // false
console.log(exp.test(code3));   // true

Другой пример. Допустим, нам надо найти строки, где определен номер телефона. Причем, номер телефона в формате +х-ххх-ххх-хххх:

const exp = /\+\d-\d\d\d-\d\d\d-\d\d\d\d/;
const contact1 = "Email: mycomp@gmail.com";
const contact2 = "Phone: +1-234-567-8901";
console.log(exp.test(contact1));    // false
console.log(exp.test(contact2));    // true

Так, номеру телефона +1-234-567-8901 соответствует /\+\d-\d\d\d-\d\d\d-\d\d\d\d/:

\+	\d	-	\d	\d	\d	-	\d	\d	\d	-	\d	\d	\d	\d
+	1	-	2	3	4	-	5	6	7	-	8	9	0	2

Обратите внимание на слеш перед плюсом (\+). Поскольку плюс + имеет специальное значение, то, чтобы указать, что мы имеет ввиду именно плюс как символ строки, перед ним ставится слеш.

В результате в строке "Phone: +1-234-567-8901" метод exp.test(contact2) сопоставит с регулярным выражением подстроку "+1-234-567-8901"

Ограничение применения регулярных выражений

Ряд специальных символов позволяют ограничить диапазон применения регулярных выражений:

^: соответствует началу строки. Например, ^h соответствует строке "home", но не "ohma", так как h должен представлять начало строки
$: соответствует концу строки. Например, м$ соответствует строке "дом", так как строка должна оканчиваться на букву м
\b: соответствует началу или концу слова.
\B: не учитывает границы слова

Например, нам нужно найти строки с номером телефона:

const exp = /\d\d\d\d\d\d\d\d\d\d/;    // соответствует 10 цифрам подряд

const phone1 = "+12345678901";
const phone2 = "42345678901";
console.log(exp.test(phone1));   // true
console.log(exp.test(phone2));   // true

Шаблону /\d\d\d\d\d\d\d\d\d\d/ соответствуют как строка "+12345678901", так и строка "42345678901". Но, допустим, нам надо найти номера телефонов, которые не предваряются плюсом +. В этом случае мы можем использовать регулярное выражение /^\d\d\d\d\d\d\d\d\d\d/. Таким образом, строка будет соответствовать шаблону, если она начинается с цифровых символов:

const exp = /^\d\d\d\d\d\d\d\d\d\d/;    // соответствует 10 цифрам подряд

const phone1 = "+12345678901";
const phone2 = "42345678901";
console.log(exp.test(phone1));   // false
console.log(exp.test(phone2));   // true

Другой пример. Пусть нам надо проверить, есть ли в строке упонимание языка "Java". Наивный подход состоял бы в использовании регулярного выражения /Java/:

const exp = /Java/;   

const str1 = "Java is a high-level, object-oriented programming language";
const str2 = "JavaScript is a programming language of the World Wide Web";
console.log(exp.test(str1));   // true
console.log(exp.test(str2));   // true

Однако в реальности шаблон "/Java/" соответствует любой строке, которая содержит подстроку "Java", в том числе строке "JavaScript". Однако нам надо найти только те строки, где речь идет именно о Java, а не о JavaScript. И в этом случае мы можем ограничить поиск границами слова с помощью "\b":

const exp = /Java\b/;    // 

const str1 = "Java is a high-level, object-oriented programming language";
const str2 = "JavaScript is a programming language of the World Wide Web";
console.log(exp.test(str1));   // true
console.log(exp.test(str2));   // false

Флаг "\B", наоборот, указывать сопоставлять шаблон с подстроками, которые не являются слова:

const exp = /Java\B/;    // 

const str1 = "Java is a high-level, object-oriented programming language";
const str2 = "JavaScript is a programming language of the World Wide Web";
console.log(exp.test(str1));   // false
console.log(exp.test(str2));   // true

Флаги выражений

Флаги позволяют настроить поведение регулярных выражений. Каждый флаг представляет отдельный символ, который ставится в конце регулярного выражения. В JavaScript применяются следующие флаги:

Флаг global позволяет найти все подстроки, которые соответствуют регулярному выражению. По умолчанию при поиске подстрок регулярное выражение выбирает первую попавшуюся подстроку из строки, которая соответствует выражению. Хотя в строке может быть множество подстрок, которые также соответствуют выражению. Для этого применяется данный флаг в виде символа g в выражениях
Флаг ignoreCase позволяет найти подстоки, которые соответствуют регулярному выражению, вне зависимости от регистра символов в строке. Для этого в регулярных выражениях применяется символ i
Флаг multiline позволяет найти подстроки, которые соответствуют регулярному выражению, в многострочном тексте. Для этого в регулярных выражениях применяется символ m
Флаг dotAll позволяет сопоставить точку в регулярном выражении с любым символом текста, в том числе с разделителем строки. Для этого в регулярных выражениях применяется символ s

Флаг i. Регистр символов

Рассмотрим следующий пример:

const str = "Hello World";
const exp = /world/;
console.log(exp.test(str)); // false

Здесь совпадения строки с выражением нет, так как "World" отличается от "world" по регистру. В этом случае надо изменить регулярное выражение, добавив в него флаг i:

const str = "Hello World";
const exp = /world/i;
console.log(exp.test(str)); // true

Обратите внимание, где в регулярном выражении указывается флаг: /world/i - в самом конце регулярного выражения.

Флаг s

Флаг s позволяет сопоставить символ . (точка) с любым символом, в том числе и с разделителем строки. Например, возьмем следующий пример:

const str = "hello\nworld";
const exp = /hello world/;
console.log(exp.test(str));	// false

Здесь в строке "hello\nworld" слова "hello" и "world" разделены переносом строки (например, мы имеем дело с многострочным текстом). Однако, например, мы хотим, чтобы JavaScript не учитывал перенос строки и чтобы данный текст соответствовал регулярному выражению /hello world/. В этом случае мы можем применить флаг s:

const str = "hello\nworld";
const exp = /hello.world/s;
console.log(exp.test(str));	// true

В выражении /hello.world/s точка означает произвольный символ. Однако без флага s данное выражение не будет соответствовать многострочному тексту.

Комбинация флагов

Также можно использовать сразу несколько флагов:

const str = "hello\nWorld";
const exp = /hello.world/si;
console.log(exp.test(str));	// true

Назад Содержание Вперед

Глава 1. Введение в JavaScript
- Что такое JavaScript
- Первая программа на JavaScript
- Выполнение кода javascript
- Подключение внешнего файла JavaScript
- Консоль браузера и console.log
Глава 2. Основы javascript
- Переменные и константы
- Типы данных
- Арифметические операции
- Поразрядные операции
- Условные выражения
- Условные операторы ?: и ??
- Преобразование данных
- Введение в массивы
- Условные конструкции
- Циклы
- Отладка и отладчик
Глава 3. Функциональное программирование
- Функции
- Параметры функции
- Результат функции
- Стрелочные функции
- Область видимости переменных
- Замыкания
- Функции IIFE
- Рекурсивные функции
- Переопределение функций
- Hoisting
- Передача параметров по значению и по ссылке
Глава 4. Объектно-ориентированное программирование
- Объекты
- Ключевое слово this
- Вложенные объекты и массивы в объектах
- Копирование и сравнение объектов
- Проверка наличия и перебор методов и свойств
- Объекты в функциях
- Функции-конструкторы объектов
- Расширение объектов. Прототипы
- Функция как объект. Методы call и apply
- Функция Object.create. Конфигурация свойств объектов
- Наследование прототипов
- Наследование прототипов конструкторов
- Инкапсуляция свойств. Геттеры и сеттеры
- Деструктуризация
- Оператор ?.
- Константные объекты. Запрет изменения объекта
Глава 5. ООП. Классы.
- Классы
- Приватные поля и методы
- Статические поля и методы
- Свойства и методы доступа
- Наследование
Глава 6. Массивы
- Создание массива и объект Array
- Массивы и spread-оператор
- Операции с массивами
- Наследование массивов
Глава 7. Строки и регулярные выражения
- Строки и объект String
- Шаблоны строк
- Объект RegExp. Регулярные выражения
- Синтаксис регулярных выражений
- Квантификаторы в регулярных выражениях
- Поиск в строке
- Группы в регулярных выражениях
- Регулярные выражения в методах String
Глава 8. Обработка ошибок
- Конструкция try..catch..finally
- Генерация ошибок и оператор throw
- Типы ошибок
- Обработка ошибок и стек вызова функций
Глава 9. Встроенные объекты
- Объект Date. Работа с датами
- Объект Math. Математические операции
- Объект Number
- Символы
- Proxy
Глава 10. Коллекции и итераторы
- Итераторы
- Генераторы
- Множества Set
- Map
- WeakSet
- WeakMap
Глава 11. Работа с DOM
- Введение в DOM
- Свойства объекта document
- Поиск элементов на веб-странице
- Объект Node. Навигация по DOM
- Элементы
- Создание, добавление и удаление элементов
- Управление атрибутами элементов
- Управление стилем и классами элементов
- Создание своего элемента HTML
Глава 12. События
- Введение в обработку событий
- Обработчики событий
- Передача данных в обработчик события. Объект Event
- Распространение событий
- События мыши
- События клавиатуры
- Программный вызов событий
- Определение своих событий
Глава 13. Работа с формами
- Формы и их элементы
- Кнопки
- Текстовые поля
- Флажки и радиокнопки
- Список select
- Validation API. Валидация элементов формы
- Управление валидацией форм
Глава 14. Работа с браузером и BOM
- Browser Object Model и объект window
- Диалоговые окна и поиск на странице
- Открытие, закрытие и позиционирование окон
- История браузера. History API
- Объект location
- Объект navigator. Получение информации о браузере
- Таймеры
Глава 15. Форматы JSON и XML
- Работа с JSON
- Работа с XML
Глава 16. Хранение данных
- Куки
- Web Storage
Глава 17. Promise, async и await
- Асинхронные функции и коллбеки
- Введение в промисы
- Получение результата операции в Promise
- Обработка ошибок в Promise
- Создание цепочек промисов
- Функции Promise.all, Promise.allSettled, Promise.any и Promise.race
- Async и await
- Асинхронные итераторы
- Асинхронные генераторы
Глава 18. AJAX-запросы и XMLHttpRequest
- XMLHttpRequest и отправка ajax-запросов
- Загрузка HTML с помощью XMLHttpRequest
- Загрузка XML с помощью XMLHttpRequest
- Загрузка JSON с помощью XMLHttpRequest
- Отправка данных в ajax-запросе
- Отправка форм в ajax-запросе
- Promise в Ajax-запросах
Глава 19. Fetch API
- Функция fetch
- Объект Response и его свойства
- Получение данных из ответа
- Настройка параметров запроса. Отправка данных
- Создание клиента для REST API
Глава 20. Web Socket API и Server-Sent Events
- Web Socket API
- Server-Sent Events
Глава 21. Локализация
- Введение в Internationalization API
- Локализация списков и Intl.ListFormat
- Локализация дат и времени
- Локализация названий и Intl.DisplayNames
- Форматирование чисел и Intl.NumberFormat
- Int.Collator и сравнение строк
Глава 22. Модули
- Введение в модули
- Импорт модуля
- Экспорт и импорт компонентов модулей
- Экспорт и импорт по умолчанию
- Использование псевдонимов при экспорте и импорте
- Динамическая загрузка модулей
Глава 23. Canvas API
- Canvas и его контекст. Рисование прямоугольников
- Настройка рисования
- Фоновые изображения
- Создание градиента
- Рисование текста
- Рисование фигур
- Рисование изображений
- Добавление теней
- Редактирование пикселей
- Трансформации
- Рисование мышью
- Сохранение и восстановление состояния canvas
- Анимация на canvas
Глава 24. IndexDB API
- Создание, открытие и удаление базы данных
- Управление базой данных в IndexedDB
- Выполнение запросов к базе данных
- Добавление объектов в хранилище
- Получение данных из IndexDB
- Обновление объектов хранилища
- Получение количества объектов
- Удаление данных из хранилища
- Курсоры
Глава 25. Drag-and-Drop API
- Перетаскивание элементов с помощью Drag-and-Drop API
- Установка и послучение перетаскиваемых данных с помощью DataTransfer
Глава 26. File API
- Загрузка файлов
- Чтение файлов с FileReader
- Отслеживание процесса загрузки файла
Глава 27. Web Worker API
- Определение и выполнение веб-воркера
- Обмен сообщениями между веб-воркером и основным потоком
Глава 28. Дополнительные Web API
- Geolocation API
- Battery Status API
- Web Speech API. Синтез речи
- Web Speech API. Распознавание речи
- Web Animation API
Глава 29. Дополнительные статьи
- Паттерн пространство имен
- Паттерн Модуль
- JavaScript в CSS

Помощь сайту

Юмани:

410011174743222

Перевод на карту

Номер карты:

4048415020898850