Конструкції з регулярними виразами

Регулярні вирази, які використовуються у пошуку та сегментуванні, підтримуються Java. Якщо Вам потрібна детальніша інформація, зверніться за адресою http://java.sun.com/j2se/1.4.2/docs/api/java/util/regex/Pattern.html.

У мережі доступні прості інструкції щодо регулярних виразів (наприклад, http://www.regular-expressions.info/quickstart.html).


Конструкція...

відповідає наступному:


Прапори

(?i)

Дозволяє пошук збігів незалежно від регістра (за замовчуванням шаблон чуттєвий до регістра).


Символи

x

Символ x, крім наступного...

\uhhhh

Символ із шістнадцятковим значенням 0xhhhh

\t

Символ табуляції ('\u0009')

\n

Символ нового рядка (line feed) ('\u000A')

\r

Символ повернення каретки ('\u000D')

\f

Символ form-feed ('\u000C')

\a

Символ alert (bell) ('\u0007')

\e

Символ escape ('\u001B')

\cx

Керуючий символ, який відповідає x

\0n

Символ з вісімковим значенням 0n (0 <= n <= 7)

\0nn

Символ з вісімковим значенням 0nn (0 <= n <= 7)

\0mnn

Символ з вісімковим значенням 0mnn (0 <= m <= 3, 0 <= n <= 7)

\xhh

Символ із шістнадцятковим значенням 0xhh


Лапки

\

Екранує лише наступний символ. Це необхідно, якщо Ви хочете вставити мета-символи !$()*+.<>?[\]^{|} у якості їхнього буквального значення.

\\

Це, наприклад, символ зворотнього слеша.

\Q

Екранує всі символи перед \E.

\E

Закінчує цитату, розпочату з \Q


Класи блоків і категорій Unicode

\p{InGreek}

Символи у грецькому блоці (простий блок)

\p{Lu}

Велика літера (проста категорія)

\p{Sc}

Символ валюти

\P{InGreek}

Усі символи не в грецькому блоці (заперечення)

[\p{L}&&[^\p{Lu}]]

Усі символи, крім великих літер (віднімання)


Класи символів

[abc]

a, b, або c(простий клас)

[^abc]

Усі символи a, b, або c(заперечення)

[a-zA-Z]

від a до z або від A до Z, включно (діапазон)


Заздалегідь визначені класи символів

Будь-який символ (крім кінця рядка)

\d

Цифра: [0-9]

\D

Не цифра: [^0-9]

\s

Символ пробілу: [ \t\n\x0B\f\r]

\S

Не символ пробілу [^\s]

\w

Символ слова: [a-zA-Z_0-9]

\W

Не символ слова: [^\w]


Межі

^

Початок рядка

$

Кінець рядка

\b

Межа слова

\B

Не межа слова


„Жадібні“ квантори

Вони будуть шукати якнайбільше збігів. Наприклад,a+ покаже aaa з послідовності aaabbb

X?

X, один раз або жодного

X*

X, жодного або більше разів

X+

X, один або більше разів


Вимушені (не жадібні) квантори

Вони будуть шукати якнайменше збігів. Наприклад, a+? покаже першу a з послідовності aaabbb

X??

X, один раз або жодного

X*?

X, жодного або більше разів

X+?

X, один або більше разів


Логічні оператори

XY

X після якого йде Y

X|Y

Або X, або Y

(XY)

XY як окрема група



Юридична інформація Домашня сторінка Карта змісту