DataBase/MYSQL
[MYSQL] SQL 문법 - 정규식을 이용한 검색 regexp
민졈
2022. 10. 11. 15:08
이번 시간에는 정규식에 대해 알아보도록 하겠습니다.
정규식(regexp)이란?
정규식은 문자열에서 특정한 문자를 찾아내는 도구입니다.
Select 문의 조건절에서 많이 사용 되는데요,
정규식을 사용하면 수십줄이 필요한 작업을
한줄로 끝낼 수 있는 하나의 언어라고도 할 수 있습니다.
정규식에는 다양한 메타 문자가 있습니다.
아래는 가장 많이 사용하는 기본 표현식 들입니다.
- ' ' : ' ' 안에 있는 문자를 찾을 때 사용한다. (LIKE 'a' 와 같은 의미)
- . : 문자 하나를 나타낸다. 대괄호 안에 표현된 [.]은 단순한 마침표로 처리된다.
- | : OR을 의미한다.
- [ ] : 대괄호 안에 포함된 문자 중 하나를 의미한다.
- [^] : 문자 클래스 안의 문자를 제외한 나머지 문자 중 하나를 의미한다.
- [ 특정문자 1 - 특정문자 2] : 특정문자 1과 특정문자 2 사이의 모든 문자를 의미한다.
- ^ : 문자열이나 행의 처음을 의미한다.
- $ : ^와 반대로 문자열이나 행의 끝을 의미한다.
- [.] : 괄호 안의 문자열 일치를 확인한다.
- {.} : 반복을 나타낸다.
- * : 앞에 나온 문자의 0개 혹은 그 이상의 반복을 나타낸다.
이렇게 다양한 표현식이 있는데 보기만 해서는 어떻게 쓰이는지 잘 모르실 것 같기에
각각의 사용방법을 알아보도록 하겠습니다!
1) ' '
SELECT *
FROM country
WHERE name regexp '대';
=> name 필드에 '대'를 포함한 모든 레코드를 출력한다.
2) [ ]
SELECT *
FROM country
WHERE name regexp '[ag]'
=> name 필드에 ag중 하나의 문자라도 포함된 레코드를 출력한다.
3) [^]
SELECT *
FROM country
WHERE name regexp '[^a]'
=> name 필드에 a가 포함되지 않은 문자의 레코드를 출력한다.
4) [특정문자 1 - 특정문자 2]
SELECT *
FROM country
WHERE name regexp '[a-f]'
=> name 필드에 a부터 f 사이에 있는 문자를 포함한 레코드를 출력한다.
5) ^
SELECT *
FROM country
WHERE name regexp '^d'
=> name 필드에 d로 시작하는 레코드를 출력한다.
6) $
SELECT *
FROM country
WHERE name regexp 'e$'
=> name 필드에 e로 끝나는 레코드를 출력한다.
7) |
SELECT *
FROM country
WHERE name regexp '[가|나|다|라]'
=> name 필드에 가 또는 나 또는 다 또는 라 중 하나의 문자열이 포함된 레코드를 출력한다.
이렇게 오늘은 regexp의 정규식을 이용한 검색에 대해 알아보았습니다.
오늘 배운 기본 표현식 이외에도 더 많은 표현식들이 있는데요,
나머지 표현식들은 다음 포스팅에서 알아보도록 하겠습니다.