DataBase/MYSQL

[MYSQL] SQL 문법 - 정규식을 이용한 검색 regexp

민졈 2022. 10. 11. 15:08




이번 시간에는 정규식에 대해 알아보도록 하겠습니다.



정규식(regexp)이란?

 

정규식은 문자열에서 특정한 문자를 찾아내는 도구입니다.

 

Select 문의 조건절에서 많이 사용 되는데요,

 

정규식을 사용하면 수십줄이 필요한 작업을

 

한줄로 끝낼 수 있는 하나의 언어라고도 할 수 있습니다.





정규식에는 다양한 메타 문자가 있습니다.

아래는 가장 많이 사용하는 기본 표현식 들입니다.

 

  • ' ' : ' ' 안에 있는 문자를 찾을 때 사용한다. (LIKE 'a' 와 같은 의미) 
  • .  : 문자 하나를 나타낸다. 대괄호 안에 표현된 [.]은 단순한 마침표로 처리된다.
  • | : OR을 의미한다.
  • [ ] : 대괄호 안에 포함된 문자 중 하나를 의미한다.
  • [^] : 문자 클래스 안의 문자를 제외한 나머지 문자 중 하나를 의미한다. 
  • [ 특정문자 1 - 특정문자 2] : 특정문자 1과 특정문자 2 사이의 모든 문자를 의미한다.
  • ^ : 문자열이나 행의 처음을 의미한다.
  • $ : ^와 반대로 문자열이나 행의 끝을 의미한다.
  • [.] : 괄호 안의 문자열 일치를 확인한다.
  • {.} : 반복을 나타낸다.
  • * : 앞에 나온 문자의 0개 혹은 그 이상의 반복을 나타낸다.

 

이렇게 다양한 표현식이 있는데 보기만 해서는 어떻게 쓰이는지 잘 모르실 것 같기에

 

각각의 사용방법을 알아보도록 하겠습니다!

 

 

1) ' '  

SELECT *
FROM country
WHERE name regexp '대'; 

=> name 필드에 '대'를 포함한 모든 레코드를 출력한다.

 

2) [ ]

SELECT *
FROM country
WHERE name regexp '[ag]'

=> name 필드에 ag중 하나의 문자라도 포함된 레코드를 출력한다.

 

3) [^]

SELECT *
FROM country
WHERE name regexp '[^a]'

=> name 필드에 a가 포함되지 않은 문자의 레코드를 출력한다.

 

4) [특정문자 1 - 특정문자 2]

SELECT *
FROM country
WHERE name regexp '[a-f]'

=> name 필드에 a부터 f 사이에 있는 문자를 포함한 레코드를 출력한다.

 

5) ^

SELECT *
FROM country
WHERE name regexp '^d'

=> name 필드에 d로 시작하는 레코드를 출력한다.

 

6) $

SELECT *
FROM country
WHERE name regexp 'e$'

=> name 필드에 e로 끝나는 레코드를 출력한다.

 

7) | 

SELECT *
FROM country
WHERE name regexp '[가|나|다|라]'

=> name 필드에 가 또는 나 또는 다 또는 라 중 하나의 문자열이 포함된 레코드를 출력한다.

 

 

 

 

 

 

 

이렇게 오늘은 regexp의  정규식을 이용한 검색에 대해 알아보았습니다.

 

오늘 배운 기본 표현식 이외에도 더 많은 표현식들이 있는데요,

 

나머지 표현식들은 다음 포스팅에서 알아보도록 하겠습니다.