본문 바로가기
DataBase/MYSQL

[MYSQL] SQL 문법 - 정규식을 이용한 검색 regexp

by 민졈 2022. 10. 11.




이번 시간에는 정규식에 대해 알아보도록 하겠습니다.



정규식(regexp)이란?

 

정규식은 문자열에서 특정한 문자를 찾아내는 도구입니다.

 

Select 문의 조건절에서 많이 사용 되는데요,

 

정규식을 사용하면 수십줄이 필요한 작업을

 

한줄로 끝낼 수 있는 하나의 언어라고도 할 수 있습니다.





정규식에는 다양한 메타 문자가 있습니다.

아래는 가장 많이 사용하는 기본 표현식 들입니다.

 

  • ' ' : ' ' 안에 있는 문자를 찾을 때 사용한다. (LIKE 'a' 와 같은 의미) 
  • .  : 문자 하나를 나타낸다. 대괄호 안에 표현된 [.]은 단순한 마침표로 처리된다.
  • | : OR을 의미한다.
  • [ ] : 대괄호 안에 포함된 문자 중 하나를 의미한다.
  • [^] : 문자 클래스 안의 문자를 제외한 나머지 문자 중 하나를 의미한다. 
  • [ 특정문자 1 - 특정문자 2] : 특정문자 1과 특정문자 2 사이의 모든 문자를 의미한다.
  • ^ : 문자열이나 행의 처음을 의미한다.
  • $ : ^와 반대로 문자열이나 행의 끝을 의미한다.
  • [.] : 괄호 안의 문자열 일치를 확인한다.
  • {.} : 반복을 나타낸다.
  • * : 앞에 나온 문자의 0개 혹은 그 이상의 반복을 나타낸다.

 

이렇게 다양한 표현식이 있는데 보기만 해서는 어떻게 쓰이는지 잘 모르실 것 같기에

 

각각의 사용방법을 알아보도록 하겠습니다!

 

 

1) ' '  

SELECT *
FROM country
WHERE name regexp '대'; 

=> name 필드에 '대'를 포함한 모든 레코드를 출력한다.

 

2) [ ]

SELECT *
FROM country
WHERE name regexp '[ag]'

=> name 필드에 ag중 하나의 문자라도 포함된 레코드를 출력한다.

 

3) [^]

SELECT *
FROM country
WHERE name regexp '[^a]'

=> name 필드에 a가 포함되지 않은 문자의 레코드를 출력한다.

 

4) [특정문자 1 - 특정문자 2]

SELECT *
FROM country
WHERE name regexp '[a-f]'

=> name 필드에 a부터 f 사이에 있는 문자를 포함한 레코드를 출력한다.

 

5) ^

SELECT *
FROM country
WHERE name regexp '^d'

=> name 필드에 d로 시작하는 레코드를 출력한다.

 

6) $

SELECT *
FROM country
WHERE name regexp 'e$'

=> name 필드에 e로 끝나는 레코드를 출력한다.

 

7) | 

SELECT *
FROM country
WHERE name regexp '[가|나|다|라]'

=> name 필드에 가 또는 나 또는 다 또는 라 중 하나의 문자열이 포함된 레코드를 출력한다.

 

 

 

 

 

 

 

이렇게 오늘은 regexp의  정규식을 이용한 검색에 대해 알아보았습니다.

 

오늘 배운 기본 표현식 이외에도 더 많은 표현식들이 있는데요,

 

나머지 표현식들은 다음 포스팅에서 알아보도록 하겠습니다.

 

 

 

 

 

 

댓글