여기에 소개 된 여러 방법 중 가장 심플한 것은 regex를 이용한 방법.
@Test
public void whenRemoveEmojiUsingRegex_thenSuccess() {
String text = "la conférence, commencera à 10 heures ?";
String regex = "[^\\p{L}\\p{N}\\p{P}\\p{Z}]";
String result = text.replaceAll(regex, "");
assertEquals(result, "la conférence, commencera à 10 heures ");
}
위 정규식의 상세한 설명은 아래와 같음.
- \p{L} – 모든 나라의 언어 허용
- \p{N} – 숫자
- \p{P} – 구두점
- \p{Z} – 화이트 스페이스 구분자
- ^ – 부정. 즉, 위의 식들만 제외하고 모두 제외
위 regex는 unicode categories로 이 링크 참조
LIST
'software engineering > java' 카테고리의 다른 글
Spring Boot VS Quarkus (0) | 2022.11.07 |
---|---|
Spring Boot - Logging (0) | 2021.04.26 |
gradle의 method 선언과 prop 선언의 차이 (0) | 2021.04.16 |
댓글