본문 바로가기
software engineering/java

이모지 제거

by _블로그 2022. 2. 4.

여기에 소개 된 여러 방법 중 가장 심플한 것은 regex를 이용한 방법.

@Test
public void whenRemoveEmojiUsingRegex_thenSuccess() {
    String text = "la conférence, commencera à 10 heures ?";
    String regex = "[^\\p{L}\\p{N}\\p{P}\\p{Z}]";
    String result = text.replaceAll(regex, "");

    assertEquals(result, "la conférence, commencera à 10 heures ");
}

 

위 정규식의 상세한 설명은 아래와 같음.

  • \p{L} – 모든 나라의 언어 허용
  • \p{N} – 숫자
  • \p{P} – 구두점
  • \p{Z} – 화이트 스페이스 구분자
  • ^ – 부정. 즉, 위의 식들만 제외하고 모두 제외

위 regex는 unicode categories로 이 링크 참조

LIST

'software engineering > java' 카테고리의 다른 글

Spring Boot VS Quarkus  (0) 2022.11.07
Spring Boot - Logging  (0) 2021.04.26
gradle의 method 선언과 prop 선언의 차이  (0) 2021.04.16

댓글