알고리즘 풀이/프로그래머스

[level2] 프로그래머스 - [1차] 뉴스 클러스터링(JAVA)

데롱디롱 2021. 9. 9. 23:59
728x90
전체 코드는 맨 밑에 있습니다.

 

 

 

 

[ 문제 풀이 ]

1. str1, str2를 모두 소문자로 바꾼다.

  • 다중집합 원소 사이를 비교할 때, 대문자와 소문자의 차이는 무시한다. "AB"와 "Ab", "ab"는 같은 원소로 취급한다.

 

 

2.  str1 를 2개씩 자른 원소등장 횟수를 HashMap인, jacard1에 저장한다. 
      => 알파벳이 아닌 다른 문자가 포함되어있으면, 버린다.

  • 영문자로 된 글자 쌍만 유효하고, 기타 공백이나 숫자, 특수 문자가 들어있는 경우는 그 글자 쌍을 버린다.

 

 

3. str2 를 2개씩 자른 원소와 등장 횟수를 HashMap인, jacard2에 저장한다.
      => 알파벳이 아닌 다른 문자가 포함되어있으면, 버린다.

 

 

4. str2의 원소가 str1에 있으면, 교집합이므로 str1의 개수를 감소시킨다. 

     => 이때 감소시킨 횟수가 min, 공집합의 개수이다.

 

 

5. jacard1과 jacard2에 남은 원소들의 합을 모두 더하면, 합집합의 개수가 된다.

 

 

6. 자카드 유사도 = 65536 * min / max
    단, max(합집합 수)가 0이면, 두 집합이 공집합인 것이므로 1에 65536을 곱한 65536을 리턴한다.

  • 집합 A와 집합 B가 모두 공집합일 경우에는 나눗셈이 정의되지 않으니 따로 J(A, B) = 1로 정의

 

 

 

 

[ 전체 코드 ]

import java.util.HashMap;

class Solution {
    static HashMap<String, Integer> jacard1, jacard2;

    public static int solution(String str1, String str2) {
        int min = 0, max = 0;

        jacard1 = new HashMap<String, Integer>();
        jacard2 = new HashMap<String, Integer>();

        str1 = str1.toLowerCase();
        str2 = str2.toLowerCase();

        // str1 : 두개씩 자르기
        for (int i = 0; i < str1.length() - 1; i++) {
            if (!Character.isAlphabetic(str1.charAt(i)) || !Character.isAlphabetic(str1.charAt(i + 1)))
                continue;

            String str = str1.substring(i, i + 2);
            jacard1.put(str, jacard1.containsKey(str) ? jacard1.get(str) + 1 : 1);
        }

        // str2 : 두개씩 자르기
        for (int i = 0; i < str2.length() - 1; i++) {
            if (!Character.isAlphabetic(str2.charAt(i)) || !Character.isAlphabetic(str2.charAt(i + 1)))
                continue;

            String str = str2.substring(i, i + 2);
            jacard2.put(str, jacard2.containsKey(str) ? jacard2.get(str) + 1 : 1);
            max++;

            if (jacard1.containsKey(str) && jacard1.get(str) > 0) {
                jacard1.put(str, jacard1.get(str) - 1);
                min++;
            }
        }

        // str1에서 살아남은 수 max에 추가
        for (String s : jacard1.keySet())
            if (jacard1.get(s) > 0)
                max += jacard1.get(s);

        return max == 0 ? 65536 : 65536 * min / max;
    }
}

 

 

틀린 것이나 질문이 있으면
댓글 부탁드려요 :)