Little bIT awesome

[Week1] 기수 정렬 (Radix Sort) 본문

코딩테스트/알고리즘 정리

[Week1] 기수 정렬 (Radix Sort)

까루카라 2024. 1. 31. 10:36

기수 정렬 (Radix Sort)

Comparison Sort
N개 원소의 배열이 있을 때, 이를 모두 정렬하는 가짓수는 N!
따라서, Comparison Sort를 통해 생기는 트리의 말단 노드가 N! 이상의 노드 갯수를 갖기 위해서는,
2^h >= N!를 만족하는 h를 가져야 하고, 
이 식을 h > O(nlogn)을 가져야 한다. 
(h == 트리의 높이, 즉 Comparison Sort의 시간 복잡도)

 

데이터를 구성하는 기본 요소 (Radix)를 이용하여 정렬을 진행하는 방식

자릿 수의 값 별로 정렬을 하기 때문에 나올 수 있는 값의 최대 사이즈는 9

 

정의

합병 정렬이라고도 부르며, 분할 정복 방법을 통해 구현

 

※ 분할 정복 (divide and conquer)
   문제를 작은 2개의 문제로 분리하고 각각을 해결한 다음, 결과를 모아서 원래의 문제를 해결하는 전략

 



빠른 정렬로 분류되며, 퀵 정렬과 함께 많이 언급되는 정렬 방식이다. 

안정 정렬에 속한다. 

 

퀵 정렬과의 차이점
퀵 정렬 : 우선 피벗을 통해 정렬 (partition) → 영역을 쪼갬(quickSort)
병합 정렬 : 영역을 쪼갤 수 있을 만큼 쪼갬(mergeSort) → 정렬(merge)

 

Process

void countSort(int arr[], int n, int exp) {
	int buffer[n];
    int i, count[10] = {0};
    
    // exp의 자릿수에 해당하는 count 증가
    for (i = 0; i < n; i++){
        count[(arr[i] / exp) % 10]++;
    }
    // count == [1, 0, 1, 1, 2, 2, 3, 2, 2, 1]
    
    // 누적합 구하기
    for (i = 1; i < 10; i++) {
        count[i] += count[i - 1];
    }
    // count == [1, 1, 2, 3, 5, 7, 10, 12, 14, 15]
    
    // 일반적인 Counting sort 과정
    for (i = n - 1; i >= 0; i--) {
        buffer[count[(arr[i]/exp) % 10] - 1] = arr[i];
        count[(arr[i] / exp) % 10]--;
    }
    // buffer == [50, 2, 3, 44, 4, 5, 15, 36, 26, 46, 0, 47, 27, 38, 48, 19]
    
    for (i = 0; i < n; i++){
        arr[i] = buffer[i];
    }
}

void radixsort(int arr[], int n) {
     // 최댓값의 자릿수만큼 Counting Sort 반복
    int m = getMax(arr, n);
    
    // 최댓값을 나눴을 때, 0이 나오면 모든 숫자가 exp의 아래
    for (int exp = 1; m / exp > 0; exp *= 10) {
        countSort(arr, n, exp);
    }
}

 

 

시간복잡도

: O(d * (n + b))

d = 정렬할 숫자의 자릿수

b = 10 (k와 같으나 10으로 고정되어 있다)

 

장점

문자열, 정수 정렬 가능

 

단점

자릿수가 없는 것은 정렬할 수 없음 (ex 부동 소수점)

중간 결과를 저장할 bucket 공간이 필요함

 

질문

Q1) 낮은 자릿수부터 정렬을 하는 이유

MSD (Most-Significant-Digit) 과 LSD (Least-Significant-Digit)을 비교하라는 질문

MSD는 가장 큰 자리수부터 Counting sort 하는 것을 의미하고, LSD는 가장 낮은 자리수부터 Counting sort 하는 것을 의미함. (즉, 둘 다 할 수 있음)

  • LSD의 경우 1600000 과 1을 비교할 때, Digit의 갯수만큼 따져야하는 단점이 있음. 그에 반해 MSD는 마지막 자리수까지 확인해 볼 필요가 없음.
  • LSD는 중간에 정렬 결과를 알 수 없음. (예) 10004와 70002의 비교) 반면, MSD는 중간에 중요한 숫자를 알 수 있음. 따라서 시간을 줄일 수 있음. 그러나, 정렬이 되었는지 확인하는 과정이 필요하고, 이 때문에 메모리를 더 사용
  • LSD는 알고리즘이 일관됨 (Branch Free algorithm) 그러나 MSD는 일관되지 못함. --> 따라서 Radix sort는 주로 LSD를 언급함.
  • LSD는 자릿수가 정해진 경우 좀 더 빠를 수 있음.

'코딩테스트 > 알고리즘 정리' 카테고리의 다른 글

Collections.sort에 쓰이는 TimSort  (0) 2024.02.02
[Week1] 계수 정렬 (Counting Sort)  (1) 2024.01.31
[Week1] 힙 정렬 (Heap Sort)  (1) 2024.01.31
[Week1] 병합 정렬 (MergeSort)  (0) 2024.01.31
[Week1] 정렬 1/2  (1) 2024.01.28