정렬 알고리즘

2021. 4. 1. 23:22ㆍStudy/algorithm

기준에 따라 데이터를 정렬

1. 정렬 알고리즘 개요

2. 선택 정렬

3. 삽입 정렬

4. 퀵 정렬

5. 계수 정렬

6. 정렬 알고리즘 비교하기

7. 파이썬의 정렬 라이브러리

1. 정렬 알고리즘 개요

정렬(Sorting)

데이터를 특정한 기준에 따라 순서대로 나열
프로그램에서 데이터를 가공할 때 오름차순이나 내림차순 등 대부분 어떤 식으로든 정렬해서 사용하는 경우가 많기에 정렬 알고리즘은 프로그램을 작성할 때 가장 많이 사용되는 알고리즘 중 하나다.
일반적으로 문제 상황에 따라서 적절한 정렬 알고리즘이 공식처럼 사용된다.
컴퓨터는 인간과 다르게 데이터의 규칙성을 직관적으로 알 수 없으며, 어떻게 정렬을 수행할지에 대한 과정을 소스코드로 작성하여 구제적으로 명시해야 한다.

2. 선택 정렬

선택정렬(Selection Sort)

처리되지 않은 데이터 중에 가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸는 것을 반복한다.
( 매번 가장 작은 것을 선택한다.)

파이썬 코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(len(array)):
    min_index = i  # 가장 작은 원소의 인덱스
    for j in range(i + 1, len(array)):  # 가장 작은 원소의 인덱스 다음부터
        if array[min_index] > array[j]:  # 가장 작은 원소 선택
            min_index = j
    array[i], array[min_index] = array[min_index], array[i]  # 스와프

print(array)

선택 정렬의 시간 복잡도

선택 정렬은 N-1번 만큼 가장 작은 수를 찾아서 맨 앞으로 보내야 한다. 또한 매번 가장 작은 수를 찾기 위해서 비교 연산이 필요하다.
연산 횟수는 N + (N-1) + (N-2) + ... + 2 근사치로 N * (N+1) / 2 로 표현한다.
빅오 표기법으로 간단하게 O(N^2)

선택정렬은 기본 정렬 라이브러리를 포함해 다른 알고리즘과 비교했을 때 매우 비효율적이다.

다만, 특정한 리스트에서 가장 작은 데이터를 찾는 일이 코딩테스트에서 잦으므로 선택 정렬 소스코드 형태에 익숙해질 필요가 있다.

2. 삽입 정렬

삽입 정렬(Insertion Sort)

처리되지 않은 데이터를 하나씩 골라 적절한 위치에 삽입한다.
선택 정렬에 비해 구현 난이도는 높은 편이지만, 일반적으로 더 효율적으로 동작한다.

파이썬 코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(1, len(array)):
    for j in range(i, 0, -1):  # 인덱스 i부터 1까지 감소하며 반복하는 문법
        if array[j] < array[j - 1]:  # 한 칸씩 왼쪽으로 이동
            array[j], array[j - 1] = array[j - 1], array[j]
        else:  # 자기보다 작거나 같은 데이터를 만나면 그 위치에서 멈춤
            break

print(array)

삽입 정렬의 시간 복잡도

삽입 정렬의 시간 복잡도는 O(N^2)이며, 선택 정렬과 마찬가지로 반복문이 두 번 중첩되어 사용된다.
삽입 정렬은 현재 리스트의 데이터가 거의 정렬되어 있는 상태라면 매우 빠르게 동작한다.
최선의 경우 O(N)의 시간 복잡도를 가진다. ( 최선의 경우 : 이미 정렬되어 있을 때)

3. 퀵 정렬

퀵 정렬(quick sort)

기준 데이터를 설정하고 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾸는 방법이다.
일반적인 상황에서 가장 많이 사용되는 정렬 알고리즘 중 하나이다.
병합 정렬과 더불어 대부분의 프로그래밍 언어의 정렬 라이브러리의 근간이 되는 알고리즘이다.
피벗(Pivot) - 큰 숫자와 작은 숫자를 교환할 때, 교환하기 위한 기준
가장 기본적은 퀵 정렬은 첫 번째 데이터를 기준 데이터(Pivot)로 설정한다. (호어 분할 방식)

파이썬 코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]


def quick_sort(array, start, end):
    if start >= end:  # 원소가 1개인 경우 종료
        return
    pivot = start  # 피벗은 첫 번째 원소
    left = start + 1
    right = end
    while left <= right:
        # 피벗보다 큰 데이터를 찾을 때까지 반복
        while left <= end and array[left] <= array[pivot]:
            left += 1
        # 피벗보다 작은 테이터를 찾을 때까지 반복
        while right > start and array[right] >= array[pivot]:
            right -= 1
        if left > right:  # 엇갈렸다면 작은 데이터와 피벗을 교체
            array[right], array[pivot] = array[pivot], array[right]
        else:  # 엇갈리지 않았다면 작은 데이터와 큰 데이터를 교체
            array[left], array[right] = array[right], array[left]
    # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬 수행
    quick_sort(array, start, right - 1)  # 재귀함수
    quick_sort(array, right + 1, end)


quick_sort(array, 0, len(array) - 1)
print(array)

파이썬의 장점을 살린 퀵 정렬 소스코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]


def quick_sort(array):
    # 리스트가 하나 이하의 원소만을 담고 있다면 종료
    if len(array) <= 1:
        return array

    pivot = array[0]  # 피벗은 첫 번째 원소  (리스트 슬라이싱)
    tail = array[1:]  # 피벗을 제외한 리스트

    left_side = [x for x in tail if x <= pivot]  # 분할된 왼쪽 부분 (리스트 컴프리헨션)
    right_side = [x for x in tail if x > pivot]  # 분할된 오른쪽 부분

    # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬을 수행하고, 전체리스트를 반환
    return quick_sort(left_side) + [pivot] + quick_sort(right_side)


print(quick_sort(array))

퀵 정렬의 시간 복잡도

퀵 정렬은 평균의 경우 O(NlogN)의 시간 복잡도를 가진다.
하지만 최악의 경우 O(N^2)의 시간 복잡도를 가진다. ( 최악의 경우 : 이미 정렬되어 있을 때)

4. 계수 정렬

계수 정렬(Count Sort)

특정한 조건이 부합할 때만 사용할 수 있지만 매우 빠르게 동작하는 정렬 알고리즘이다.
계수 정렬은 데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때 사용 가능하다.
데이터의 개수가 N, 데이터(양수) 중 최댓값이 K일 때 최악의 경우에도 수행 시간 O(N + k)를 보장한다.

...

파이썬 코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 9, 1, 4, 8, 0, 5, 2]
# 모든 범위를 포함하는 리스트 선언(모든 값은 0으로 초기화)
count = [0] * (max(array) + 1)

for i in range(len(array)):
    count[array[i]] += 1  # 각 데이터에 해당하는 인덱스의 값 증가

for i in range(len(count)):  # 리스트에 기록된 정렬 정보 확인
    for j in range(count[i]):
        print(i, end=' ')  # 띄어쓰기를 구분으로 등장한 횟수만큼 인덱스 출력

계수 정렬의 시간 복잡도/ 공간 복잡도

계수 정령의 시간 복잡도와 공간 복잡도는 모두 O(N(데이터의 개수) + K(데이터(양수) 중 최댓값))이다.
계수 정렬은 때에 따라서 심각한 비효율성을 초래할 수 있다. (데이터가 0과 999,999로 단 2개만 존재하는 경우)
계수 정렬은 동일한 값을 가지는 데이터가 여러 개 등장할 때 효과적으로 사용할 수 있다. (성적의 경우)

6. 정렬 알고리즘 비교하기

7. 파이썬의 정렬 라이브러리

파이썬은 기본 정렬 라이브러리인 sorted() 함수를 제공한다.
sorted()는 퀵 정렬과 동작 방식이 비슷한 병합 정렬을 기반으로 만들어졌는데, 병합정렬은 일반적으로 퀵 정렬보다 느리지만 최악의 경우에도 시간 복잡도 O(NlogN)을 보장한다는 특징이 있다.

예제 코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

result = sorted(array)
print(result)

리스트 변수가 하나 있을 때 내부 원소를 바로 정렬할 수도 있다. 리스트 객체의 내장 함수인 sort()를 이용하는 것인데, 이를 이용하면 별도의 정렬된 리스트가 반환되지 않고 원소가 바로 정렬된다.

예제 코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

array.sort()
print(array)

정렬 라이브러리의 시간 복잡도

정렬 라이브러리는 항상 최악의 경우에도 시간 복잡도 O(NlogN)을 보장한다.
파이썬은 정확히는 병합 정렬과 삽입 정렬의 아이디어를 더한 하이브리드 방식의 정렬 알고리즘을 사용하고 있다.
문제에서 별도의 요구가 없다면 단순히 정렬해야 하는 상황에서는 기본 정렬 라이브러리를 사용하고, 데이터의 범위가 한정되어 있으면 더 빠르게 동작해야 할 때는 계수 정렬을 사용하면 된다.

출처

https://www.youtube.com/watch?v=jpyslMwprao&list=PLVsNizTWUw7H9_of5YCB0FmsSc-K44y81&index=21

https://www.youtube.com/watch?v=DRkL5EBZ7KY&list=PLVsNizTWUw7H9_of5YCB0FmsSc-K44y81&index=22

https://www.youtube.com/watch?v=EuJSDghD4z8&list=PLVsNizTWUw7H9_of5YCB0FmsSc-K44y81&index=23

https://www.youtube.com/watch?v=65Ui3RNibRA&list=PLVsNizTWUw7H9_of5YCB0FmsSc-K44y81&index=24

https://www.youtube.com/watch?v=_kdE7ykab4Q&list=PLVsNizTWUw7H9_of5YCB0FmsSc-K44y81&index=25

https://www.hanbit.co.kr/store/books/look.php?p_code=B8945183661

저작자표시 동일조건

'Study > algorithm' 카테고리의 다른 글

재귀함수 연습 (0)	2021.03.30
deque 객체 (0)	2021.03.22
BFS DFS (0)	2021.03.21
파이참 디버깅 오류 : module 'queue' has no attribute 'Queue' (0)	2021.03.18
구현 알고리즘 (0)	2021.03.16

취미로 하는 개발블로그

취미로 하는 개발블로그

기준에 따라 데이터를 정렬

1. 정렬 알고리즘 개요

2. 선택 정렬

3. 삽입 정렬

4. 퀵 정렬

5. 계수 정렬

6. 정렬 알고리즘 비교하기

7. 파이썬의 정렬 라이브러리

1. 정렬 알고리즘 개요

2. 선택 정렬

파이썬 코드

선택 정렬의 시간 복잡도

2. 삽입 정렬

파이썬 코드

삽입 정렬의 시간 복잡도

3. 퀵 정렬

파이썬 코드

파이썬의 장점을 살린 퀵 정렬 소스코드

퀵 정렬의 시간 복잡도

4. 계수 정렬

...

파이썬 코드

계수 정렬의 시간 복잡도/ 공간 복잡도

6. 정렬 알고리즘 비교하기

7. 파이썬의 정렬 라이브러리

예제 코드

예제 코드

정렬 라이브러리의 시간 복잡도

출처

'Study > algorithm' 카테고리의 다른 글

관련글

티스토리툴바