해당 글은 Algorithms. by S. Dasgupta, C.H. Papadimitriou, and U.V. Vazirani 를 정리한 스터디 노트입니다.

Chapter 2 Divide-and-conquer algorithms

divide-and-conquer strategy

같은 유형의 더 작은 문제로 쪼개기
쪼갠 문제들을 재귀적으로 풀기
그 답들을 적절하게 합치기

2.1 Multiplication

두 복소수의 곱셈 CASE

\[(a+bi)(c+di) = ac - bd + (bc+ad)i\]

$ac, bd, bc, ad$ 라는 4번의 곱셈
→ $ac, bd, (a+b)(c+d)$ 라는 3번의 곱셈으로 줄임
( $\because bc + ad = (a+b)(c+d) - ac - bd$ )
$\text{big-}O$ 방식의 thinking - 불필요한 곱셈 수를 줄이기
굉장히 낭비되는 ingenuity인 것처럼 보이지만, 재귀적으로 적용할 때 중요함

두 정수의 곱셈 CASE

\[x \times y\]

$x, y$ : $n$비트 정수
편의를 위해, $n$을 2의 지수로 생각

↓ \[x = x_L | x_R = 2^{n/2}x_L + x_R\] \[y = y_L | y_R = 2^{n/2}y_L + y_R\]

만약 $x = 10110110_2$ 라면 $x_L=1011_2, x_R=0110_2$
최종적으로 $x = 1011_2 \times 2^4 + 0110_2$ 로 표기

↓ \[xy \\ = (2^{n/2}x_L + x_R)(2^{n/2}y_L + y_R) \\ = 2^n x_L y_L + 2^{n/2} (x_L y_R + x_R y_L) + x_R y_R\]

$x$와 $y$의 곱을 계산하기 위해, 위와 같이 $n$비트에서 $n/2$비트로 split
덧셈은 linear time 이므로, 곱셈이 중요한 연산
4가지의 $n/2$비트 곱셈 : $x_{L}y_{L}, x_{L}y_{R}, x_{R}y_{L}, x_{R}y_{R}$ (=즉, four subproblems)
4가지 곱셈연산에 대해 다시 recursively 하게 split연산 적용 가능

\[T(n) = 4T(n/2) + O(n)\]

$T(n)$ : $n$비트 인풋 기준 총 연산 시간
최종적으로 계산해보면, $O(n^2)$임
전통적인 곱셈 테크닉도 $O(n^2)$임
새로운 split 알고리즘을 만들어냈지만, 진전이 없음

\[T(n) = 3T(n/2) + O(n)\]

위에서 본 Gauss’s trick 적용
$x_{L}y_{L}, x_{R}y_{R}, (x_L + x_R)(y_L + y_R)$ 3번의 곱셈으로 줄임
최종적으로 계산해보면, $O(n^{1,.59})$
사실은, $3T(n/2+1)$임

재귀적 호출의 알고리즘 패턴을 트리 구조로 해석 가능함

트리를 내려갈 때마다 사이즈는 반
트리를 내려갈 때마다 3개로 쪼개짐 (branching factor : 3)
트리의 높이 : $(log_2{n})$
트리가 $(log_2{n})^{th}$ 깊이로 갈 경우, 사이즈가 1이기 때문에 재귀 호출 종료
$k$ 깊이에 잇는 총 연산 시간은 다음과 같음
→ $3^k \times O(\frac{n}{2^k}) = (\frac{3}{2})^k \times O(n)$
따라서 트리를 내려갈 때마다 geometrically $O(n)$부터 $O(n^{log_2{3}})$ 까지 연산량 증가
즉, 가장 많은 연산이 걸리는 곳이 트리의 마지막 깊이인 $log_2{n}$ 이므로 $O(n^{1.59})$ 가 되는 것

만약 4번의 곱셈처럼 기존의 하던대로 연산했다면?

branching factor : 4
트리의 마지막 깊이 연산량 : $O(n^{log_2{4}})=O(n^2)$

A practical note

실제로, 1비트가 될 때까지 반복하지는 않는다.
대부분의 프로세서들은 16비트 혹은 32비트이므가 단일 연산 크기이므로, 그 때까지만 해당 알고리즘 적용됨

2.2 Recurrence relations

Divide-and-conquer 알고리즘의 패턴화

$n$ 크기의 문제 하나를 만날 경우,
→ $a$ 개 서브문제들로 해석 (크기는 $n/b$ )
→ 이들을 결합하는 시간은 $O(n^d)$ 만큼의 시간
- 실제로 우리가 했던 예제는 $a=3, b=2, d=1$ 이었음
Running Time을 수식으로 나타내면,
$T(n) = aT([n/b]) + O(n^d) $

Master theorem : 패턴화를 바탕으로 closed-form solution을 도출

$T(n) = aT([n/b]) + O(n^d) \text{ for some } contants \; a>0, b>1, \text{ and } d \geq 0, then \ $
\begin{cases} O(n^d) & if \; d > \text{log}_b{a} \
O(n^d{\text{log}n}) & if \; d = \text{log}_b{a} \
O(n^{\text{log}_b{a}}) & if \; d < \text{log}_b{a} \
\end{cases}

pf)

먼저, 편의상 $n$을 $b$ 제곱 형태로 가정
(걸쳐있는 경우에도 final bound에 중요하게 작용하지 않기 때문)
$k$ 단계 깊이일 때마다, 총 작업량은 다음과 같음
$a^k \times O(\frac{n}{b^k})^d = O(n^d) \times (\frac{a}{b^d})^k$
- 재귀트리에서 각 레벨마다 factor $b$에 의해 subproblem으로 쪼개지므로 최종 $\text{log}_b{n}$ 깊이(단계)에서 base case에 도달한다는 것을 알 수 있음
- branching factor $a$에 의해 각 $k$ 단계일 때, 크기가 각각 $n/b^k$인 $a^k$개의 subproblems를 가짐을 알 수 있음
$k$가 0에서 $log_b{n}$까지 내려감에 따라, $a/b^d$ 비율의 geometric series를 생각할 수 있고, 이 series sum을 big-$O$ 노테이션에 의해 정리할 수 있음
- $a/b^d \leq 1$
- $a/b^d \geq 1$
- $a/b^d = 1$

Binary Search

divide-and-conquer alogrithm을 결국 binary search라고 할 수 있음
예시) 정렬된 순서를 가진 $z[0, 1, …, n-1]$라는 하나의 큰 파일 속에서 $k$라는 키값을 찾고 싶음
1) 먼저 $k$를 $z[n/2]$와 비교함
2) 결과에 따라, 파일의 앞($z[0,…,n/2-1]$)을 볼지, 뒤($z[n/2,…,n-1]$)를 볼지 재귀적으로 체크
예시의 경우에는 $T(n) = T(\lceil{n/2}\rceil) + O(1)$
즉, $a=1, b=2, d=0$ case.
실행시간은 $O(\text{log}{n})$을 가짐

2.3 Mergesort

\[T(n) = 2T(n/2) + O(n) \text{ or } O(n\text{log}n)\]

mergesort를 호출할 때마다, 크기가 반씩 개수가 2개씩 늘어남 $T(n) \rightarrow 2T(n/2)$
merge로 합칠 때마다, $O(k+l)$ 의 total running time이 필요함 → 즉, linear time $O(n)$

실제로 합쳐지는 과정은, singleton arrays로 떨어질 때까지 일어나지 않음
singleton arrays = “active” arrays
mergesort하는 과정을 queue구조를 사용해 iterative하게 만들 수도 있음 (recursively말고) 아래 참조

inject : 큐의 마지막에 새로운 원소 추가(put)
eject : 큐의 시작 원소를 제거하고 반환(get)
큐 구조 : FIFO (사람들이 줄 서있는 것을 생각)

An $n\text{log}n$ lower bound for sorting

정렬 알고리즘을 트리로 묘사 가능

이 때, 트리의 깊이는 the worst-case time complexity of the algorithm을 말함
mergesort가 최적화되어 있다는 사실을 보여줄 때 유용함
- $n$개의 원소 정렬 시, $\Omega(n\text{log}n)$ 비교가 필수적인데, mergesort 충족

n-elements sorting algorithms

모든 permutation 형태가 leaves에 배치되어야 함
binary tree이기 때문에 detph d는 최대 $2^d$개의 leaves를 가질 수 있음
즉, 트리 구조의 깊이(=알고리즘의 복잡도)는 최소 $\log(n!)$의 깊이를 가짐
$\log{n!} \geq c \cdot n\log{n}$ for some $c>0$
- pf1. $n! \geq (n/2)^{(n/2)}$ ($\because n!$ 안에는 $n/2$보다 큰 숫자들이 $n/2$개 있으므로)
- pf2. Stirling’s formula
  $n! \approx \sqrt{\pi(2n+\frac{1}{3})} \cdot n^n \cdot e^{-n}$
결론적으로, $n$ 개의 원소들을 정렬하는 어떤 comparison tree는 worst case가 $\Omega(n\text{log}n)$ 비교가 되어야 함.
따라서, mergesort는 이런 점에서 최적화!

2.4 Medians

중앙값을 찾기 위해 할 수 있는 제일 쉬운 방법은? Just Sorting

하지만…
- $O(n \text{log}n$) 이라는 시간이 걸림
- 중앙값을 제외한 나머지가 정렬되는데 초점을 맞추는 작업이 아님
Selection을 통해 해결
- 중앙값인 경우, $k = \lfloor |S| / 2 \rfloor$

A randomized divide-and-conquer algorithm for selection

리스트 $S$를 $v$ 라는 숫자에 의해 3가지 카테고리로 쪼갤 수 있음

$S_L$ : $v$보다 작은 숫자들의 집합
$S_v$ : $v$랑 같은 숫자들의 집합 (duplicates)
$S_R$ : $v$보다 큰 숫자들의 집합

8번쨰로 작은 숫자를 찾고 싶은 경우?

$|S_L| + |S_v| = 5$ 임을 통해 아래의 사실을 알 수 있음
$\text{selection}(S,8) = \text{selection}(S_R,3)$

이를 일반화한다면, 다음과 같습니다.

$S$로부터 3가지 sublists들을 계산하는 것은 linear time
- $in \; place$ & without allocating (Exercise 2.15)
적절한 sublist를 찾을 때까지 반복함
쪼갬으로써 얻을 수 있는 효과는 기존 $|S|$를 $max{|S_L|, |S_R|}$까지 줄일 수 있다는 것

그렇다면, $v$는 어떻게 선택하는 것이 좋을까?

이상적인 케이스는 $|S_L|, |S_R| \approx \frac{1}{2}|S| $
즉, 반으로 잘 나눌 수 있는 $v$를 뽑았다면, 최종적으로 running time은 $T(n) = T(n/2) + O(n)$이 된다.
이 경우는, $v$를 중앙값으로 잘 뽑아야한다는 조건이 필요하지만, 더 간단한 대안으로 randomly하게 뽑을 것!

Efficiency analysis

이 알고리즘의 복잡도는 $v$를 어떻게 선택하는가에 달려있음

Worst-case (매번 제일 큰 숫자나 작은 숫자 택하는 경우)
- 매 시간마다, 하나씩 줄일 수 있음
- $n + (n-1) + (n-2) + … + \frac{n}{2} = \Theta(n^2)$ , median을 계산하고 싶은 경우
Best-case (한번에 반으로 나누는 경우)
- $O(n)$의 복잡도를 가짐 (모든 $n$에 대해 split하는 연산이 끝)
그렇다면, 평균적으로 어떤 복잡도를 가질까? 다행히, best-case에 가까움

50% 확률로 good으로 뽑을 수 있다고 한다면, good을 뽑기 위해 얼마나 많은 $v$를 시도해봐야할까?

$v$가 25th-75th percentile에 들어오는 경우, $good$ 이라고 하자.
이러한 $v$를 선택할 경우, $S_L$과 $S_R$은 $S$의 최대 3/4 크기를 가짐
Lemma에 의해, 평균적으로 2번 split operation을 한다면, 전체 리스트는 최대 3/4 크기로 줄어들음
- Lemma. On average a fair coin nedd to be tossed two times before a “heads” is seen.
$T(n) \leq T(3n/4) + O(2n)$
즉, $T(n) = O(n)$

The Unix sort command

median-finding vs. mergesort

mergesort는 생각없이 쪼개고 나서, 정렬하면서 합치는 구조
Median-algorithm은 쪼갤 때 신중하게 쪼개는 구조

Quicksort $\approx$ median algorithm

median algorithm이 동작하는 방식과 똑같음
배열의 pivot을 기준으로 배열을 나누고, 부분적으로 sorted하는 과정을 계속해서 반복하는 구조
worst-case : $\Theta(n^2)$ (median-finding과 동일)
하지만, 평균적으로는 $O(n\log{n})$임 (Exercise 2.24)
다른 sorting algorithms보다 제일 빠름

2.5 Matrix multiplication

\[Z_{ij} = \sum_{k=1}^{n} X_{ik}Y_{kj}\]

행렬곱에 있어서 $O(n^3)$ 복잡도를 가짐
$n^2$개의 원소에 대해, 각 연산 $O(n)$을 실행해야하기 때문

$X= \begin{bmatrix} A & B \\\ C & D \end{bmatrix}$, $Y= \begin{bmatrix} E & F \\\ G & H \end{bmatrix}$

이를 divide-and-conquer로 해결할 수 있음
$n \times n$ 행렬을 $n/2 \times n/2$ 행렬로 쪼개어 생각함
따라서, $T(n) = 8T(n/2) + O(n^2)$
- 8번의 submatrix 곱과 $O(n^2)$ 복잡도의 덧셈 연산
- 기존 행렬 곱과 큰 차이가 없음
이를 7개의 subproblems로 쪼갤 수 있음 (by Volker Strassen)
- 자세한 implementation 생략
따라서, $T(n) = 7T(n/2) + O(n^2)$
최종적으로, 이는 $O(n^{\text{log}_2{7}}) \approx O(n^{2.81})$ by master theorem

2.6 The fast Fourier transform

(생략)

Exercises

2.3

2.13 Binary tree $full$

$\text{Let }B_n \text{ denote the number of full binary trees with }n \text{ vertices.}$
https://www.geeksforgeeks.org/enumeration-of-binary-trees/
http://www.cs.rpi.edu/~moorthy/Courses/CSCI2300/csci2300-fall2014-test1-sol.pdf

2.24 Quicksort

2.28 The Hadamard matrices

2.29 Horner’s rule

2.32 CLOSEST PAIR

reference

Master Theorem

https://www.youtube.com/watch?v=I7JCtSwVeXs

Median

https://brilliant.org/wiki/median-finding-algorithm/

Merge / Quick sort

https://gmlwjd9405.github.io/2018/05/08/algorithm-merge-sort.html
https://gmlwjd9405.github.io/2018/05/10/algorithm-quick-sort.html

BST(binary search tree)

https://ratsgo.github.io/data%20structure&algorithm/2017/10/22/bst/

알고리즘 챕터 2장 : Divide-and-conquer algorithms

Chapter 2 Divide-and-conquer algorithms

2.1 Multiplication

2.2 Recurrence relations

2.3 Mergesort

2.4 Medians

2.5 Matrix multiplication

2.6 The fast Fourier transform

Exercises

reference

Recent Update

Trending Tags

Contents

Trending Tags

알고리즘 챕터 2장 : Divide-and-conquer algorithms

Chapter 2 Divide-and-conquer algorithms

2.1 Multiplication

2.2 Recurrence relations

2.3 Mergesort

2.4 Medians

2.5 Matrix multiplication

2.6 The fast Fourier transform

Exercises

reference

Recent Update

Trending Tags

Contents

Further Reading

알고리즘 챕터 3장 : Decompositions of graphs

알고리즘 챕터 4장 : Paths in graphs

알고리즘 챕터 5장 : Greedy algorithms

Trending Tags