코딩 테스트 - 05. Binary Search (Python3)
순차 탐색
- 가장 기본적인 탐색 방법
- 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법
- 시간만 충분하다면 항상 원하는 원소를 찾을 수 있다 (정렬 상태에 상관없이 사용 가능)
- 순차 탐색 사용
- 리스트에서 특정한 값을 가지는 원소의 개수를 세는 count() 메소드
- 리스트에서 특정 값의 원소가 있는지 체크할 때
- 시간 복잡도 : O(N) (최악의 경우)
def sequential_search(n, target, array):
for i in range(n):
if array[i] == target:
return i + 1
print("생성할 원소 개수를 입력한 다음 한 칸 띄우고 찾을 문자열을 입력하세요,")
input_data = input().split()
n = int(input_data[0]) # 원소의 개수
target = input_data[1] # 찾고자 하는 문자열
print("앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다")
array = input().split()
print(sequential_search(n, target, array))
생성할 원소 개수를 입력한 다음 한 칸 띄우고 찾을 문자열을 입력하세요,
5 Hey
앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다
Hey how are you
1
이진 탐색
- 반으로 쪼개면서 탐색하기
- 데이터가 정렬되어 있어야만 사용 가능
- 위치를 나타내는 변수 3개 (시작점, 끝점, 중간점)을 사용
- 찾으려는 데이터와 중간점 위치에 있는 데이터를 반복적으로 비교해서 원하는 데이터를 찾음
- 절반씩 데이털르 줄어들도록 만든다는 점에서 퀵 정렬과 비슷
- 재귀 함수 or 반복문을 이용한다
- 시간 복잡도 : O(logN)
재귀 함수를 이용한 이진 탐색
def binary_search(array, target, start, end):
if start > end:
# 시작점과 끝점이 교차되면 종료
return None
# 중간점 생성
mid = (start + end) // 2
# 중간점 값 == 타겟 => 중간점 인덱스 반환
if array[mid] == target:
return mid
# 중간점 값 > 타겟 => 왼쪽 확인
# 중간점이 끝점이 됨
elif array[mid] > target:
return binary_search(array, target, start, mid - 1)
else:
return binary_search(array, target, mid + 1, end)
n, target = list(map(int, input().split()))
array = list(map(int, input().split()))
# 이진 탐색 결과 출력
result = binary_search(array, target, 0, n-1)
if result == None:
print("원소가 존재하지 않습니다")
else:
print(result + 1)
10 7
1 3 5 7 9 11 13 15 17 19
4
반복문으로 구현한 이진 탐색
def binary_search(array, target, start, end):
# 시작점과 끝점이 교차하면 종료
while start <= end:
mid = (start+ end) // 2
# 중간값과 타겟이 일치하면 탐색 완료
if array[mid] == target:
return mid
# 중간점 값 > 타겟 => 왼쪽 확인
# 중간점 앞의 점이 끝점이 됨
elif array[mid] > target:
end = mid - 1
else:
# 중간점 뒤의 점이 시작점이 됨
start = mid + 1
return None
n, target = list(map(int, input().split()))
array = list(map(int, input().split()))
result = binary_search(array, target, 0, n-1)
if result == None:
print("원소가 존재하지 않습니다")
else:
print(result+1)
10 7
1 3 5 7 9 11 13 15 17 19
4
코딩 테스트에서의 이진 탐색
- 단순하다고 느낄 수 있지만 참고할 소스코드가 없는 상태에서 구현하는 건 생각보다 어렵다
- 코딩 테스트에서 단골로 나오는 문제이므로 가급적으로 외우자
- 탐색 범위가 2000만을 넘어가면 이진 탐색 문제로 접근해보자
- 처리해야 할 데이터의 개수나 값이 1000만 단위 이상으로 넘어가면 이진 탐색과 같이 O(logN)의 속도를 내야하는 알고리즘을 사용하자
트리 자료구조
- 노드와 노드의 연결로 표현하며 그래프 자료구조의 일종
- DB 시스템이나 파일 시스템과 같은 곳에서 많은 양의 데이터를 관리하기 위한 목적으로 사용
- 주요 특징
- 부모 노드와 자식 노드의 관계로 표현
- 최상단 노드 : 루트 노드
- 최하단 노드 : 단말 노드
- 트리에서 일부를 때어내도 트리 구조이며 이를 서브 트리라고 한다
- 계층적이고 정렬된 데이터를 다루기에 적합하다
이진 탐색 트리
- 트리 자료구조 중 가장 간단한 형태
- 주요 특징
- 부모 노드보다 왼쪽 자식 노드의 값이 작다
- 부목 노드보다 오른쪽 자식 노드의 값이 크다
빠르게 입력받기
- 이진 탐색 문제는 입력 데이터가 많거나, 탐색 범위가 넓은 편
- 이 경우, input() 함수는 동작 속도가 느리므로 sys 라이브러이의 readline() 함수를 이용하자
import sys
# 개행 문자까 함께 입력되므로 rstrip()을 사용
input_d = sys.stdin.readline().rstrip()
print(input_d)
문제
1. 부품 찾기
- 가게 안에 부품이 모두 있는지 확인하는 프로그램 작성
1-1. 내 풀이
- 탐색 대상이 되는 parts를 list로 구현했는데 문제 요구사항 + 성능 면에서 set으로 바꿔주는게 더 좋다
n = int(input())
parts = list(map(int, input().split()))
m = int(input())
wants = list(map(int, input().split()))
for i in wants:
if i in parts:
print('yes', end = ' ')
else:
print('no', end = ' ')
5
8 3 7 9 2
3
5 7 9
no yes yes
1-2. 이진 탐색 풀이
- 부품의 개수가 많은 경우 시간 복잡도를 줄이기 위해 이진 탐색 사용
# 이진 탐색 소스 코드 구현 (반복문)
def binary_search(array, target, start, end):
while start <= end:
mid = (start + end) // 2
if array[mid] == target:
return mid
elif array[mid] > target:
end = mid - 1
else:
start = mid + 1
return None
# 부품 리스트
n = int(input())
parts = list(map(int, input().split()))
# 손님이 찾는 부품 리스트
m = int(input())
wants = list(map(int, input().split()))
# 이진 탐색을 수행하기 위해 정렬 실행
parts.sort()
for i in wants:
# 해당 부품이 존재하는지 확인
result = binary_search(parts, i, 0, n-1)
if result != None:
print('yes', end = ' ')
else:
print('no', end = ' ')
5
8 3 7 9 2
3
5 7 9
no yes yes
1-3. 계수 정렬 풀이
- 모든 원소의 번호를 포함할 수 있는 크기의 리스트를 만듬
- 리스트의 인덱스에 직접 접근하여 특정한 번호의 부품이 매장에 존재하는지 확인
# 부품 리스트
n = int(input())
# 모든 원소의 번호 포함 가능한 리스트
array = [0] * 10001
# 가게에 있는 전체 부품 번호를 입력받아서 기록
for i in input().split():
array[int(i)] = 1
# 손님이 찾는 부품 리스트
m = int(input())
wants = list(map(int, input().split()))
for i in wants:
if array[i] == 1:
print('yes', end = ' ')
else:
print('no', end = ' ')
5
8 3 7 9 2
3
5 7 9
no yes yes
1-4. 집합 자료형 (Set) 이용 풀이
- 단순히 특정한 수가 한 번이라도 등장했는지를 검사할 때 set을 효과적이게 사용할 수 있다
- 많은 양의 데이터를 in으로 탐색할 때 list보다 set이 성능이 더 좋다
n = int(input())
parts = set(map(int, input().split()))
m = int(input())
wants = list(map(int, input().split()))
for i in wants:
if i in parts:
print('yes', end = ' ')
else:
print('no', end = ' ')
5
8 3 7 9 2
3
5 7 9
no yes yes
2. 떡볶이 떡 만들기
- 절단기 높이 H에 맞춰 적어도 손님이 요구한 떡의 총 길이 M만큼의 떡을 제공하기 위해 설정할 수 있는 H의 최댓값을 구하는 프로그램
- 전형적인 이진 탐색 문제이자 파라메트릭 서치 문제
- 적절한 높이를 찾을 때까지 절단기 높이 H를 반복해 조정
- H의 범위는 1 ~ 10억까지의 정수 중 하나 => 당연하다는 듯이 이진 탐색을 먼저 떠올려야 한다
파라메트릭 서치
- 최적화 문제를 결정 문제(yes or no)로 바꾸어 해결하는 기법
- 원하는 조건을 만족하는 가장 알맞은 값을 찾는 문제에 주로 사용
- 범위 내 조건을 만족하는 가장 큰 값을 찾으라는 최적화 문제인 경우, 이진 탐색으로 범위를 좁혀나갈 수 있음
- 이 유형의 경우, 이진 탐색을 재귀적으로 구현하지 않고 반복문을 이용해 구현해야 더 간결
# 떡의 갯수 : n, 요청한 떡의 길이 m
n, m = map(int, input().split())
list_ = list(map(int, input().split()))
# 이진 탐색을 위한 시작점과 끝점 설정
# 당연히 절단기의 높이는 0 ~ 가장 긴 떡의 길이 안에 있어야 한다
start = 0
end = max(list_)
result = 0
while(start <= end):
total = 0
# 중간값 => 계속 해서 최적화 시켜줄 H에 해당
mid = (start + end) // 2
for x in list_:
# 잘랐을 때 떡의 양 계산
if x > mid:
total += x - mid
# 떡의 양이 부족한 경우 더 많이 자르기 (왼쪽 부분 탐색)
if total < m:
end = mid - 1
# 떡의 양이 충분한 경우 덜 자르기(오른쪽 부분 탐색)
else:
result = mid # 최대한 덜 잘랐을 때가 정답
start = mid + 1
print(result)
4 6
19 10 17 15
15
댓글남기기