Beam Search Greedy decoding 매 타임 스텝마다 높은 확률을 가지는 단어 하나만을 선택해서 진행한다. 이를 Greedy decoding이라고 한다. 알고리즘 공부했을 때 배운, 그리디 알고리즘처럼 당시 상황에서의 최선의 선택을 하기 때문에 앞에 Greedy가 붙은 것 같다. 이 단점 중 하나는 뒤로 못 돌아가는 것이다. Exhaustive Search 그래서 joint probability를 수식으로 사용해서 해결한다. 이렇게 해서 P(y1∣x)에서 작은 값을 가졌더라고 이후 값들에서 큰 값을 얻어 바뀔 수 있다. time step t까지의 모든 가능성을 따진다. -> 너무 큰 시간 복잡도 Beam Search 하나의 가능성만 보는 Greedy decoding과 모든 가능성을 보는 ..