LSTM은 RNN 아키텍처를 근간으로 하는 모델이다. RNN(recurrent network) 모델은 입력층-은닉층-출력층
으로 이어지는 순방향 신경망(feed-forward network)이다.
이와 달리 LSTM은 feedback 연결을 포함하고 있어 순환 신경망인 특성이 있다.
LSTM은 새로운 입력이 주어지면 셀(cell)이라는 공간에 단어의 상태를 저장한다. 셀은 입력을 담당하는 입력 게이트(input gate)
, 출력을 담당하는 출력 게이트(output gate)
, 상태를 잊기 위해 망각 게이트
(forget gate)의 역할을 수행한다.
입력 상태는 중요도에 따라 잊을지 말지를 결정해 주어야 한다. 입력 게이트
는 입력 상태의 크기를 결정해 기억량의 크기를 결정하며, 망각 게이트
는 입력 상태 파라메터에 기억한 상태 파라메터를 곱해 잊을지 말지를 결정한다. 출력 게이트
는 실제 출력을 담당하며 현재 입력 상태와 업데이트된 상태 파라메터의 입력을 고려해 결정한다.