이전 장에서 한 작업을 간편하게 할 수 있다.
여기서 num_classes는 idx2char의 갯수와 동일하다. (유일한 문자의 갯수)
one hot으로 만들 때는 shape이 변할 수도 있으니까 체크해 봐야 한다.
Sample 만 바꿀 경우 나머지 다 알아서 계산되도록 하는 것이 목표!
dic_size : char2idx 길이(입력의 데이터)
rnn hidden size, num _classes : 입력의 데이터
batch size : 1
sequence_length : 전체 길이 - 1 (X값 크기는 -1)
학습 결과
굉장히 긴 문자열을 학습시키는 과정.
seq_length를 정해서 그 갯수만큼 글자를 잘라서 학습을 시킨다. (맘대로 정하면 됨)
여기서는 전체 데이터를 다 학습하는 데에 쓰기 위해 batch size 를 dataX의 길이로 했다.
Exercise! 이거 실행시켜보면 잘 안되는데 이게 왜 잘 안되는지 생각해보기
Logit 부분 확인, RNN이 깊지가 않음