안녕하세요, VisualizeAttentionMap 코드 관련 질문으로 이슈를 남기게 되었습니다. 제 질문은 다음과 같습니다. 1. residual_att를 더해주는 이유 2. joint_attentions에서 이전 joint_attentions 값과 aug_att_mat를 matmul 해주는 이유와 마지막 값만 쓰는 이유 3. v[0, 1:] 에서 첫번째 값은 빼는 이유 입니다. 감사드립니다.
안녕하세요,
VisualizeAttentionMap 코드 관련 질문으로 이슈를 남기게 되었습니다. 제 질문은 다음과 같습니다.
입니다.
감사드립니다.