오늘은 Subword-based Tokenizer과 그 method인 Byte Pair Encoding에 대해 배웠다. 내용이 이해는 되는데 직접 실습 과제를 코딩해보고 하는 과정이 굉장히 어려웠던 것 같다. 조교님도 NLP는 data preprocessing이 굉장히 중요하다고 하셨는데, 중요한 만큼 어려운 것 같다. 그래도 최대한 열심히 공부해봐야겠다.
'끄적끄적' 카테고리의 다른 글
| 7월 1일 끄적끄적 (1) | 2022.07.01 |
|---|---|
| 6월 30일 끄적끄적 (0) | 2022.06.30 |
| 6월 27일 끄적끄적 (0) | 2022.06.27 |
| 6월 24일 끄적끄적 (0) | 2022.06.24 |
| 6월 23일 끄적끄적 (0) | 2022.06.23 |