파이썬 텍스트 마이닝 완벽 가이드

책을 천천히 읽어가다가..
어려운 내용을 흐름에 따라 핵심적인 내용을 이해하기 쉽게 쓰여져 있다는 생각이 자주 들어서
책의 후반을 읽는중에 책을 만든 사람이 궁금해졌고, 서문이 궁금해져서 저자의 약력과 서문을 읽어봤다
텍스트 마이닝을 배우고 다루기 위해서는 파이썬 기초부터, 언어학, 머신러닝, 딥러닝등의 깊이 있는 배경지식을 필요로 하며, 배경지식들도 이해하고 습득하기까지는 절대적인 시간과 노력이 필요하고, 텍스트 분석에 적용하며 숙련되기 까지는 더 많은 분석 시도를 통해서 시행착오를 겪으며, 찐 경험을 필요로 한다
그런데..책의 내용은 쉽게 읽혀진다
이 책은 끝까지 저자의 의도에 맞춰 씌여진 내용이고...개인적으로는 부족한 부분을 느끼지 못했다
1. 원리를 최대한 직관적으로 설명하려고 노력하셨고 (수식 기반의 내용을 배제하였음)
2. 코드를 가급적 간결하게 하고 실제로 적용하기 쉬운 예제를 만들고, 불필요한 코드는 배제하고 가급적 필수적인 부분들만 예제로 제시하였으며
하나의 일관된 주제의 데이터로 전처리부터 딥러닝을 이용한 문서 분류까지 다루고 있어서 더 좋았다
3. 예제 데이터에 대한 이해를 높이고, 코드에 의해 어떻게 변화하는지를 최대한 설명하고자 하셨고
4. ChatGPT가 등장하기까지의 발전 과정과 그 중심에 있는 사전학습 언어모델 및 다양한 트랜스포머 모형들 등의 세부적인 내용을 담고 있다.
흐름에 따라 쉽고 빠르게 읽혀진 책이라... (어쩌면 다른 여러 책들로 관련 내용의 배경 지식을 어느정도 알고 있기 때문에 가능한 것일지는 몰라도...)
주관적으로 아주 좋은 책이라고 판단됨