책 리뷰

김기현의 자연어 처리 딥러닝 캠프

seungdols 2019. 8. 9. 01:11

자연어 처리 딥러닝캠프

 

자연어 관련한 책이 사실 많이 없는데, 이 책을 보면 기본적인 자연어 처리에 관한 정보가 굉장히 많다.

 

심지어, 한글로 되어 있다는 점은 더욱 놀랍다. 더군다나 예제 기반으로 설명을 하고 있으며, 주요한 자연어 처리에 관한 부분을 탁 탁 꼬집어 설명을 하고 있다는 점이 좋게 생각 되었다.

 

사실, 자연어 처리라는게 일반 서비스를 개발 하는 사람들에게는 낯설다. 그렇지만, 코퍼스, 워드 임베딩등등 새롭지만 자연어 처리에 대한 입문을 조금 쉽게 할 수 있도록 이론과 수학적 지식 그리고, 코드를 통해 이해를 돕고 있는 책이다.

 

특히나, 코퍼스 수집과 정제에 관한 부분이 나는 중요한 부분이라고 생각 하는데, 파서의 개념, 분절의 개념은 생소하지만, 재미나게 봤다.

 

사실, 데이터의 수집과 정제는 모호한 측면이 생길 수도 있다고 생각 했다. 자연어는 곧 수집한 대상이 베이스가 되기 때문이다. 그리고, 수집을 아무리 한다 한들, 더러움을 깨끗하게 잘 워싱처리 하는 부분도 핵심이라고 생각 하는 편이다. 딥러닝 장인이어도, 학습데이터, 원천 데이터 자체가 더러우면 딥러닝 해도 답 안 나온다.

 

만약, 딥러닝이 워낙 발전 한다 한들, 인간 처럼 생각해서 분류 하고, 추상화 하고, 추론을 내리는 수준까지 가지 않는 이상에 애초에 이상 데이터로는 뭘 할 수가 없다는 게 나의 지론이다.

 

사실, 업무에 있어서도, 사전 구축이나 자연어 처리를 잘 하면 좋겠다는 생각을 많이 하긴 했는데, 책 초반에 나오는 수학적 지식을 완전히 이해하지는 못했다. 워낙에 확통이나, 선형대수학을 접해본적이 없었고, 졸업한지 오랜만에 본 수학 지식이라 어려웠다.

 

그렇지만, 이 책을 읽음에 수학적 지식이 풍부하다면, 쉽게 읽을 수 있고 도움이 되어 좋겠지만 읽다 보면 어떻게 연결이 되고 흘러 가는 맥락 파악을 할 수 있다. 어찌하든, 자연어 처리에 관해서 입문 하는데에는 좋은 책이라고 생각 한다.

반응형