nltk.NaiveBayesClassifier.train(train_set)
간단한 학습 알고리즘인 naive bayes 를 사용.
결과는 80% 에 가까운 정확도를 나타내는 것 같다.

>>> def gender_features(word):
... return {'last_letter': word[-1]}

이런식으로 "마지막 글자"에 대한 feature 를 통해 남자 or 여자 인지 학습을 시키고.
그 feature로 테스트 했넹.

미국의 이름과 성별의 데이터 5만개 정도로 학습 시킨 후,
테스트로 이름을 넣었을 때, 남자 인지 여자인지 맞추는 학습과 테스트 코드.

마지막 글자를 feature 로 하고, 단순한 베이지언 학습을 썼기 때문에. (이게 실무에서도 가장 많이 쓰는 듯?)
결과를 보면서 수동으로 feature를 조정하고, 값을 조정하면 그럴듯한게 나올것 같다.

(라는 과정을 알기에 좋은 책)

우왕 이런걸 이해하시다니 ㅜㅜ 번역점

어버버버 어려워요 ㅋ