1 Excel 형식과 같은(Matrix 형태) 정형화 되어있는 데이터를 다루었지만, 사람들이 사용할수 있는 웹상의 컨텐츠가 증가함에 따라 비정형 데이터(텍스트, 이미지, 비디오, 사운드 데이터)도 증가하게 되고 비정형 데이터처리하는 기술이 나오게 되었습니다.
2 소셜상의 텍스트 데이터를 모아서 자연어 처리통해 주 키워드가 무엇인지 그 키워드에 대한 긍정인지 부정인지 판별하고 그 긍정 부정률이 전체 어느정도 차지하는지, 긍정 부정에 대한 원인은 무엇인지 분석하는 기법이라고 생각 하시면 될것 같습니다.
3 단순히 긍정 단어가 들어갔다고 해서 그 문장이 긍정을 뜻하는 것은 아니라는 얘기입니다.