1 최근 SQL-On-Hadoop이라고 하여 Hadoop에 저장된 데이터를 MapReudce라는 프로그램을 이용하지 않고 개발자(또는 사용자, 데이터 분석가)에게 친근한 인터페이스인 SQL을 이용하여 데이터처리하는 솔루션이 많은 관심을 받고 있다.
2 SQL을 얼마나 효과적인 실행계획으로 처리하느냐도 성능에 많은 영향을 준다.
3 데이터가 Hadoop에 저장되어 있고 특별한 경우를 제외하고는 대부분 full scan으로 데이터 파일을 읽기 때문에 처리 속도에 가장 중요한 영향을 미친다.
트위터 반응

@babokim: SQL-On-Hadoop 성능의 진실
http://t.co/ZnUNZby699

@channyun: "SQL on Hadoop 100배, 200배 성능의 진실" http://t.co/qDHXzNX9kB 저도 요즘 빅데이터 오픈 소스쪽에서 많이 느낀 사실들... 접근 방식이 다를 뿐 제발 구라좀 치지 맙시다~!