반응형
하둡 인코딩 방식 설정
하둡은 인코딩 방식으로 UTF-8을 사용한다. 다른 인코딩 방식을 사용할 경우 문자열 처리시 문제가 발생 할 수 있으므로 서버 인코딩을 반드시 확인 한다.
UTF-8 : UTF-8은 유니코드를 위한 가변 길이 문자 인코딩 방식 중 하나이며 한 문자를 나타내기 위해 1바이트에서 4바이트까지 사용한다. 자세한 내용은 검색을 통하여 알아 보도록 한다. (참고 링크 : http://ko.wikipedia.org/wiki/UTF-8)
리눅스에서 인코딩 방식을 확인 하는 명령어는 echo 이다. 대소문자의 주의 한다. (CentOS 6.4에서 진행 하였다.)
# echo $LANG |
UTF-8이 아닌경우 다음과 같이 UTF-8로 변경 한다.
# vi /etc/sysconfig/i18n |
편집이 완료 되면 source 명령어를 이용하여 시스템에 적용한다.
# source /etc/sysconfig/i18n |
locale 명령어를 사용하여 모든 언어 관련 파라미터가 UTF-8로 설정된 모습을 확인 할 수 있다.
# locale |
[참고자료]
시작하세요 하둡프로그래밍/위키북스
강성욱 / http://sqlmvp.kr
반응형
'SW Engineering > Hadoop' 카테고리의 다른 글
하둡실행 (0) | 2015.07.22 |
---|---|
하둡 환경설정 파일 수정 (0) | 2015.07.22 |
맵리듀스(MapReduce) 작동방식 (0) | 2015.07.22 |
맵리듀스(MapReduce) 구성 (0) | 2015.07.22 |
맵리듀스(MapReduce) 개념 (0) | 2015.07.22 |