SW Engineering/Hadoop

하둡 인코딩 방식 설정

SungWookKang 2015. 7. 22. 09:30
반응형

하둡 인코딩 방식 설정 

   

하둡은 인코딩 방식으로 UTF-8을 사용한다. 다른 인코딩 방식을 사용할 경우 문자열 처리시 문제가 발생 할 수 있으므로 서버 인코딩을 반드시 확인 한다. 

   

  UTF-8 : UTF-8은 유니코드를 위한 가변 길이 문자 인코딩 방식 중 하나이며 한 문자를 나타내기 위해 1바이트에서 4바이트까지 사용한다. 자세한 내용은 검색을 통하여 알아 보도록 한다. (참고 링크 : http://ko.wikipedia.org/wiki/UTF-8

   

리눅스에서 인코딩 방식을 확인 하는 명령어는 echo 이다. 대소문자의 주의 한다. (CentOS 6.4에서 진행 하였다.)

# echo $LANG 

   

 

   

UTF-8이 아닌경우 다음과 같이 UTF-8로 변경 한다. 

# vi /etc/sysconfig/i18n 

   

 

   

편집이 완료 되면 source 명령어를 이용하여 시스템에 적용한다. 

# source /etc/sysconfig/i18n 

   

locale 명령어를 사용하여 모든 언어 관련 파라미터가 UTF-8로 설정된 모습을 확인 할 수 있다. 

# locale 

   

 

   

   

[참고자료] 

시작하세요 하둡프로그래밍/위키북스 

   

   

강성욱 / http://sqlmvp.kr

반응형

'SW Engineering > Hadoop' 카테고리의 다른 글

하둡실행  (0) 2015.07.22
하둡 환경설정 파일 수정  (0) 2015.07.22
맵리듀스(MapReduce) 작동방식  (0) 2015.07.22
맵리듀스(MapReduce) 구성  (0) 2015.07.22
맵리듀스(MapReduce) 개념  (0) 2015.07.22