Site icon 엘스트림

PHP에서 네이버 블로그 등을 저장할 때 한글이 깨지는 문제

컬(cUrl)통신을 해서 링크의 정보를 불러올 때 네이버 블로그나 사이트는 잘 안되는 경향이 있었다.

특이해서 알아보니 캐릭터 셋이 ks_c_5601-1987 이라고 한다. 이는 CP 949가 인코딩 되기전의 문자열이라고 한다.

즉 EUC-KR이 되기전의 녀석인것 같다. 그런데 문제는 이 문자열을 iconv에서 인식을 하지 못한다는 것이다.

그럴때는 이렇게 하면 해결이 된다.

if($charset==’KS_C_5601-1987′) {
$charset = ‘CP949’;
}

즉 캐릭터셋이 ks 머시기이면 CP949로 변환시켜주는 것이다.

$charset은 mb_detect_encoding으로도 알 수 있다.

http://php.net/manual/en/function.mb-detect-encoding.php

참 고생이 많다. 네이버…

 

 

Exit mobile version