博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
linux下php中文UTF-8转换Unicode方法和注意事项
阅读量:6605 次
发布时间:2019-06-24

本文共 2203 字,大约阅读时间需要 7 分钟。

先说下遇到问题:1.php没有内置unicode_ecode函数可以直接使用

2.网上很多资料都是用$str = iconv($encoding'UCS-2'$str);

window下转换出来的是正常的,但在Linux下转换出来的两个字符是相反的,用在线unicode转换工具出来的结果是乱码。

UCS-2的编码规则:

windows下默认是UCS-2LE。
linux下默认是UCS-2BE。用iconv(指定UCS-2)来转换生成的是UCS-2BE的unicode,但可能php环境配置会导致不是UCS-2BE。
windows和linux等多个平台对 UCS-2 的理解不同(UCS-2LE,UCS-2BE),所以为了统一需要直接指定为UCS-2BE。

即把:$str = iconv($encoding'UCS-2'$str); 改为$str = iconv($encoding'UCS-2BE'$str);

亲测转换出来的unicode可以正常转换的

下面是两个本人亲测可以使用的函数(为了避免以后跟系统新的内置函数同名在前面加了个my前缀):

1 /** 2  * utf-8 转unicode 3  * @param string $name 4  * @return string 5  */ 6 function myutf8_unicode($name){ 7     $name = iconv('UTF-8', 'UCS-2BE', $name); 8     $len  = strlen($name); 9     $str  = '';10     for ($i = 0; $i < $len - 1; $i = $i + 2){11         $c  = $name[$i];12         $c2 = $name[$i + 1];13         if (ord($c) > 0){14             $str .= '\u'.base_convert(ord($c), 10, 16).str_pad(base_convert(ord($c2), 10, 16), 2, 0, STR_PAD_LEFT);15         } else {16             $str .= '\u'.str_pad(base_convert(ord($c2), 10, 16), 4, 0, STR_PAD_LEFT);17         }18     }19     return $str;20 }21 22 /**23  * unicode 转 utf-824  *25  * @param string $name26  * @return string27  */28 function myunicode_decode($name)29 {30     $name = strtolower($name);31     // 转换编码,将Unicode编码转换成可以浏览的utf-8编码32     $pattern = '/([\w]+)|(\\\u([\w]{4}))/i';33     preg_match_all($pattern, $name, $matches);34     if (! empty($matches)) {35         $name = '';36         for ($j = 0; $j < count($matches[0]); $j ++) {37             $str = $matches[0][$j];38             if (strpos($str, '\\u') === 0) {39                 $code = base_convert(substr($str, 2, 2), 16, 10);40                 $code2 = base_convert(substr($str, 4), 16, 10);41                 $c = chr($code) . chr($code2);42                 $c = iconv('UCS-2BE', 'UTF-8', $c);43                 $name .= $c;44             } else {45                 $name .= $str;46             }47         }48     }49     return $name;50 }

测试代码:

$ustr = myutf8_unicode('我的新衣');echo '我的新衣:'.$ustr.'
';$str = myunicode_decode($ustr);echo $str.'
';

输出结果:

在站长工具里可以正常转换,说明没有问题。

 

==========================

本人微信公众帐号: 心禅道(xinchandao)

本人微信公众帐号:双色球预测合买(ssqyuce)

         囤币一族(tunbitt)公众号二维码

转载地址:http://uhfso.baihongyu.com/

你可能感兴趣的文章
Gephi -
查看>>
crontab使用入门
查看>>
兼容的min-height
查看>>
Web墨卡托坐标与WGS84坐标互转
查看>>
给vs2012换肤
查看>>
XML文档操作
查看>>
转:iphone开发内存管理之二──静态全局变量的内存问题
查看>>
Java BigDecimal和double
查看>>
【译】在Asp.Net中操作PDF – iTextSharp-列表
查看>>
[C#] 网页Html转PDF档(一行程式码解决)
查看>>
[译]SSAS下玩转PowerShell
查看>>
java接口中多继承的问题
查看>>
Android -- Fragment
查看>>
索引笔记《二》确定需要建立索引的列
查看>>
如果把编程语言当成座驾
查看>>
libjpeg的问题
查看>>
MySQL数据库学习笔记(八)----JDBC入门及简单增删改数据库的操作
查看>>
Linq查询简介
查看>>
vS2010 列表控件 加入右键菜单
查看>>
Unity-Animator深入系列---剪辑播放后位置预判(Animator.Target)
查看>>