又在写bug呢 ⋮
手持两把锟斤拷,口中疾呼烫烫烫,脚踏千朵屯屯屯,笑看万物锘锘锘
锟斤拷(读作kūn jīn kǎo),是一串经常在搜索引擎页面和其他网站上看到的乱码字符。乱码源于GBK字符集和Unicode字符集之间的转换问题。
锟斤拷则涉及unicode的字符集转换问题,Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。U+FFFD的UTF-8编码是0xEFBFBD,如果重复多次形成:EFBFBDEFBFBDEFBFBD 。
在GBK/CP936/GB2312/GB18030的环境中显示的话,一个汉字2个字节,最终的结果就是:锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)。
还有一个比较出名的是烫烫烫:一些编译器会把C语言中未初始化的栈内存自动赋值为0xcc,以字符串输出后,便会显示成烫烫烫。
除了程序猿,这估计不是你我们一般人能理解的东西,看到“锟斤拷”这三个字,只要记住是乱码就对了。
类似的乱码还有:烫烫烫,屯屯屯,锘锘锘等。
锘锘锘与“屯屯屯”、“烫烫烫”、“锟斤拷”并称为“乱码四大天王”。
网友:手持两把锟斤拷,口中疾呼烫烫烫。
发表评论 取消回复