utf8 and unicode

使用如下代码得到汉字“年”的unicdoe 编码和UTF8编码:
package test;
import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;
public class Test {
 public static String getUTF8EnCodeFromText(String text) {
 StringBuffer sb = new StringBuffer();  
     sb.append(text);  
     String xmString = "";  
     String xmlUTF8 = "";  
     try {  
      xmString = new String(sb.toString().getBytes("UTF-8"));  
      xmlUTF8 = URLEncoder.encode(xmString, "UTF-8");  
      System.out.println("UTF8 Code:" + xmlUTF8) ;  
     } catch (UnsupportedEncodingException e) {    
      e.printStackTrace();  
     }  
     return xmlUTF8;
 }  
 
 public static String getUniCode(char single) {
        StringBuffer output = new StringBuffer();
        output.append(Integer.toString(single, 16));
        
        System.out.println("Unicode: " + output);
        return output.toString();
 }
 
 public static void main(String[] args) throws UnsupportedEncodingException {
 Test.getUTF8EnCodeFromText("2014年12月1日和联想有一个重要的销售会议");
 Test.getUniCode('年');
 Test.getUTF8EnCodeFromText("年");
        char ab = ((char)Integer.parseInt("5e74", 16));  
        System.out.println("original character: " + ab);
 }
}
输出:
如果用记事本打开一个具有如下内容的txt文件:

clipboard1

用hex editor打开,发现该字符的编码为 C4 EA

clipboard2

通过检查发现该txt file的保存方式是ANSI:

clipboard3

改成utf8后,再用hex eidtor打开就能观察到期望的编码如下:

clipboard4

 
通过访问网站: http://www.ab173.com/utf8.php
  
能得到如何用javascript 进行转换的source code:

clipboard5

展开阅读全文
©️2020 CSDN 皮肤主题: 深蓝海洋 设计师: CSDN官方博客 返回首页
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值