怎么理解Java字符编码

这篇文章主要介绍“怎么理解Java字符编码”,在日常操作中,相信很多人在怎么理解Java字符编码问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么理解Java字符编码”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

创新互联公司服务项目包括正安网站建设、正安网站制作、正安网页制作以及正安网络营销策划等。多年来,我们专注于互联网行业,利用自身积累的技术优势、行业经验、深度合作伙伴关系等,向广大中小型企业、政府机构等提供互联网行业的解决方案,正安网站推广取得了明显的社会效益与经济效益。目前,我们服务的客户以成都为中心已经辐射到正安省份的部分城市,未来相信会继续扩大服务区域并继续获得客户的支持与信任!

前言

在计算机中,任何的文字都是以指定的编码方式存在的,在 Java 程序的开发中最常见的是 ISO8859-1、GBK/GB2312、Unicode、 UTF 编码。

Java中常见的编码

(1)ISO8859-1:属于单字节编码,最多只能表示 0~255 的字符范围。

(2)GBK/GB2312:中文的国标编码,用来表示汉字,属于双字节编码。GBK 可以表示简体中文和繁体中文,而 GB2312 只能表示简体中文。GBK 兼容 GB2312。

(3)Unicode:是一种编码规范,是为解决全球字符通用编码而设计的。UTF-8 和 UTF-16 是这种规范的一种实现,此编码不兼容 ISO8859-1 编码。Java 内部采用此编码。

(4)UTF:UTF 编码兼容了 ISO8859-1 编码,同时也可以用来表示所有的语言字符,不过 UTF 编码是不定长编码,每一个字符的长度为 1~6 个字节不等。一般在中文网页中使用此编码,可以节省空间。

如果在程序中处理不好字符编码,就有可能出现乱码问题。例如现在本机的默认编码是 GBK,但在程序中使用了 ISO8859-1 编码,则就会出现字符的乱码问题。就如同两个不同国家的人用自己的母语交流,语言不同就无法沟通。所以为了避免产生乱码,程序编码应与本地的默认编码保持一致。

public static Properties getProperty()   //可以查看当前系统使用默认编码

代码示例:

public static void main(String[] args) {
   // 获取当前系统编码
   System.out.println("系统默认编码:" + System.getProperty("file.encoding"));
}

编码错误案例:

public class Test {
   public static void main(String[] args) throws Exception {
       File f = new File("D:" + File.separator + "test.txt");
       // 实例化输出流
       OutputStream out = new FileOutputStream(f);
       // 指定ISO8859-1编码
       byte b[] = "C语言中文网,你好!".getBytes("ISO8859-1");
       // 保存转码之后的数据
       out.write(b);
       // 关闭输出流
       out.close();
   }
}

运行结果如下:

怎么理解Java字符编码

由此可见,由于编码不一致,所以在保存时出现了乱码。

到此,关于“怎么理解Java字符编码”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注创新互联网站,小编会继续努力为大家带来更多实用的文章!


网站题目:怎么理解Java字符编码
URL链接:http://csdahua.cn/article/gpogic.html
扫二维码与项目经理沟通

我们在微信上24小时期待你的声音

解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流