问题重现
某不知名springboot小项目,application.properties文件:
1 | custom.param=中文属性值 |
java代码:
1 |
|
控制台输出:
1 | ä¸æå±æ§å¼ |
结论
先写结论:用@Value注解读取application.properties文件时,编码默认是ISO-8859-1,所以直接配置中文一定会乱码。注意,配置文件是springboot默认的配置文件application.properties或application-{active}.properties。其他配置文件会在原因分析中进行详解,原因分析涉及大量源码解读,如果不想烧脑深入分析的话可以直接跳到解决方案一节。
写在前面
写本文时,我查了网上几乎所有关于@Value读取.properties中文乱码的文章。一种思路是修改编码格式;另外一种是利用插件/IDE将中文预先编码,在注入到变量后直接转码为所需要的中文。遇到中文乱码修改编码方式是常规思路,所以第一种思路看似没问题,但是把springboot所有关于encoding的配置参数修改为UTF-8后,中文乱码的问题依然没有解决。
原因分析
Spring Boot版本:2.1.1.RELEASE
- application.properties采用ISO-8859-1加载
- 自定义test.properties可以设置编码格式
- .yml/.yaml默认采用UTF-8加载
application.properties文件加载
正如前文所述读取配置文件时,编码出现了问题。追踪一下spring boot是加载默认配置文件的过程,会发现org.springframework.boot.contex.config.ConfigFileApplicationListener类的loadDocuments()方法,源码如下:
1 | private List<Document> loadDocuments(PropertySourceLoader loader, String name, Resource resource) throws IOException { |
入参loader的类型是PropertySourceLoader,PropertySourceLoader是加载属性文件的接口,其实现有两个类:PropertiesPropertySourceLoader和YamlPropertySourceLoader。loader根据传入参数的实例调用load()方法,此处我们讨论.properties文件,接口声明和properties加载实现如下:
1 | /*********属性文件加载接口**********/ |
通过源码分析PropertiesPropertySourceLoader并不单纯的加载.properties文件,还包含.xml文件(似乎有违单一功能原则,不知道当初这样设计的初衷是啥)。顺着load()方法向下找->loadProperties(Resource)->OriginTrackedPropertiesLoader.load()->OriginTrackedPropertiesLoader.load(boolean)->OriginTrackedPropertiesLoader$CharacterReader(Resource)。
CharacterReader是OriginTrackedPropertiesLoader的内部静态类,而且只有一个构造函数,看看器构造参数就不难发现为啥application.properties是以ISO-8859-1编码加载的了:
1 | private static class CharacterReader implements Closeable { |
也就是说不论application.properties文件被设置为哪种编码格式,最终还是以ISO-8859-1的编码格式进行加载。
yml/yaml默认以UTF-8加载
让我们再看看yml/yaml格式的文件,其加载由PropertySourceLoader接口的另外一个实例YamlPropertySourceLoader实现,即接口方法load():
1 | List<PropertySource<?>> load(String name, Resource resource) throws IOException; |
追一下load()的底层实现,采用org.yaml.snakeyaml.reader.UnicodeReader的实例对yml/ymal文件进行加载,而UnicodeReader实例对文件的初始化方法init()实现如下:
1 | protected void init() throws IOException { |
每次调用read()读文件时都会调用init()方法进行初始化,也就是这个时候确定文件的编码格式。首先读取BOM(Byte Order Mark)文件头信息,如果头信息中有UTF8/UTF16BE/UTF16LE就采用对应的编码,没有或者不是则采用UTF8编码。
自定义test.properties文件编码
采用@PropertySource(value=”classpath:test.properties”, encoding=”UTF-8”)方式读取配置文件可按照UTF-8的方式读取编码,而不是ISO-8859-1。@PropertySource配置的加载文件由ConfigurationClassParser.processPropertySource()进行解析,EncodedResource类决定最后由哪种编码格式加载文件,其方法如下:
1 | public Reader getReader() throws IOException { |
所以,虽然都是.properties文件,但是编码格式却是不一样的。
解决方案
- 自定义配置文件
- 使用yml/yaml配置文件
- IDE/插件预编码
自定义配置文件
通过@PropertySource(value=”classpath:my.properties”, encoding=”UTF-8”)注解配置自定义文件,注意文件名不能是springboot默认的application.properties文件名称。
使用yml/yaml配置文件
将yml/yaml文件设置为UTF-8的编码格式,springboot读该文件即采用UTF-8编码。
IDE/插件预编码
采用编译器或者插件将配置文件预编码。这种方法我没试过,但是想想也知道这是很反人类的。如果有人感兴趣的话,可以参考一下这篇博客最后一部分IDEA/eclipse的修改操作。
总结
在配置application.properties时,都是开发比较重要的参数,尽量使用英文,业务相关的中文配置还是不要放到这里。