@eric1989
2015-11-09T11:49:15.000000Z
字数 4085
阅读 808
最高性能
Json
Jfier-codejson是目前为止性能最强的json框架。序列化性能超越fastjson50%,反序列化性能**几倍于**fastjson.
在性能强劲的同时具备非常简单的API接口。对于常规操作,序列化和反序列化各自只有一个接口调用,非常简单易用。框架还支持以插件形式进行功能扩展,非常方便进行自定义的开发。
假设存在以下几个类
public class Person
{
private String name;
private int age;
private boolean boy;
}
public class Home
{
privaet String name;
private Person host;
private float height;
private float weidth;
}
public static void main(String args[])
{
Home home = new Home();
home.setPerson(new Person());
//这样就完成了将home转换为json字符串的动作
String json = JsonTool.write(home);
//这样就完成了将json字符串转换为json对象的动作
JsonObject jsonObject =(JsonObject)jsonTool.fromString(json);
//这样就完成了将json字符串转换为java对象的动作
Home result = JsonTool.read(Home.class,json);
}
代码托管于osc:地址
编译包的下载链接:链接
依赖基础包的下载链接:链接
Jfire-codejson性能如此之强原因在于采用了与众不同的算法。
序列化
传统的序列化框架,或者说相对比较优秀的序列化框架大部分都采用了分析对象内容,而后通过反射调用方法或者反射取出属性值的方式将对象进行序列化。这种思想产生的框架最大的瓶颈在反射导致的性能消耗。Jfire-codejson独特的使用了为序列化对象动态编译一个输出对象,输出对象中全部是调用序列化对象的get方法来得到属性值。并且在拼接json中的key名称时,由于动态编译代码,所以编译代码中是事先知道并且写入的,这样又减少了获取对象属性名称的这一步骤。使得Jfire-codejson的序列化能力逼近理论上限(为每个对象编写代码的这种理论方式)
反序列化
反序列化首先是解析json字符串。在这一步,框架设计了一种无回退的单次字符读取方式。大致原理是依次读取每一个字符,如果遇到一些特殊的表示字符,比如{
,}
,:
,[
,]
等等。在遇到这些字符的时候生成jsonObject或者jsonArray来进行相应的读取处理。使用两个堆栈,一个堆栈存储jsonKey,一个堆栈存储当前待处理的json对象(jsonObject或者jsonArray)。这样子在处理的过程中就可以达到顺序处理的效果。解析的速度非常快,可以达到数倍于fastjson的性能。
将一个json对象反序列化成pojo,原理上和序列化大致相同。通过将对象的所有set方法得到。动态编译一个设置类,该类中对于每一个set方法,都生成类似if(jsonObject.containsKey("name")){entity.setName(jsonObject.getString("name"))}
这样的代码。由于是动态编译,所以事先知道需要进行哪些判断,而且判断完之后是原生代码的set操作,节省了判断时间和调用反射时间,故而反序列化的性能也是非常的优秀。几倍于fastjson。
如果要将一个对象序列化,最快的方式无疑是针对这个对象,写出一段特定的代码。代码当中通过调用对象的get方法来得到对象属性值。参考下面的代码
public class User
{
private String name;
private int age;
}
//针对上面的类,最快的序列化json的代码应该是
public static void main(String args[])
{
User user = new User();
StringBuilder str = new StringBuilder();
str.append("{");
str.append("\"name\":");
str.append("\"").append(user.getName()).append("\",");
str.append("\"age\":").append(user.getAge());
str.append("}");
}
在上面的示例代码中,没有反射,没有任何分析。针对对象给出特定的序列化代码。如果说我们的框架也能够模拟这样的方式,就可以达到最大化的序列速度。并且可以逼近理论的上限。为了达到这样的效果,采用了动态代码编译的方式来完成。
StringBulder.append(name).append(:).append(javabean.getXxx())
的形式通过上面这样的步骤,框架针对每一个对象,都能生成一个针对该该对象的特定输出类,这个输出类为原生代码编译,获取对象内容以及属性名称都是原生代码调用,性能非常高。
当然,动态代码生成中有很多需要判断的地方。比如如果是对象的情况下,要在字符串中添加{}
。比如字符串需要使用"
包围内容,而数字和布尔值不需要,比如遇到数组需要[]
等等。但是大体的思想就是通过动态代码编译,在运行的时候针对一个特定的对象,生成针对该对象的输出类。并且对这个类进行编译生成Class文件。动态编译这个部分采用Javassist来完成。
生成的代码例子如下
序列化一个如下对象
public class com.jfire.codejson.Home
{
private String name = "home";
private int length = 113;
private int wdith = 89;
//省略get set方法
}
框架针对这个对象生成的动态类的内容是
public class JsonWriter_Home_231313131
{
StringCache cache = (StringCache)$2;
com.jfire.codejson.Home entity =(com.jfire.codejson.Home )$1;
cache.append('{');
cache.append("\"length\":").append(entity.getLength()).append(',');
String name = entity.getName();
if(name!=null)
{
cache.append("\"name\":\"").append(name).append("\",");
}
cache.append("\"wdith\":").append(entity.getWdith()).append(',');
if(cache.isCommaLast())
{
cache.deleteLast();
}
cache.append('}');
}
因为json是一个kv结构。所以算法设计了两个堆栈结构。堆栈结构,在数据顺序上和算法要求的一遍读取无回溯是相吻合的。
解析json字符串的算法的思路大致可以描述为
{
,}
,:
,[
,]
,,
,'"'等进行特别处理,记录发现位置,根据发现位置决定是否创建新的jsonObject或者jsonArray进行嵌套等。下面是解析过程的详细流程图
将一个json对象反序列化成Pojo,和序列化的流程相似。算法的大致思路如下
EntityClass entity = new EntityClass();
。使用pojo的类创建一个Pojo对象供后面使用if(json.containsKey("name")){entity.setName(json.getString("name"))}
的代码。其中name
就是根据set方法计算出来的属性名。if(json.containsKey("anotherObject")){entity.setAnotherObject(readContext.read(AnotherObject.class,json.getString("name")))}
的代码。其中readContext就是一个保存pojo和转换类映射关系的Map容器。经过以上的四个步骤,就完成了一个输出类的代码生成。使用这个输出类对特定的对象进行反序列化就可以达到非常高的性能。