Java class文件格式

JVM虚拟机规范第四章中规定了class文件必须是一个固定的结构,如下所示:

ClassFile {
    u4 magic;
    u2 minor_version;
    u2 major_version;
    u2 constant_pool_count;
    cp_info constant_pool[constant_pool_count-1];
    u2 access_flags;
    u2 this_class;
    u2 super_class;
    u2 interfaces_count;
    u2 interfaces[interfaces_count];
    u2 fields_count;
    field_info fields[fields_count];
    u2 methods_count;
    method_info methods[methods_count];
    u2 attributes_count;
    attribute_info attributes[attributes_count];
}

在JVM规范中u1u2u4分别表示的是1、2、4个字节的无符号数,可使用java.io.DataInputStream类中的对应方法:readUnsignedBytereadUnsignedShortreadInt方法读取。除此之外,表结构(table)由任意数量的可变长度的项组成,用于表示class中的复杂结构,如上述的:cp_infofield_infomethod_infoattribute_info

TestHelloWorld.class十六进制:

img

Magic(魔数)

魔数是class文件的标识符,固定值为0xCAFEBABE,JVM加载class文件时会先读取4字节(u4 magic;)的魔数信息校验是否是一个class文件。

Minor/Major Version(版本号)

class文件的版本号由两个u2组成(u2 minor_version; u2 major_version;),分别表示的是minor_version(副版本号)、major_version (主版本号),我们常说的JDK1.8Java9等说的就是主版本号,如上图中的TestHelloWorld.class的版本号0x34JDK1.8

Java版本对应表:

JDK版本 十进制 十六进制 发布时间
JDK1.1 45 2D 1996-05
JDK1.2 46 2E 1998-12
JDK1.3 47 2F 2000-05
JDK1.4 48 30 2002-02
JDK1.5 49 31 2004-09
JDK1.6 50 32 2006-12
JDK1.7 51 33 2011-07
JDK1.8 52 34 2014-03
Java9 53 35 2017-09
Java10 54 36 2018-03
Java11 55 37 2018-09
Java12 56 38 2019-03
Java13 57 39 2019-09
Java14 58 3A 2020-03
Java15 59 3B 2020-09
Java16 60 3C 2021-03
Java17 61 3D 2021-09
Java18 62 3E 2022-03
Java19 63 3F 2022-09

constant_pool_count (常量池计数器)

u2 constant_pool_count;表示的是常量池中的数量,constant_pool_count的值等于常量池中的数量加1,需要特别注意的是longdouble类型的常量池对象占用两个常量位。

constant_pool(常量池)

cp_info constant_pool[constant_pool_count-1];是一种表结构,cp_info表示的是常量池对象。

cp_info数据结构:

cp_info {
   u1 tag;
   u1 info[];
}

u1 tag;表示的是常量池中的存储类型,常量池中的tag说明:

常量池类型 Tag 章节
CONSTANT_Utf8 1 §4.4.7
CONSTANT_Integer 3 §4.4.4
CONSTANT_Float 4 §4.4.4
CONSTANT_Long 5 §4.4.5
CONSTANT_Double 6 §4.4.5
CONSTANT_Class 7 §4.4.1
CONSTANT_String 8 §4.4.3
CONSTANT_Fieldref 9 §4.4.2
CONSTANT_Methodref 10 §4.4.2
CONSTANT_InterfaceMethodref 11 §4.4.2
CONSTANT_NameAndType 12 §4.4.6
CONSTANT_MethodHandle 15 §4.4.8
CONSTANT_MethodType 16 §4.4.9
CONSTANT_Dynamic 17 §4.4.10
CONSTANT_InvokeDynamic 18 §4.4.10
CONSTANT_Module 19 §4.4.11
CONSTANT_Package 20 §4.4.12

每一种tag都对应了不同的数据结构,上述表格中标记了不同类型的tag值以及对应的JVM规范章节

access_flags (访问标志)

u2 access_flags;,表示的是某个类或者接口的访问权限及属性。

标志名 十六进制值 描述
ACC_PUBLIC 0x0001 声明为public
ACC_FINAL 0x0010 声明为final
ACC_SUPER 0x0020 废弃/仅JDK1.0.2前使用
ACC_INTERFACE 0x0200 声明为接口
ACC_ABSTRACT 0x0400 声明为abstract
ACC_SYNTHETIC 0x1000 声明为synthetic,表示该class文件并非由Java源代码所生成
ACC_ANNOTATION 0x2000 标识注解类型
ACC_ENUM 0x4000 标识枚举类型

this_class(当前类名称)

u2 this_class;表示的是当前class文件的类名所在常量池中的索引位置。

super_class(当前类的父类名称)

u2 super_class;表示的是当前class文件的父类类名所在常量池中的索引位置。java/lang/Object类的super_class的为0,其他任何类的super_class都必须是一个常量池中存在的索引位置。

interfaces_count(当前类继承或实现的接口数)

u2 interfaces_count;表示的是当前类继承或实现的接口数。

interfaces[] (接口名称数组)

u2 interfaces[interfaces_count];表示的是所有接口数组。

fields_count(当前类的成员变量数)

u2 fields_count;表示的是当前class中的成员变量个数。

fields[](成员变量数组)

field_info fields[fields_count];表示的是当前类的所有成员变量,field_info表示的是成员变量对象。

field_info数据结构:

field_info {
   u2 access_flags;
   u2 name_index;
   u2 descriptor_index;
   u2 attributes_count;
   attribute_info attributes[attributes_count];
}

属性结构:

  1. u2 access_flags;表示的是成员变量的修饰符;
  2. u2 name_index;表示的是成员变量的名称;
  3. u2 descriptor_index;表示的是成员变量的描述符;
  4. u2 attributes_count;表示的是成员变量的属性数量;
  5. attribute_info attributes[attributes_count];表示的是成员变量的属性信息;

methods_count(当前类的成员方法数)

u2 methods_count;表示的是当前class中的成员方法个数。

methods[](成员方法数组)

method_info methods[methods_count];表示的是当前class中的所有成员方法,method_info表示的是成员方法对象。

method_info数据结构:

method_info {
   u2 access_flags;
   u2 name_index;
   u2 descriptor_index;
   u2 attributes_count;
   attribute_info attributes[attributes_count];
}

属性结构:

  1. u2 access_flags;表示的是成员方法的修饰符;
  2. u2 name_index;表示的是成员方法的名称;
  3. u2 descriptor_index;表示的是成员方法的描述符;
  4. u2 attributes_count;表示的是成员方法的属性数量;
  5. attribute_info attributes[attributes_count];表示的是成员方法的属性信息;

attributes_count (当前类的属性数)

u2 attributes_count;表示当前class文件属性表的成员个数。

attributes[](属性数组)

attribute_info attributes[attributes_count];表示的是当前class文件的所有属性,attribute_info是一个非常复杂的数据结构,存储着各种属性信息。

attribute_info数据结构:

attribute_info {
   u2 attribute_name_index;
   u4 attribute_length;
   u1 info[attribute_length];
}

u2 attribute_name_index;表示的是属性名称索引,读取attribute_name_index值所在常量池中的名称可以得到属性名称。

Java15属性表:

属性名称 章节
ConstantValue Attribute §4.7.2
Code Attribute §4.7.3
StackMapTable Attribute §4.7.4
Exceptions Attribute §4.7.5
InnerClasses Attribute §4.7.6
EnclosingMethod Attribute §4.7.7
Synthetic Attribute §4.7.8
Signature Attribute §4.7.9
SourceFile Attribute §4.7.10
SourceDebugExtension Attribute §4.7.11
LineNumberTable Attribute §4.7.12
LocalVariableTable Attribute §4.7.13
LocalVariableTypeTable Attribute §4.7.14
Deprecated Attribute §4.7.15
RuntimeVisibleAnnotations Attribute §4.7.16
RuntimeInvisibleAnnotations Attribute §4.7.17
RuntimeVisibleParameterAnnotations Attribute §4.7.18
RuntimeInvisibleParameterAnnotations Attribute §4.7.19
RuntimeVisibleTypeAnnotations Attribute §4.7.20
RuntimeInvisibleTypeAnnotations Attribute §4.7.21
AnnotationDefault Attribute §4.7.22
BootstrapMethods Attribute §4.7.23
MethodParameters Attribute §4.7.24
Module Attribute §4.7.25
ModulePackages Attribute §4.7.26
ModuleMainClass Attribute §4.7.27
NestHost Attribute §4.7.28
NestMembers Attribute §4.7.29

属性对象

属性表是动态的,新的JDK版本可能会添加新的属性值。每一种属性的数据结构都不相同,所以读取到属性名称后还需要根据属性的类型解析不同属性表中的值。比如Code Attribute中存储了类方法的异常表、字节码指令集、属性信息等重要信息。

results matching ""

    No results matching ""