由JDK7u21反序列化漏洞引起的对TemplatesImpl的深入学习
文章首发于安全客:https://www.anquanke.com/post/id/247044
最近在分析JDK7u21反序列化漏洞,对命令执行载体com.sun.org.apache.xalan.internal.xsltc.trax.TemplatesImpl
的利用点不太明白。除了JDK7u21,TemplatesImpl
在很多反序列化漏洞中都被利用了,所以想要深入探究下它到底是做什么用的,有什么特性被利用。接下来本文将从这两个问题进行探索学习。
一、了解TemplatesImpl
1、XSLT
在开始前首先了解下XSLT:
- XSL 指扩展样式表语言(EXtensible Stylesheet Language), 它是一个 XML 文档的样式表语言,类似CSS之于HTML;
- XSLT(Extensible Stylesheet Language Transformations)是XSL转换语言,它是XSL的一部分,用于转换 XML 文档,可将一种 XML 文档转换为另外一种 XML 文档,如XHTML;
简化版XSLT实例:
我们从一个例子来了解下XSLT,将XML转为HTML格式展示。
XML:cdcatalog.xml,保存了文章数据包括文章标题、作者等。
1 |
|
XSL:cdcatalog.xsl
XSL 样式表的根元素是 <xsl:stylesheet>
或 <xsl:transform>
;<xsl:output>
元素定义了输出文档的格式;
XSL 样式表由一个或多个被称为模板(template)的规则组成,xsl:template 元素用于构建模板。
1 |
|
转换结果如下,读取xml的元素并展示为html格式:
Title | Artist |
---|---|
Empire Burlesque | Bob Dylan |
Hide your heart | Bonnie Tyler |
2、javax.xml.transform.Templates
TemplatesImpl实现了javax.xml.transform.Templates
接口,javax.xml.transform
属于JAXP(Java API for XMLProcessing,提供解析和验证XML文档的能力),是一个处理XSL转换(XSLT)的包,定义了用于处理转换指令以及执行从源到结果的转换的API。javax.xml.transform.Templates
是用来处理XSLT模板的,它只定义了两个方法:
Modifier and Type | Method and Description |
---|---|
Properties |
getOutputProperties() 获取xsl:output元素相对应的属性。 |
Transformer |
newTransformer() 为此Templates对象创建一个新的转换上下文。 |
3、XSLTC和Translets
TemplatesImpl在com.sun.org.apache.xalan.internal.xsltc
包下,xalan是Apache的一个项目,是XSLT处理器。
XSLTC指xslt compiler或xslt compiling,可以把XSLT文件编译成一个或者多个Java的class文件,通过这种方式可以加速xsl的转换速度。这些class或者class的集合被称为Translets,他们被转换时自动会继承AbstractTranslet。
利用Xalan命令行工具(注意使用jdk1.8以前版本)将XSLT文件转为class:
1 | java com.sun.org.apache.xalan.internal.xsltc.cmdline.Compile cdcatalog.xsl |
执行命令后会在文件夹下生成一个class文件:
4、TemplatesImpl类解读
TemplatesImpl主要是通过获取Translet的Class或字节码来创建 XSLTC 模板对象。根据上面第3点的学习这里不难理解,XSLTC生成的Translets,需要转为模板对象,可以用TemplatesImpl定义和处理。
1 | public final class TemplatesImpl implements Templates, Serializable |
4.1、静态内部类TransletClassLoader:
TemplatesImpl通过获取Translet的Class或字节码来创建 XSLTC 模板对象,需要在运行时加载class,因此其在内部自定义了一个静态类TransletClassLoader用来加载Translet的Class对象,并且重载了loadClass和defineClass方法。
我们知道ClassLoader的loadClass通过一个类名全称返回一个Class类的实例;
而defineClass通过接收一组字节,然后将其具体化为一个Class类的实例,它一般从磁盘上加载一个文件,然后将文件的字节码传递给JVM,通过JVM(native 方法)对于Class的定义将其实例化为一个Class类的实例。
1 | static final class TransletClassLoader extends ClassLoader { |
4.2、属性说明:
修饰及类型 | 属性名、属性值及说明 |
---|---|
public final static String | DESERIALIZE_TRANSLET = “jdk.xml.enableTemplatesImplDeserialization”; |
private static String | ABSTRACT_TRANSLET = “com.sun.org.apache.xalan.internal.xsltc.runtime.AbstractTranslet”; 所有translets的超类名。这里的Translet类都需要继承AbstractTranslet |
private String | _name = null; 主类的名称或默认名称(如果未知) |
private byte[][] | _bytecodes = null 包含Translet类和任何辅助类的实际类定义的字节码 |
private Class[] | _class = null 包含Translet类定义。这些是在创建模板或从磁盘读取模板时创建的 |
private int | _transletIndex = -1 主Translet类在数组_class[]和_bytecodes中的索引 |
private transient Map<String, Class<?>> | _auxClasses = null 包含辅助类定义的列表 |
private Properties | _outputProperties translet的output属性 |
private int | _indentNumber 要为输出缩进添加的空格数 |
private transient URIResolver | _uriResolver = null URIResolver被传递给所有的transformer |
private transient | ThreadLocal _sdom = new ThreadLocal(); |
private transient | TransformerFactoryImpl _tfactory = null 该模板对象所属的TransformerFactory的引用 |
private transient boolean | _overrideDefaultParser 确定系统默认解析器是否可以被重写的标志 |
private transient String | _accessExternalStylesheet = XalanConstants.EXTERNAL_ACCESS_DEFAULT 协议允许样式表处理指令、Import和Include元素设置外部引用 |
4.3、构造方法解析:
TemplatesImpl提供了两个有参构造方法都是protected,如果TemplatesImpl要实例化,需要通过内部方法进行调用。
构造方法1:通过字节码创建template对象,必须提供translet和辅助类的字节码,以及主translet类的名称。
1 | protected TemplatesImpl(byte[][] bytecodes, String transletName, Properties outputProperties, int indentNumber, TransformerFactoryImpl tfactory) |
构造方法2:通过translet类创建XSLTC模板对象。
1 | protected TemplatesImpl(Class[] transletClasses, String transletName, Properties outputProperties, int indentNumber, TransformerFactoryImpl tfactory) |
4.4、Templates接口方法实现:
首先是Templates接口的两个方法:newTransformer和getOutputProperties,newTransformer会调用TransformerImpl有参构造方法。
1 | // 实现JAXP's Templates.newTransformer() |
4.5、方法说明:
修饰 | 方法 |
---|---|
private void | defineTransletClasses():定义Translet类和辅助类。 |
java.util.Properties | getOutputProperties():实现了JAXP的Templates.getOutputProperties()。 |
DOM | getStylesheetDOM():返回样式表DOM的线程本地副本。 |
byte[][] | getTransletBytecodes(): 返回Translet字节码 |
java.lang.Class[] | getTransletClasses():返回Translet字节码 |
int | getTransletIndex(): 返回主类在字节码数组中的索引 |
private Translet | getTransletInstance():生成Translet类的实例。 |
protected java.lang.String | getTransletName():返回Translet主类的名称 |
javax.xml.transform.Transformer | newTransformer():实现了JAXP的Templates.newTransformer () |
private void | readObject(java.io.ObjectInputStream is):重写readObject |
void | setStylesheetDOM(DOM sdom):设置样式表DOM的线程本地副本 |
protected void | setTransletBytecodes(byte[][] bytecodes):获取TransformerFactory设置的Translet字节码并创建Translet实例。 |
protected void | setTransletName(java.lang.String name):TransformerFactory调用此方法来设置Translet名称 |
void | setURIResolver(javax.xml.transform.URIResolver resolver):设置Transformer所需的URIResolver。 |
private void | writeObject(java.io.ObjectOutputStream os):实现了URIResolver和Serializable的类将被序列化 |
5、XML-XSLT-HTML在Java中的转换实例
接下来我们看一个XML-XSLT-HTML的常规转换例子,通过这个例子我们可以知道转换在Java中实现的步骤。
1 | import javax.xml.transform.*; |
执行上面代码最终会在文件夹下生成一个1.html文件,1.html跟上述第一部分的示例转换结果一致。
通过上面代码,我们可以总结出一个XML-XSLT-HTML的转换在Java中一般有以下4个步骤:
- 创建一个TransformFactory对象;
- 调用TransformFactory.newTemplates通过XSL样式表创建一个Templates对象;
- 调用Templates.newTransformer创建一个Transformer对象;
- 最后通过Transformer.transform将源-XML文档转换为目标-HTML文档。
其中需要注意的是以上接口的缺省实现都是Xalan提供的com.sun.org.apache.xalan库内对应的实现类来创建对象。
TransformFactory.newTemplates通过XSL样式表创建一个Templates对象,其实现主要由三个部分:
- 如果_useClasspath属性为true,则尝试从CLASSPATH加载文件,并使用XSL样式表文件加载后的Class创建模板对象:调用new TemplatesImpl(new Class[]{clazz}, transletName, null, _indentNumber, this);
- 如果_autoTranslet为true,将尝试在不编译样式表的情况下从translet类加载字节码来创建对象;
- 以上两种条件不满足,直接创建并初始化样式表编译器来编译样式表,生成字节码,通过字节码创建模板对象。
二、TemplatesImpl被反序列化漏洞利用的特性
清楚了TemplatesImpl的方法和使用方式,接下来这部分我们探索下它跟反序列化漏洞的关系。
1、JDK7u21的TemplatesImpl利用测试
我们将JDK7u21分析poc的return templates;
改为templates.newTransformer()
进行测试。
1 | public void testTemplate() throws Exception { |
调用上述testTemplate方法,最终会弹出计算器:
为什么能够执行Runtime.getRuntime().exec(\"calc\")
,关键点在于第3步templates.newTransformer();
,接下来重点分析下。
2、newTransformer()
分析:
2.1、newTransformer
根据4.4我们知道newTransformer()会调用TransformerImpl构造函数创建实例:new TransformerImpl(getTransletInstance(), _outputProperties, _indentNumber, _tfactory)
,getTransletInstance()会返回Translet类的实例;
2.2、getTransletInstance
getTransletInstance在一开始时对_name和_class实现进行了判断,当_name不为null而_class是null就会调用defineTransletClasses来获取Translet的Class对象,接着会调用newInstance实例化Translet。
1 | //如果_name属性为null返回Translet是null |
2.3、defineTransletClasses:
defineTransletClasses用来定义translet类和辅助类,会创建一个内部类TransletClassLoader的对象,通过该对象调用defineClass,根据之前4.1的分析我们知道defineClass会调用Java虚拟机的native方法生成一个Translet类的Class对象。所以到这里我们最终能够获取到Evil字节码生成的Class对象,再经过2.2AbstractTranslet translet = (AbstractTranslet) _class[_transletIndex].newInstance()
对Evil类进行实例化,最终能够执行命令弹出计算器。以下是defineTransletClasses的关键代码摘取:
1 | // 字节码未定义抛出异常 |
2.4、小结
通过前面3步的分析,执行恶意代码需要两个条件:一是调用defineTransletClasses获取Evil的Class对象,二是将Class对象实例化调用构造方法。
另外我们也能明白上面的属性为什么要被这样赋值:
_bytecodes
被赋值为我们定义的恶意类的字节码,该类需要继承com.sun.org.apache.xalan.internal.xsltc.runtime.AbstractTranslet
(对应2.3的代码分析)_class
必须为null(对应2.2的分析)_name
必须不为null(对应2.2的分析)_tfactory
必须是TransformerFactoryImpl实例(对应2.3的代码分析)
3、由newTransformer()
进行拓展
阅读wEik1的分析后发现还可以拓展:
既然只要调用defineTransletClasses就能获取指定字节码定义的类的对象,那我们可以在TemplatesImpl类通过搜索寻找有没有其它方法调用defineTransletClasses。搜索后发现一共有3个方法(包括getTransletInstance)调用defineTransletClasses:
1 | private Translet getTransletInstance() |
经过第2.4小结我们可以排除getTransletIndex和getTransletClasses,因为它们仅调用了getTransletInstance并没有进行实例化。那我们将目光聚集在getTransletInstance,它在内部除了被newTransformer()调用,也没有其它直接被调用的情况了,因此也被排除。本来到这里应该结束了,但我们不能忽略一点-newTransformer的调用,可以考虑通过newTransformer的调用来进行利用。newTransformer在内部有被getOutputProperties调用,getOutputProperties是public方法,并且getOutputProperties在内部不再被调用,因此总结下来共2个链可以实现恶意类的实例化:
1 | newTransformer()->getTransletInstance()->defineTransletClasses() |
三、总结与思考
通过本次学习我们了解了com.sun.org.apache.xalan.internal.xsltc.trax.TemplatesImpl
本身是用来进行xsl转换的,主要通过XSLTC接收xsl文档生成的Translets类的字节码来创建 XSLTC 模板对象。那么由于需要处理字节码,其在内部定义了类加载器并重载了defineClass,defineClass能够返回字节码的Class对象方便后续的实例化,而这也是我们能够利用它执行恶意代码的关键。
通过构造恶意类的字节码并使用defineClass返回其Class对象,实例化后即可执行我们想要的结果。继续思考,我们可以想到Java是否还存在类似的类(内部定义了类加载器并重载了defineClass)能被我们利用,这里不展开了可自行探索。
参考链接:
https://xalan.apache.org/xalan-j/apidocs/org/apache/xalan/xsltc/trax/TemplatesImpl.html
https://www.runoob.com/xsl/xsl-transformation.html
https://docs.oracle.com/javase/7/docs/api/javax/xml/transform/Templates.html
https://blog.weik1.top/2021/01/15/TemplatesImpl%E5%88%A9%E7%94%A8%E9%93%BE/
http://terpconnect.umd.edu/~zhangx/xml/html/xmlprog/xalan/xsltc.html
https://blog.csdn.net/z_dy1/article/details/104427617