SAX解析器是通过回调的方式来执行XML的解析工作的。对于基本的解析操作还是比较简单的,就是实现SAX2.0定义的四个核心接口,并注册进解析器即可。具体的操作都在四个接口中的回调方法中。所谓回调,我理解它与.Net中的事件类似。
这四个核心接口是为:
org.xml.sax.ContentHander
org.xml.sax.ErrorHandler
org.xml.sax.DTDHandler
org.xml.sax.EntityResolver
对应的注册进解析器的方法分别是
parser.setContentHandler(ContentHander handler)
parser.setErrorHandler(ErrorHandler handler)
parser.setDTDHandler(DTDHandler handler)
parser.setEntityResolver(EntityResolver handler)
分别看一下这几个核心接口中的回调方法:
1. ContentHandler
//除setDocumentLocator()外,其他回调方法均抛出SAXException。
public interface ContentHandler{
/*Locator中有用方法如getLineNumber(),getColumnNumber()等,所以可以考虑把locator作为ContentHandler实现类的实例变量,然后传播到其他回调方法。*/
public void setDocumentLocator(Locator locator);
/*startDocument()是开始解析后第一个被调用的方法,endDocument()是最后一个。回调方法没有参数可以使用。*/
public void startDocument();
public void endDocument();
/*当解析器到达前缀影射的开头和结尾时,分别回调这两个方法。如ora:copyright,其中ora为前缀(prefix), 整个ora:copyright为URI*/
public void startPrefixMapping(String prefix, String uri);
public void endPrefexMapping(String prefix);
/*当解析器到达一个Element和结束时,分别回调这两个方法。关于参数:namespaceURI,localName,qName表示Element名字的各个部分,atts表示该Element的所有属性的引用。*/
public void startElement(String namespaceURI,
String localName, String qName, Attribute atts);
public void endElement(String namespaceURI,
String localName, String qName);
/*对于<Book>XML Instroduction<Book>,当解析器解析完文本内容后,回调此方法。一般来说我们可以通过三个参数构造一个String对象来使用。如:
String text= new String(ch,start,length)*/
public void characters(char ch[], int start, int length);
/*忽略空白后回调此方法*/
public void ignorableWhitespace(char ch[],
int start, int length);
/*处理指令*/
public void processingInstruction(String target,String data);
/*一般不会用到,因为大部分解析器是不会跳过实体的。暂且不用管它*/
pubilc void skippedEntity(String name);
}
2. ErrorHandler
/*故名思义,解析过程中分别是出现警告,错误,致命错误时,回调这三个方法。SAXParserException中包含错误信息和行号。*/
public interface ErrorHandler{
public void warning(SAXParseException ex) throw SAXException;
public void error(SAXParseException ex) throw SAXException;
public void fatalError(SAXParseException ex) throw SAXException;
}
3. DTDHandler
基本用不上,不做详细讨论了。
public interface DTDHandler{
public void notationDecl(String name, String publicID,
String systemID) throw SAXException;
pulic void unparserdEntityDecl(String name, String publicID,
String systemID, String notationName)
throw SAXException
}
4. EntityResolver
用于解析实体的,只有一个回调方法。
public interface EntityResolver{
/*如果返回值是null,解析的执行过程就不会改变。否则将开始执行返回的被引用的内容XML。*/
public InputSource resolveEntity(String publicID,
String systemID) throw SAXException
}
解析编码例子:
String parserClass = "org.apache.xerces.parsers.SAXParser";
//如果采用的不是Xerces解析器,只需要更改“parserClass”的值即可。
XMLReader reader=XMLReaderFactory.createXMLReader(parserClass);
//注册ContentHandler
reader.setContentHander(new ContentHandlerImpl());
//注册ErrorHandler
reader.setErrorHandler(new ErrorHandlerImpl());
//注册DTDHandler
//注册EntityResolver
//开始解析XML
URI xmlURI = new URI("xml file address");
InputSource src = new InputSource(xmlURI);
reader.parser(src);
---------几个需要注意的地方---------
1.解析器不支持SAX2.0怎么办?
采用ParserAdapter辅助类来使SAX1.0解析器像SAX2.0那样工作,唯一缺憾就是不能报告那些被忽略的实体,对大多数应用来说这也不所谓。
String parserClass = "org.apache.xerces.parsers.SAXParser";
Parser parser=ParserFactory.makeParser(parserClass);
ParserAdpter myParser=new ParserAdpter(parser);
myParser.setContentHandler(new ContentHandlerImpl());
myParser.setErrorHandler(new ErrorHanlderImpl());
myParser.parser(xmlUri);
2.XMLReader不能同时解析多个XML
一旦XMLReader开始解析一个XML,在解析过程中如果试图再使用阅读器,就会得到SAXException,如果需要同时解析多个XML,只能顺序一个一个解析。或者声明多个XMLReader实例。
3.characters()中的注意
public void characters(char[] ch, int start, int length){
//容易出现Bug的使用方法
for(int i=0; i<ch.length; i++){
System.out.pringln(ch[i])
}
//不会出现问题的使用方法
String str= new String(ch,start,length);
}
分享到:
相关推荐
xml
saxy:Elixir中的一种快速,易于使用且符合XML 1.0的XML SAX解析器
NULL 博文链接:https://lujo20121128.iteye.com/blog/1736765
FlickrPhotoSearch Flickr照片搜索使用Flickr API来根据搜索词搜索照片。 如果开关为OFF,则使用XML SAX解析器,当开关为ON时,使用XML PULL解析器。
JDK自带xml解析器dom+sax JDK自带xml解析器dom+sax JDK自带xml解析器dom+sax
虽然SAX(Simple API for XML)解析器是解析XML十分方便的工具,但开发和维护SAX解析器是十分困难的,本文会告诉你如何使用XML Schemas中的信息来生成一个SAX解析器的框架源码,并且完成解析xml的技术
利用JSP直接读写XML文件,分别用DOM解析器和SAX解析器加以实现,非常适合初学者入门,作为一个了解jsp与XML的台阶
XML文件解析器 支持dom解析和sax模式解析,c语言实现
XML程序设计第7章SAX解析器
SAX是一个解析速度快并且占用内存少的xml解析器,非常适合用于Android等移动设备。 SAX解析XML文件采用的是事件驱动,也就是说,它并不需要解析完整个文档,在按内容顺序解析文档的过程中,SAX会判断当前读到的字符...
webservice远程调用,返回String数据并生成xml文件到本地工程,在通过SAX解析器把数据解析出来。这是webservice应用的一个简单的例子。根据该例子的思想,可以实现很多功能了。例如把client工程的sayHello方法改为...
XML的四种解析器(dom,sax,jdom,dom4j)原理及性能比较,超详细XML的四种解析器原理及性能比较,超详细
不同于SAX和DOM的XML高效解析器,内存占用少,速度快,支持XPATH;用多种语言实现,C,JAVA等
一个实现SAX的解析器(也就是“SAX Parser”)以一个串流解析器的型式作用,拥有事件驱动API。由使用者定义回调函数,解析时,若发生事件的话会被调用。SAX事件包括: XML 文字 节点 XML 元素 节点 XML 虚理指令 ...
编写DOM解析器解析ipo.xml文件,查询有多少不同“comp_name”属性,按不同属性生成多个xml文件。 编写SAX解析器解析ipo.xml文件,输出所有有属性的元素
xml文件被Sax解析器载入,由于Sax解析是按照xml文件的顺序来解析,当读入<?xml.....>时,会调用startDocument()方法,当读入的时候,由于它是个ElementNode,所以会调用startElement(String uri, String local...
在Android中,常见的XML解析器分别为SAX解析器、DOM解析器和PULL解析器. 这里的源代码介绍的是Android XML解析之SAX方式
利用SAX解析XML文档牵涉到两个部分:解析器和事件处理器。 解析器负责读取XML文档,并向事件处理器发送事件,如元素开始跟元素结束事件; 而事件处理器则负责对事件作出相应,对传递的XML数据进行处理。 1、对大型文件...
得到xml文件对应的资源,可以是xml的输入流,文件和uri 得到SAX解析工厂(SAXParserFactory) 由解析工厂生产一个SAX解析器(SAXParser) 传入输入流和handler给解析器,调用parse()解析防止解析文件过大ooc溢出
下载xml文件在本地,然后用SaxHandler解析器进行解析数据,然后在界面显示。。