众所周知,TEI定义了数据结构,数据类型甚至是数据属性,因此这里简单的介绍一下TEI文件的基本结构,及<TEI>和<teiCorpus>的区别。
这里TEI的版本为P5。
其中有两种类型,一个是以TEI为根目录的TEI文件,如下:
<TEI xmlns="http://www.tei-c.org/ns/1.0"> <teiHeader> <!-- [ TEI Header信息 ] --> </teiHeader> <text> <front> <!-- [ front块 ] --> </front> <body> <!-- [ 文本主体 ] --> </body> <back> <!-- [ back块 ] --> </back> </text> </TEI>
其中属于可选项
第二种就是以teiCorpus为根目录的TEI文件,如下:
<teiCorpus xmlns="http://www.tei-c.org/ns/1.0"> <teiHeader> <!--[header information for the corpus]--> </teiHeader> <TEI> <teiHeader> <!--[header information for first text]--> </teiHeader> <text> <!--[first text in corpus]--> </text> </TEI> <TEI> <teiHeader> <!--[header information for second text]--> </teiHeader> <text> <!--[second text in corpus]--> </text> </TEI> </teiCorpus>
<TEI>为根目录的文件里,总共包括了:
<teiHeader>,提供了一些描述,文本中使用标签的声明等等
<text>,包括了任何一个种类的文本
<teiCorpus>为根目录的文件里,包括了:
<teiHeader>,提供了一些描述,文本中使用标签的声明等等
数个<TEI>,每个包括上面提及的标签。