Hindawi XML语料库
为了促进利用Hindawi的数据挖掘目的的内容,所以Hindawi将其完整的XML内容具有可用于单个.zip文件的XML内容。这个.zip文件是使用双级文件夹结构组织的,首先是发布年份,然后按Journal组织。例如,名为“2011”的文件夹包含用于在2011年拥有一个或多个已发布文章的任何日志的子文件夹,并且在这些文件夹中的每个文件夹中都是这些文章的单独XML文件。此外,下载的.zip文件包含一个名为contents.xml的XML文件,它提供了主.zip文件中存在的所有子文件夹的概述。
此.zip文件的内容是每天更新,而本语料库中包含的XML文件下载遵循JAT 1.1 DTD。如果您对HINDAWI的XML语料库下载有疑必威2490问,请联系HELV@hindawi.com。
下载Hindawi语料库