人机交互研究进展

PDF
人机交互研究进展/2020/文章

研究文章|开放获取

体积 2020 |文章的ID 8856843 | https://doi.org/10.1155/2020/8856843

Ameerah Alothman, AbdulMalik Alsalman 基于依赖语法的阿拉伯语语法审计器”,人机交互研究进展 卷。2020 文章的ID8856843 10 页面 2020 https://doi.org/10.1155/2020/8856843

基于依赖语法的阿拉伯语语法审计器

学术编辑器:弗朗西斯科·征求
收到了 10 Jun 2020
修改后的 9月30日2020
接受 10月30日
发表 12月7日2020

摘要

阿拉伯语有许多复杂的语法规则,对普通用户或学习者来说可能很复杂。语法自动检查系统可以提高文本质量,降低校对过程的成本,在语法教学中起到一定的作用。本文提出了一个旨在开发一种新颖和全面的阿拉伯语审计员,可以解决元音文本。我们称之为“阿拉伯语法检测器”(AGD短-أَجِــدْ)。基于依赖语法和决策树分类器模型成功地实现了AGD。它的目的是从投影依赖图中提取语法规则的模式,以便指定句子的适当语法依赖。目前的实现几乎涵盖了非元音文本以及部分或全部元音文本的所有常规阿拉伯语法规则。使用Tashkeela语料库评估AGD。它可以检测出94%以上的语法错误,并提示错误的原因和可能的纠正。

1.简介

与所有语言一样,阿拉伯语及其应用的研究人员为在语言处理方面取得进展付出了艰苦的努力。这些努力集中在多个层面,包括形态学[12],主要研究词语的结构、句法[3.4]、单词的语法安排和语义[56],它决定了文本的确切含义。问题回答、语法检测和纠正、机器翻译和自动摘要都是依赖于这些级别过程的应用类型。其中一些应用程序非常重要,是许多自然语言处理(NLP)应用程序(如拼写和语法审计系统)的基础。

目前在阿拉伯语语法检测和纠正方面的研究还很缺乏。这是由于阿拉伯语的特定特征,例如其语义层面的复杂性和丰富性,这可能导致歧义,产生错误和难以理解的文本。此外,句子中单词的灵活排列、凝集特性和变音符使阿拉伯语法变得复杂。所有这些特性导致了形态、语法和语义层面上的各种问题。此外,在这一领域缺乏研究的一个重要原因是阿拉伯语形态层面的基础设施不完整。这导致在更高层次,即句法和语义的研究上缺乏突破。重点仍然放在形态学层面的研究,如拼写检查和正确的单词分析。

在这里,我们试图通过实现一个全面的监督学习系统来弥补研究差距,该系统用于检测变音符和非变音符阿拉伯文本中的语法错误,并提示其原因和纠正。本研究采用的阿拉伯语语法规则的依赖语法,使我们能够解析阿拉伯语结构图,根据单词的属性推断出句子正确的语法规则模式,这些属性是通过形态分析仪提取出来的。就监督学习而言,决策树学习算法的部分任务包括学习如何根据文本的语法解析状态(正确-不正确)对文本的单词进行分类。这项工作被认为是第一个将阿拉伯语依赖语法规则自动化的倡议。据我们所知,AGD是第一个处理阿拉伯语变音符文本的阿拉伯语语法审计系统。

本文的其余部分结构如下。部分2介绍文献综述,章节3.演示依赖语法,和节4描述我们系统中采用的语法规则。部分5提供所使用的语法依赖项和分类模型的演示。部分6提出了一个评价所提出的系统。最后,部分7最后对本文的研究方向进行了展望。

2.文献综述

有许多专门的研究用于审计特定语言的语法,例如英语[7- - - - - -16],欧洲语言[17- - - - - -23],以及亚洲语言[24- - - - - -29].此外,还有许多著名的语法检查工具,如Grammarly [30.], LanguageTool [31]和ClearEdits [32].然而,没有一个国家支持阿拉伯语,而阿拉伯语是联合国六种正式语言之一。据我们所知,目前还没有可用的阿拉伯语语法检查器[33].

从研究的角度来看,据我们所知,只有三项研究涉及阿拉伯语语法审计。第一次是由Shaalan [34他参与开发了第一个阿拉伯语语法检查器,名为阿拉伯语GramCheck。研究分为两个部分:形态分析器和标准的自底向上解析器。作者从个人数据的角度对该系统进行了评价。不幸的是,这个检查器不再可用。

第二项关于阿拉伯语语法检查器的研究由Moukrim等人提出。[35].显然,他们的系统使用了本体论中描述的阿拉伯语法[36来生成约束条件和句子规则。他们的研究基于两个假设。首先,可以从本体中生成所有可能的句子,其次,可以将生成的所有正确的句子与原句子进行比较。这项工作已作了一些改进,如[37],使用斯坦福解析器对输入的句子进行分段和注释。然后,他们采用了与[]中提到的相同的两个假设。35来检测语法错误。研究人员忽略了阿拉伯语中的大多数语法错误,只评估了非元音文本中的四种简单类型的错误。这些错误包括五个名词的结尾标记(الأسماءالخمسة),形容词、副词的句法依赖关系及其与名词的排列。语法检查仅使用了100个句子,对四种错误的准确率为94.28%。

最后,Madi和Al-Khalifa最近的初步工作[38]研究了如何使用深度学习来检测阿拉伯语中的语法错误。他们使用卡塔尔阿拉伯语银行(QALB)的语料库进行培训和评估阶段。这项研究的结果还没有发表。

3.依赖语法(DG)

语言研究的任务之一是在特定的形式主义和语法中为每个句子确定正确的语法语法。39].因此,形式主义意味着语言的正确结构约束。然而,英语的语法由两部分组成。首先是选区语法(النحوالمكوناتي),它使用上下文无关语法(CFG)直接根据句子的组成部分来解析句子。其次是依赖语法(النحوالعلائقي),它根据单词之间的句法关系来处理句子[36].

DG通常属于专注于单词而不是组成部分的语法类。主要建立在成分上的语法被称为短语结构语法。因此,短语结构语法是基于成分的,而dg是基于单词的。与短语结构语法不同,短语结构语法将句子和从句按照成分进行结构,dgg假设句子和从句的结构来自单词之间的依赖关系[4041].从图形上看,依赖语法将句子结构描述为树,其中节点表示单词,边表示依赖关系。而在选区语法中,上下文无关语法的终结符和非终结符分别用叶节点和内部节点表示,如图所示1

自然语言依赖表示灵活而简单;它们使用定向图形来编码单词及其语法依赖关系。数字2说明了“男孩早上读书”这句话的依赖关系图的一个例子-الولد الكتاب صباحا يقرأ。该图的边表示从单词指向其修饰语的唯一语法依赖项。在这个描述中,所有边都用依赖项的特定语法函数标记——例如,sub表示主语,obj表示动词的对象。为了使编程计算和一些重要的定义更容易,在句子中插入一个虚拟标记作为最右边的单词。因此,它将始终是依赖关系图的根。

依赖图是嵌套图或投影图的一个例子。假设图的根是句子中最右边的单词(阿拉伯语是从右向左书写的),投影图是一种边可以在句子上方的平面上画而不交叉的图,如图所示2.同时,非投影依赖图不能满足这个性质[42].“男孩正在教室里读书”这句话的一个非投影图的例子早上好”-الولد يقرأ الكتاب صباحا-is如图所示3..长距离依赖,或对词序灵活的语言的依赖,是非投射性的原因。在某些语言中,句子的一个重要部分需要进行非投射依赖分析。因此,学习和推导非投影依赖关系图的能力是解决某些问题的必要步骤——例如,语言或排列案例的多语言处理(حالات التقديم والتأخير)用阿拉伯语。

一些研究[4344)假设了另一种语法类型,称为链接语法,作为第三种语法形式主义。据我们所知,链接语法和依赖语法的主要区别在于前者必须有一个算法来演示如何链接单词,而后者则采用依赖原理来链接两个或多个单词。

4.语法规则

本节介绍了语法规则,以及如何用我们的系统输出正确的语法结尾。据我们所知,没有工作可以自动化阿拉伯语语法规则,除了由لمالكي36),它有很多限制。因此,我们的工作试图构建阿拉伯语语法规则作为一个从属语法,基于语法规则定义的标准متنالآجرومية它的解释是العثيمين45],这本书被认为是阿拉伯语语法的基本参考。这些语法规则是按层次排列的,以最通用和最依赖的属性为基础。每个规则都有自己的属性和约束。一旦可以完全实现头部(当前单词)及其依赖项(以前的单词)之间的这些属性和约束,就可以使用层次结构中较低的规则。例如,头可以是名词、动词或粒子。名词又分为主语和起始规则,依此类推。我们语法规则的完整层次结构如图所示4

这个层次结构总共包含30条主要的语法规则,其中一些规则有一个或多个子规则。在任何时候,层次结构的主干都可以进行扩展(通过添加子规则),以包括旨在促进和改进某些应用程序中的使用的几个扩展和增强。

5.语法依赖关系和分类模型

在任何句子中,两个或多个单词(依赖)与一个单词(头)之间的关系称为语法依赖。我们生成语法依赖关系的技术主要基于应用于句子结构图的语法规则模式,目的是构建决策树分类器模型。尽管这种方法是通用的,但它需要针对每种语言和树库表示的相关规则。验证正确语法语法依赖关系的方法——以检查是否结束标记(العلامةالإعرابية)是正确的—由三个阶段组成:依赖项提取、依赖项综合和谓词(正确的结束标记)。数字5说明了这些阶段。

依赖项提取阶段非常简单。首先,用形态分析仪分析句子。形态分析器通过单词所经历的一系列形态过程来识别特定单词的属性,包括指定单词单位,以及这些单位如何与组成单词的整体相关,这些单位在特定单词中的功能,以及它在句子中的句法和语义行为。在我们的例子中,任何形态分析仪都可以使用,但在实践中,我们使用了MADAMIRA [46],由Penn Arabic Treebank (PATB)开发。MADAMIRA提供了高质量的阿拉伯语表达的单词级消歧,并提供了句子结构的高精度统计分析。有关使用MADAMIRA的形态学步骤的更多必威2490信息,请参见[47].其次,确定一个根,以找到句子中正确的依赖项。在这个版本的作品中,采用了投影依赖图,这意味着一个单词及其后代组成了一个连续的句子子串。因此,我们假设依赖图的根是句子最右边的正确单词。这足以表示大多数阿拉伯语法规则,除了奇怪的排列情况。阿拉伯语在词序方面非常灵活。这些不同的词序导致了许多排列的情况。在这些情况下,根的位置是改变的;不能假定它在句子的最右边。例如,在图中3.,主题(“the男孩”——الولد)在动词之前(出现在阿拉伯语句子中)(“读”-يقرأ),这在阿拉伯语中是有效的语法。在这种情况下,如果我们把主语看作句子的根,就会导致错误的结果。

完成此阶段后,词级处理就完成了,下一阶段将转到句子级处理。

在第二个阶段,依赖项综合,我们将每个提取的依赖项与一个语法规则相关联(在图中的层次结构中列出)4),尽可能精确地指定它以推断正确的语法依赖项。依赖关系是灵活的,以适应阿拉伯语中的任何句子的语法。一旦每个语法规则被提取出来,我们根据句子结构定义一个或多个投射依赖图。从概念上讲,将测试图中的每个节点是否符合提取的语法规则的属性和约束,并将与最具体的语法规则对应的图视为语法依赖项的类型(或名称)。

在最后阶段,通过到达叶子节点来完成分类模型,叶子节点表示合成阶段产生的特定语法依赖规则的结束标记情况。通过这种方法,可以通过比较输入单词的结束标记和从分类器模型中提取的正确结束标记来推断正确的结束标记,并将错误(如果出现)显示给用户。值得注意的是,检查器将识别语法错误,并告知用户错误的确切原因。因此,为适应这一特点,在每条语法规则中都增加了额外的澄清规则。

因此,如果我们为句子插入一个虚拟根,那么决策树内部节点中的每个单词(节点)都将具有依赖关系。因此,表示中的语法依赖数等于句子中的单词数。在语法审核员中,有必要将助词(如介词和连词)与下一个单词组合成一个单词。

6.评价

在本节中,我们将讨论AGD所获得的结果。评估包括两个阶段:初步评估和插入错误评估。

评估对10篇论文进行了评估,共752个句子。文章选自部分或全部元音化阿拉伯文本的不同集合,取自塔什基拉语料库(https://sourceforge.net/projects/tashkeela/).表格1显示每篇文章的大小,包括它所属的类型。


文章类型 文章# 句子数量

书的文本 S01 51
S04 180
S05 101

新闻文本 S06 72
S07 71
S08 60

一般的文本 S02 49
S03 78
S09 48
S10 42

在评价过程中,为了便于在精度、召回率和精度度量中进行性能计算,我们采用了四个符号:

正确的结果:

TT:这个单词是正确的(True),系统显示它是正确的(True)。

FF:单词不正确(False),系统提示不正确(False)。

不正确的结果:

TF:单词是正确的(True),系统说它是不正确的(False)。

FT:这个词是不正确的(False),系统说它是正确的(True)。

此外,在构建AGD的过程中,由于预处理操作中的错误分析,或者由于语义上的歧义,可能会导致一些错误没有被发现。这些错误不在AGD的框架之内,因为它们发生在语法审计器之前的预处理阶段。我们称这些误差为限制。在此基础上,设置了一些限制,使AGD能够在理想的情况下工作,即假设预处理阶段没有发生错误。这些限制如下:(一)它代表的主语是一个隐藏的代词(الفاعل ضمير مستتر)。通常,主语直接跟在动词后面(在阿拉伯语句子中出现在左侧),但在某些情况下,主语是隐藏的,动词后面的单词是宾语。这种情况只能在语义级检测到。例如,“Mohammad读了书,写了作业”-قرأ محمد الكتاب، وكتب الواجب;第一句中的主语是Mohammad,而在第二句中,它是一个隐藏代词。(B)它表示一个不定数加到不定数上(المضاف إلى نكرة)。阿拉伯语的结构允许将不定词加到定词或不定词后面。AGD可以区分确定词的附加部分(例如“语法”)书”——كتابالنحو),但不是一个不确定的词(例如,“一本语法书”-كتابنحو)。(C)它代表形态分析中的错误。形态分析错误很常见,它们会影响语法结构的正确性——例如,不分析某些单词,或将名词作为动词进行分析,反之亦然(D)它代表了主体的一个奇怪的位置;即,客体先于主体(例如,“穆罕默德读的书”-قرأ الكتاب محمد)或者主语在动词前面(例如,“Mohammad read the book”-محمد قرأ الكتاب)。

表格2显示在测试文章的文本中发现的局限性。我们应该提到,正确确定阿拉伯语语法规则的语法依赖关系取决于准确的形态学分析和句子语义的确定。在AGD中,语义理解(局限性A, B, D)和错误分析(局限性C)分别占总局限性的82.86%和17.14%。


文章# 一个 B C D

S01 6 3. 4 1
S02 11 4 0 0
S03 9 9 8 0
S04 1 3. 7 0
S05 1 5 1 0
S06 6 8 1 4
S07 5 10 1 2
S08 9 7 1 2
S09 0 1 1 0
S10 6 3. 0 0
总计 54 53 24 9

在详细介绍我们的工作成果之前,有几点必须强调,即:(1)评估文本没有拼写错误,因为它们会影响形态过程的准确性,这是语法审核过程之前的一个步骤。(2)我们无法将我们的工作与他人的工作进行比较,因为没有人使用过知名的语料库,也没有人可用来进行测试和比较。(3)塔什基拉语料库包含超过7500万单词。我们的评估旨在衡量我们方法的有效性。因此,我们从文集中随机挑选文章来达到这个目的。语料库包括(全部或部分)元音化文本,以及非元音化文本。

6.1.第一阶段:初步评估

该评估旨在评估AGD在发现和纠正审计过程之前我们不知道的错误方面的能力。为了进行比较,聘请了专门的人力审核员对相同的样本进行审核。这里值得注意的是,人工审计员和AGD审计的结果最终由阿拉伯语语法领域的教授检查,以判断结果是否不同。采取这一步骤是由于阿拉伯语的差异和复杂性。人工审核和AGD审核的结果,以及每篇文章中正确语法审核(GA)的字数,显示在表格中3.而且4


文章# #字 正确的 不正确的 精度 (%)
TT FF 特遣部队 英国《金融时报》

S01 246 243 2 0 1 99.59
S02 277 268 3. 0 6 97.83
S03 622 600 12 5 5 98.39
S04 546 540 0 0 6 98.90
S05 410 405 3. 0 2 99.51
S06 495 494 1 0 0 100.00
S07 528 527 0 0 1 99.81
S08 485 478 3. 1 3. 99.18
S09 227 226 1 0 0 100.00
S10 273 270 1 0 2 99.27
总计 4109 4051 26 6 26 99.22


文章# #字 正确的 不正确的 精度 (%)
TT FF 特遣部队 英国《金融时报》

S01 246 243 1 1 1 99.19
S02 277 268 6 3. 0 98.92
S03 622 607 5 4 6 98.39
S04 546 540 6 0 0 100.00
S05 410 406 2 2 0 99.51
S06 495 491 0 3. 1 99.19
S07 528 518 1 9 0 98.30
S08 485 476 3. 4 2 98.76
S09 227 222 0 5 0 97.80
S10 273 269 2 2 0 99.27
总计 4109 4040 26 33 10 98.95

从表3.而且4当相关的从属关系分开时,出现的语法错误最多;例如,在“男孩早上和老师一起写数学作业,科学和语言”中-كتبالولدواجبالرياضياتمعالمعلمصباحاوالعلومواللغة。在这句话中,科学和语言都与数学有关,它们应该取它的结尾。第二个最常见的错误是确定副词宾语而不是一般名词;例如,在“12月18日国际阿拉伯文日”-18ديسمبر, اليوم العالمي للغة العربية,“天”是一个名词,不是副词宾语。

表格中的混淆矩阵5而且6结果表明,在理想情况下,AGD审计的语法错误有43个,而人工审计的语法错误有32个。大多数人为审计错误是由于对结尾标记的不正确辨别,以及对宾格和正义格的不准确识别造成的。表中的精密度和召回率7结果表明,AGD的召回率较高,但精度较低,这意味着AGD能检测出总误差中的大部分误差,但其预测的误差中有部分是不正确的。相比之下,人工审计检测到总错误中的一半错误,但大多数预测错误都是正确的。


遗传算法正确 不是GA正确

遗传算法 ff = 26 ft = 26
没有遗传算法 tf = 6 tt = 4051


遗传算法正确 不是GA正确

遗传算法 ff = 42 ft = 10
没有遗传算法 tf = 33 tt = 4024


功能 精度 (%) 回忆 (%)

人类的审计 81.25 50.00
AGD短审计 56.00 80.77

6.2.阶段2:插入错误的评估

该评估旨在评估AGD在完全正确的文章中发现插入错误并能够解释其原因的能力。我们从精度和查全率两个方面来衡量AGD的性能。诚然,阿拉伯语中没有可用的语法错误语料库。因此,我们手动在评估文本中插入了许多语法错误(例如,يقرأ الولدُ القرآنَis更改为يقرأ الولدَ القرآنُ)。错误是由不是AGD编程团队成员的人员嵌入的。AGD审核的结果,以及每篇论文中插入错误的数量,如表所示8


文章# 词# #插入错误 正确的 不正确的 精度(%)
TT FF 特遣部队 英国《金融时报》

S01 246 13 232 13 1 0 99.59
S02 277 55 219 51 3. 4 97.47
S03 622 15 603 14 4 1 99.20
S04 546 15 531 15 0 0 100.00
S05 410 29 379 28 2 1 99.27
S06 495 19 473 17 3. 2 98.99
S07 528 20. 499 19 9 1 98.11
S08 485 24 457 21 4 3. 98.56
S09 227 15 207 14 5 1 97.36
S10 273 15 256 15 2 0 99.27
总计 4109 220 3856 207 33 13 98.88

如表所示9而且10,在理想情况下,AGD在220个错误中只有13个错误是不正确的。也就是说,AGD对变音符阿拉伯语文本进行语法纠错的失败率仅为5.91%。这些错误大多集中在描述符后面形容词-名词的精确识别或动词的来源上(الاسم المصدر الذي يعامل معاملة الفعل)它们取代了动词,并根据动词的属性来处理后面的名词,而不是名词。


遗传算法正确 不是GA正确

遗传算法 ff = 207 ft = 13
没有遗传算法 tf = 33 tt = 3856


功能 精度 (%) 回忆 (%)

AGD短审计 86.96 94.42

7.结论

阿拉伯语语法审核员是一个复杂的系统,需要广泛的语言资源和研究,以及该领域专家的帮助。本文提出了一种采用新方法的深度语法审核器。它旨在检测阿拉伯语元音和非元音文本中的语法错误,并提示其原因和纠正。这种方法基于投影依赖图的语法,其规则是从我们构建的语法规则层次结构中提取出来的。简而言之,根据句子单词的特征,对依赖项进行综合,以指定最具体的语法规则模式,并根据决策树分类器模型的结果推断出适当的结束标记。我们使用这种方法取得了令人满意的结果。在现阶段,与人工审计相比,AGD提供了准确的结果。附录给出了AGD的示例演示。

今后我们的研究工作包括三个方面。第一个方面是检测阿拉伯语中与一致相关的错误,比如动词和主语的性别一致,发起词和谓语在数量和性别上的一致。这可以通过扩展我们系统中采用的阿拉伯语语法规则层次结构的主干来实现。第二方面是扩大AGD评估的范围,将其上传到网上供公众使用,并从用户的反馈中受益,以提高AGD系统的性能。第三个方面是通过引入非投影依赖图来处理阿拉伯奇数排列的情况来增强AGD。

附录

数字6显示了AGD演示的截图。它显示了对元音化输入文本的阿拉伯语语法审核。红色文本颜色代码表示语法错误。其他选项卡面板显示形态分析结果。悬停在一个单词上(就像在这里做的一样)الأطفال)显示一个框,其中说明了该单词的错误并对其进行了更正。

数据可用性

用于支持本研究结果的数据可根据要求从通讯作者处获得。

利益冲突

作者宣称他们没有利益冲突。

致谢

作者要感谢沙特国王大学科学研究院长通过DSR研究生研究支持(GSR)的倡议资助和支持这项研究。作者也要感谢伊玛目穆罕默德本沙特大学阿拉伯语法领域的教授Abdullah Alansary,他指导了搜索并在审计过程中提供了帮助。

参考文献

  1. I. a . Al-Sughaiyer和I. a . Al-Kharashi,“阿拉伯形态分析技术:综合调查”美国信息科学与技术学会杂志,第55卷,no。3,页189-213,2004。视图:出版商的网站|谷歌学者
  2. a . Alothman和a . M. Alsalman,“阿拉伯语形态分析技术:调查和分类”,国际高级计算机科学与应用杂志,第11卷,no。2,页214-222,2020。视图:出版商的网站|谷歌学者
  3. S. Green和C. D. Manning,“更好的阿拉伯语解析:基线、评估和分析”,在2010-23届计算语言学国际会议论文集第2卷,第394-402页,中国北京,2010年8月。视图:谷歌学者
  4. Y. Zaki, H. Hajjar, M. Hajjar和G. Bernard,“阿拉伯语语法分析器的调查”,在ACM国际会议论文集系列,第1-10页,中国北京,2016年10月。视图:出版商的网站|谷歌学者
  5. A. M. Al-Zoghby, A. S. E. Ahmed和T. T. Hamza,“阿拉伯语语义web应用——一个调查”网络智能新兴技术杂志,第5卷,no。1, pp. 52-69, 2013。视图:出版商的网站|谷歌学者
  6. A. M. Al-Zoghby和K. Shaalan,“阿拉伯语语义搜索”,在第28届国际佛罗里达人工智能研究学会会议论文集,FLAIRS, vol. 2015, pp. 524-529,墨尔本,佛罗里达州,美国,2015年5月。视图:谷歌学者
  7. J. C. Park, M. Palmer和G. Washburn,“英语语法检查器作为英语为第二语言的学生的写作辅助”,在第五届应用自然语言处理会议记录:系统演示和视频的描述,第24页,美国华盛顿特区,1997年3月。视图:出版商的网站|谷歌学者
  8. E. M. Bender, < Arboretum:使用精确语法检查调用中的语法>,见inl /icall研讨会纪要,托基亚:意大利威尼斯,2004年1月。视图:谷歌学者
  9. C. Brockett, W. B. Dolan和M. Gamon,“使用短语SMT技术纠正ESL错误”,在COLING/ACL 2006-21国际计算语言学会议和第44届计算语言学协会年会论文集,第1卷,第249-256页,澳大利亚悉尼,2006年7月。视图:出版商的网站|谷歌学者
  10. 乔多罗,泰特罗,n - r。汉,“涉及介词的语法错误的检测”,在第四届ACL-SIGSEM介词研讨会论文集,第25-30页,捷克共和国布拉格,2007年6月。视图:谷歌学者
  11. A. Kumar和S. B. Nair,“基于人工免疫系统的英语语法检查方法”,在人工免疫系统国际会议论文集,巴西桑托斯,2007年8月,第348-357页。视图:谷歌学者
  12. B. Crysmann, N. Bertomeu, P. Adolphs, D. Flickinger和T. Klüwer,“语法和样式检查的混合处理”,在第22届计算语言学国际会议论文集,第153-160页,曼彻斯特,英国,2008年8月。视图:谷歌学者
  13. D. Dahlmeier和H. T. Ng,“交替结构优化的语法错误纠正”,在第49届计算语言学协会年会论文集:人类语言技术,卷1,pp. 915-923,波特兰,OR,美国,2011年6月。视图:谷歌学者
  14. M.费利斯,袁振宇,Ø。E. Andersen, H. Yannakoudakis和E. Kochmar,“使用混合系统和类型过滤纠正语法错误”,在第十八届计算自然语言学习会议论文集2014年6月,美国马里兰州巴尔的摩。视图:谷歌学者
  15. 吉俊杰,王强,K. Toutanova,龚玉玉,张松,高杰,“一种嵌套的注意神经混合模型的语法错误校正,”,在第55届计算语言学协会年会论文集(第一卷:长论文),第753-762页,加拿大温哥华,2017年7月。视图:出版商的网站|谷歌学者
  16. Z.-R。Liu和Y. Liu,“利用未标记数据进行神经语法错误检测,”计算机科学与技术杂志,第32卷,no。4, pp. 758-767, 2017。视图:出版商的网站|谷歌学者
  17. T. Holan, V. Kubon和M. Plátek,“捷克语语法检查器的原型”,在第五届应用自然语言处理会议论文集,第147-154页,美国华盛顿特区,1997年3月。视图:谷歌学者
  18. 诉剥ř,使用SET解析器检查捷克语的部分语法, vol. 8655, nai施普林格,拉戈德基,格鲁吉亚,2014。视图:出版商的网站
  19. M. mizykowski,“开发一个开源的,基于规则的校对工具,”软件:实践与经验,第40卷,no。7, pp. 543-566, 2010。视图:谷歌学者
  20. F. R. Bustamante和F. S. León,“GramCheck:一个语法和风格检查器”,在第16届计算语言学会议论文集第1卷,第175-181页,加拿大温哥华,1996年7月。视图:谷歌学者
  21. J. Kinoshita, L. do Nascimento Salvador和C. E. D. de Menezes,“CoGrOO:基于分页语料库的巴西-葡萄牙语语法检查器”,在国际语言资源与评价会议论文集,第2190-2193页,意大利热那亚,2006年5月。视图:谷歌学者
  22. J. Birn,“用Lingsoft的瑞典语语法检查器检测语法错误”,见第十二届北欧计算语言学会议论文集(NODALIDA 1999),第28-40页,挪威特隆赫姆,2000年12月。视图:谷歌学者
  23. P. Gakis, C. Panagiotakopoulos, K. Sgarbas, C. Tsalidis和V. Verykios,“希腊语法检查器的设计与构建”人文学科中的数字学术,第32卷,no。3,页554-576,2017。视图:谷歌学者
  24. A. Fahda和A. Purwarianti,“基于统计和规则的印尼语文本拼写和语法检查器”,在2017年数据与软件工程国际会议论文集,第1-6页,印度尼西亚巨港,2017年11月。视图:谷歌学者
  25. M. P. Go, N. Nocon,和A. Borra,“Gramatika:低资源菲律宾语的语法检查器”,在TENCON 2017-2017 IEEE地区10会议记录,第471-475页,马来西亚槟城,2017年11月。视图:谷歌学者
  26. M. S. Gill和G. S. Lehal,“旁遮普语语法检查系统”,在第22届国际计算语言学会议论文集:演示论文,英国曼彻斯特,2008年8月,第149-152页。视图:谷歌学者
  27. S. K. Sharma和G. S. Lehal,“改进现有的旁遮普语语法检查器”,见2016年信息与通信技术计算技术国际会议论文集,第445-449页,印度新德里,2016年3月。视图:谷歌学者
  28. L. Bopche, G. Dhopavkar,和M. Kshirsagar,“使用基于规则的形态过程的印度语言语法检查系统”,在计算与通信系统国际会议论文集,第524-531页,华盛顿特区;美国,2011年2月。视图:谷歌学者
  29. N. Ehsan和H. Faili,“波斯语语法检查器的发展”,在第六届自然语言处理与知识工程国际会议论文集(NLPKE-2010),第1-8页,中国北京,2010年8月。视图:谷歌学者
  30. " Grammarly:免费在线写作助手。“(在线)。可用:https://www.grammarly.com/.(访问:31 - 2020年5月——)。
  31. “LanguageTool -拼写和语法检查器。“(在线)。可用:https://languagetool.org/.(访问:31 - 2020年5月——)。
  32. “ClearEdits写作编辑软件:超越语法检查|语法检查软件。“(在线)。可用:https://www.clearwriter.com/clearedits.html.(访问:31 - 2020年5月——)。
  33. a . Alqahtani和a . Alsaif,“阿拉伯文章的自动评估:基于规则的系统”,在2019年IEEE信号处理与信息技术国际研讨会论文集,第1-7页,阿吉曼,阿联酋,2019年12月。视图:出版商的网站|谷歌学者
  34. K. F. Shaalan,《阿拉伯语GramCheck:阿拉伯语语法检查器》软件:实践与经验,第35卷,no。7, pp. 643-665, 2005。视图:出版商的网站|谷歌学者
  35. C. Moukrim, A. Tragha, E. H. Benlahmer和T. Almalki,“一种自动纠正阿拉伯语文本语法错误的创新方法”,沙特国王大学学报-计算机与信息科学, 2019年。视图:出版商的网站|谷歌学者
  36. ط。المالكي,أنطولوجيا حاسوبية للنحو العربي, دار النابغة, مصر, 2015。
  37. C. Moukrim, A. Tragha, E. Habib和E. Habib,“阿拉伯语语法格尾错误的修正”国际高级计算机科学与应用杂志,第10卷,no。11,页279-285,2019。视图:出版商的网站|谷歌学者
  38. N. Madi和H. S. Al-Khalifa,“基于深度学习的阿拉伯语语法错误检测工具”,计算机科学2018年,中国科学院学报,vol. 142, pp. 352-355。视图:出版商的网站|谷歌学者
  39. K. Jensen, G. E. Heidorn和S. D. Richardson,“自然语言处理:PLNLP方法”,施普林格科学与商业媒体《中国科学》,2012年第196卷。视图:谷歌学者
  40. I. A.梅尔丘克,依赖语法:理论与实践,纽约州立出版社,奥尔巴尼,美国,1988年。
  41. J. Nivre,“依赖语法和依赖解析”MSI报告,第5133卷,no。1959, pp. 1-32, 2005。视图:谷歌学者
  42. R. McDonald, F. Pereira, K. Ribarov和J. Hajǐc,“使用生成树算法的非射影依赖分析”,见HLT/EMNLP 2005 -人类语言技术会议和自然语言处理经验方法会议论文集, 523-530页,温哥华,BC,加拿大,2005年10月。视图:ǐc" target="_blank">谷歌学者
  43. J. Lafferty, D. Sleator和D. Temperley,“语法三元组:链接语法的概率模型”,中文计算机学会学报第56卷,1992年。视图:谷歌学者
  44. D. D. K. Sleator和D. Temperley,《用链接语法解析英语》,1995,https://arxiv.org/abs/cmp-lg/9508004视图:谷歌学者
  45. م。العثيمين,شرحالآجرومية.مكتبة ابن رشد第1435页。
  46. 2020年,“马达米拉-阿拉伯语分析仪-。“(在线)。可用:https://camel.abudhabi.nyu.edu/madamira/.[访问:06-Jun -。
  47. Y. Belinkov, a . Magidow, a . Barrón-Cedeño, a . Shmidman和M. Romanov,“MADAMIRA:阿拉伯语形态分析和消除歧义的快速、全面的工具”,在第九届国际语言资源与评估会议论文集,LREC 2014,第1094-1101页,雷克雅未克,冰岛,2014年5月。视图:谷歌学者

betway赞助版权所有©2020 Ameerah Alothman and AbdulMalik Alsalman。这是一篇开放获取的文章,在创作共用署名许可协议它允许在任何媒介上不受限制地使用、传播和复制,前提是正确地引用原始作品。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订购印刷本订单
的观点986
下载492
引用

相关文章