Document-Level Event Argument Extraction With A Chain Reasoning Paradigm
文档级事件参数提取旨在识别句子级别之外的事件参数,其中一个重大挑战是对远程依赖关系进行建模。针对这一挑战,我们为该任务提出了一种新的链式推理范式,它可以生成可分解的一阶逻辑规则进行推理。由于链的组合性质,这种范式自然地捕获了远程相互依赖,这也通过显式地建模推理过程来提高可解释性。我们引入 T 范数模糊逻辑进行优化,它允许端到端学习,并有望将逻辑推理的表达能力与神经网络的泛化相结合。在实验中,我们表明我们的方法在两个标准基准上明显优于以前的方法(F1 中超过 6 个点)。此外,它在资源匮乏的情况下具有数据效率,并且足够强大以防御对抗性攻击。
1.
识别事件参数(即事件的参与者)是文档级事件理解的一项关键任务(Ebner et al., 2020;Li et al., 2021)。在此任务中,主要挑战是对事件触发器和参数之间的远程依赖关系进行建模,因为事件表达式可以跨越多个句子(Ebner 等人,2020;Liu 等人,2021;Li 等人,2021)。考虑图 1 中由触发引爆(类型 = 攻击)表示的事件。为了定位其参数 Tartus(语义角色 = 地点),模型应捕获包含三个句子和 178 个单词的大型上下文窗口,以支持推理过程。
目前,有效捕获此类依赖关系仍然是一个悬而未决的问题(Liu et al., 2021, 2022c)。先前的研究提出建模通过结合分层编码机制(Du and Cardie,2020a)、生成范式(Li et al.,2021;Ma et al.,2022;Du et al.,2022)和文档级归纳偏差(Wei等人,2021;Pouran Ben Veyseh 等人,2022;Liu 等人,2022b)。然而,此类方法并未明确表征文档上下文背后的推理模式,这可能会导致性能不佳。此外,大多数以前的方法都是不可解释的,因为它们依赖于黑盒神经网络。

在本文中,我们提出了一种新的推理链范式来解决文档级事件参数提取(EAE)。如图 1 底部所示,我们的方法试图通过一系列局部推理步骤来描述全局参数查找过程。例如,我们可以使用以下链来定位塔尔图斯:引爆目标→Arzunah Bridge locatedIn→塔尔图斯。与以前的方法相比,这种推理链范式具有三个明显的好处:首先,由于推理链的组合结构,它自然地捕获了长距离依赖关系。其次,它只涉及局部推理,这在概念上比直接执行全局推理更容易。第三,它提高了可解释性,因为推理过程是可见的。
我们的方法将推理链形式化为一阶逻辑(FOL)规则(Cresswell 和 Hughes,1996)。具体来说,令 RL(T , ?) 为对事件参数的查询,该事件参数满足关于事件触发器 T 的语义角色 RL (例如,地点)。我们将查询形式化为以下 FOL 规则:

其中规则主体(右侧)由具有低级谓词 {ri}1n 和中间线索实体 {Bi}n−1 1 的合取命题组成。我们构建一个模型,根据文档上下文自动生成规则,然后将规则转换为推理链来定位事件参数。然而,由于 FOL 规则的离散性质,使用 FOL 规则进行优化通常具有挑战性(Qu 等人,2021a)。受到使用 FOL 增强神经网络的工作的启发(Li 和 Srikumar,2019;Ahmed 等人,2022),我们提出了用于松弛的 T-Norm 模糊逻辑(Hajek,1998),这导致了端到端的训练机制。