【導讀】分析了上萬個交易糾紛類案件,學習了近千條交易領域的法律條款,阿里 AI 針對每種案由,整理成計算機能理解的模型,同時,針對案件的每一個要素,阿里 AI 自動提供相關法條等判決依據,從而建立了一整套審判知識圖譜,深刻刻畫了交易人、交易行為與法律事實的關聯性,并且把這種關聯性融入到了 AI 中。當法官遇到類似案件時,阿里AI就能夠針對糾紛爭議點迅速開啟“大腦”進行分析和判斷,并向法官給出調解和判案建議。這一研究成果發表在信息檢索領域的頂級學術會議 SIGIR 官網。SIGIR 組委會認為,阿里巴巴的這項技術是司法智能領域的一項開創性成果。目前,該技術已在杭州互聯網法院試點應用。
前言
2018年4月,杭州西湖區人民法院出現了令人驚奇的一幕:在一次審判中,原告在家中,被告在1200多公里開外的律師事務所,靠智能法院在線面對面,現場的書記員也是個“機器人”,整個庭審現場僅法官一人。這場獨特的“一個人的法庭”打開了社會對“智能司法”的想象空間,其背后正是阿里AI技術。
如果說“一個人的法庭”還屬于審判流程的數字化、在線化的1.0階段。那么,阿里的最新研究成果標志著智能司法2.0階段到來。AI不再只是停留在完成庭審記錄和證據鏈條的數字化工作,而是進入到真實訴訟環節,開始具備自主判案能力,真正成為一名“助理法官”。
以下為研究論文解讀:
摘要
隨著信息技術的飛速發展,電子經濟獲得了快速增長,并成為世界上動態性最強的經濟活動之一。截至2018年,世界上主要的電商平臺(如亞馬遜、eBay、阿里巴巴)等都獲得了巨大成功,并占領了全球零售市場的11.9%。但與此同時,新型法律糾紛也隨著信息技術的發展不斷出現。高效處理問題糾紛無論對商家還是用戶都是一件好事,基于此背景下,阿里巴巴進行了相關研究,無論是研究成果還是未來在場景中的應用,都值得關注。
在傳統訴訟流程中,法官判定一個交易糾紛案件的調解與審判方向,需要經過讀案卷、查詢交易對話記錄、提煉爭議焦點、查找相關法律條款等步驟,大約需要2小時,而通過上述精準識別模型,阿里AI只需要1秒左右時間,就可得出調解與審判方向并給出建議。這將大大節省法官的重復勞動時間,從而大幅提高司法效率。
在已有的相關研究中,學者們指出,無論是 ODR(online dispute resolution, ODR)還是正式的判決系統,通過使用多渠道的更好且易用的信息,并去除訴訟當事人的外表信息(如種族、性別、體重等),都能夠有效降低判決過程中的主觀偏見性。本文作者依據這一結論,決定使用多視圖表示學習和多任務學習( ODR 和審判預測)來解決電子經濟領域的法律智能化問題。在這一聯合學習過程中,本文作者使用了包括法律知識圖譜、消費者/售賣方信息、交易信息等多種類數據,以在對糾紛表示進行微調對過程中對可能的判決結果進行正則化。
本文是第一篇針對網絡交易糾紛案件的智能化審判的研究論文,該論文對于維護法律公平性、保護網絡交易中雙方利益具有重要意義。不同于之前的分類和推薦類模型和方法,本文提出了一個端到端的多任務學習模型,該模型對法律判決模型和糾紛解決模型進行了聯合訓練。另外, ODR 任務在聯合學習過程中提供了重要的法律數據,因此本文提出對模型能夠有效解決法律數據稀疏對問題。
總體而言,本文的貢獻如下:
(1)提出了一個全新的法律智能化問題;
(2)提出了通過多視圖糾紛表示以量化法律案例對有效方法;
(3)論文模型能夠有效挖掘法律案例背后的判決邏輯,并解釋判例和判決結果之間的因果關系;
(4)使用超過百萬級糾紛數據對模型進行了訓練,并使用超過6858個判例對模型進行了評估。實驗結果顯示,本模型有效提高了訴訟結果預測的 Micro_F1 和 Micro_F2 分數。
(5)在移除敏感信息后,論文作者還公開了數據集
模型架構
在本文中,作者提出了一個使用多任務學習的方法,能夠通過 ODR 和法律智能化的方式對 4 種不同類型對分類任務進行聯合學習。在實際操作中,首先要對糾紛對產生原因進行分類,然后對可能對糾紛調解結果進行分類。當這一糾紛可能成為訴訟時,模型首先對其進行分類,然后基于前述階段產生對訴訟事實對訴訟判決結果進行預測。在本文中,作者通過對其背后對邏輯體系進行思考,對上述對四個任務進行了序列性的處理(見圖1),并假設糾紛的原因對其判決結果具有較高的重要性。糾紛原因也反映了訴訟的事實,該事實對判決結果會產生極大影響。
圖1:本文提出的 LDJ 模型的網絡結構
主要任務:法律判決預測
從法律視角而言,判決是對原告陳述對回應。本文將此過程定義為一個多標簽分類任務,該任務是一個函數優化問題,該函數對給定案例表示的標簽的實際價值進行預測。在函數中, x 為給定案例的表示,y 為判例標簽, M 是分類的總數量。考慮到這一任務的訓練數據可能較為稀疏,模型使用了多任務和多視圖表示學習,通過子任務的信息對預測結果進行優化。
子任務 1:糾紛原因預測
糾紛原因預測是 ODR 的一部分,是一個單標簽多任務分類任務,在這一任務中,每一個糾紛都對應一個糾紛原因,該原因由用戶基于一個列表進行選擇產生。這一任務和主任務的不同之處在于, ODR 數據庫為該任務提供了充足的訓練數據。該任務嘗試學習一個映射函數,該函數將糾紛表示映射到類別標簽中。在函數中, 向量 x 為糾紛的表示, k 為類別標簽,k ∈ RK,K 為種類的總數量。
子任務 2:糾紛結果預測
通過使用案件信息和用戶選擇的糾紛原因,網絡交易平臺能夠對糾紛調解結果進行判斷,例如僅退款,退貨并退款,或拒絕。和上一任務類似,這也是一個 ODR 單標簽多類別分類任務。
子任務 3:訴訟事實預測
在實際案例中,如果顧客決定提交一個訴訟,法官會對通過查看所有證據了解訴訟事實情況,證據包括交易數據,協商結果等,以及案件被告。由于數據獲取的困難性,在本文中,作者僅使用了糾紛數據,該數據可以從電商平臺獲得。
多視圖糾紛表示
在網絡交易系統中,一個糾紛案例往往包含三種類型的信息,即買賣雙方與交易。從法律角度來看,每個案例都可以表示為法律知識圖譜(legal knwoledge graph, LKG)的節點和邊。模型需要使用元數據和問題數據進行這一表示。下表描述了本文對三個角度的信息進行表示時采用的特征。另外,對于法律表示,本文也適用了法律專家的知識,并同樣將其表示為一個知識圖譜。圖2展示了這一知識圖譜的一部分。
對于每個案例,本文都進行了三種表示:離散、文字、法律知識圖譜,并在最后將三種表示結合,作為特征進行輸入。
表1:使用的特征
圖2:法律知識圖譜的部分示例
交易數據可以通過商品的數據和價格顯示購買行為的狀態。其中,商品信息包括反映了商品質量的負面評價,物流信息顯示了商品的所屬情況,線上糾紛記錄展示了當前交易涉及的買家、賣家和平臺管理者關于糾紛的對話記錄。從買家角度,本文作者假設,買家的歷史購買和糾紛記錄能夠展示其是一個普通消費者還是專業的欺詐者。與此類似,賣家的信用、評價和糾紛則能夠表示其信用水平和商品質量。
從理論上來看,交易數據能夠展示顧客提出糾紛的原因,并且在訴訟中,這一數據也是支持判決的重要證據。同時,對買家和賣家雙方進行用戶畫像也是給出糾紛結果的基礎步驟。
本文使用的法律知識圖譜(Legal Knowledge Graph, LKG)是一個有向無環圖(directed acyclic graph, DAG),LDK 和本體較為相似,其表示了不同場景下常見 OTD 的判決要求。圖2展示了一個示例,在該示例中,電子經濟欺詐案例可能會在多種情況下出現:虛假價格,虛假促銷,商品問題等。每一場景都可能包含多個子場景。另外,若要將一個案例判決為欺詐,必須確認原告(或買家)是一個真實的消費者,而不是一個專業的欺詐者。在本論文中,作者利用 LKG 對每個案例進行了表示,并將其作為預測任務的輸入。
法律糾紛判決模型
這一部分介紹本文提出的法律糾紛判決模型(Legal Dispute Judgment, LDJ)的推理步驟。多任務框架包含 3 個主要的部分:嵌入模塊,共享編碼器,以及基于任務的解碼器;嵌入部分包括離散、文字和 LKG 三種類型的嵌入,用于表示法律條款之間的離散特征、文字特征的語義含義和語義連接。
輸入:文字輸入 xt 以文檔形式展示,其中,xt = {s1, s2, ..., sL} 是一個包含 L 個句子的序列,其中每個句子 sj = {wi1, wi2,...wiT},語句包含 T 個詞語,詞語用詞嵌入表示。離散輸入 sd = {v1, v2, ..., vK} ,者是一個長度固定為 K 的值集合。 LKG 輸入 xg = {a1, a2, ..., aN} 是一個概率分布,維度 N 表示 LKG 中的結點個數。
編碼器:對文字輸入進行編碼,本文使用了一個具有等級結構的網絡來提取文檔結構,該網絡首先建立對句子對表示,之后將其拼合為對文檔對表示。
句子表示,本文使用卷積神經網絡(convolutional neural network, CNN)來計算句子對連續表示。考慮到在本文處理的數據,消費者常傾向于使用長句子來表達案例情況, CNN 對本文情景更加適合。本文采用的 CNN 網絡采用了多個具有不同寬度的卷積核來產生句子的表示。這種網絡結構能夠更好地學習多種粒度的 n-gram 結構的語義信息,這有利于句子分類任務的進行。
文檔表示,本文采用一個雙向 GRU 結構提取句子間的依賴信息,并對文檔進行表示。相較于雙向 LSTM ,這一結構能夠對相鄰句子對信息進行更有效對總結。
LKG & 離散表示,為了對 LKG 和離散輸入進行編碼,本文使用一個單層全連接神經網絡進行了計算,該網絡包含一個 logistic sigmoid 激活函數。 hg 和 hd 是 LKG 和離散輸入的隱藏表示:
最后,論文將三種類型的表示進行拼接,得到編碼器的最終輸出:
解碼器:本部分,作者介紹了論文的各個子任務,以及主任務的實現方式。
子任務 1:糾紛原因預測
為預測糾紛的調解方案,本文使用了交易層的輸出作為輸入,并采用一個 Highway Network 來解決參數增長帶來的訓練困難問題。
子任務 2:糾紛結果預測
糾紛結果預測在推理層的最上層進行。考慮到使用歷史交易和糾紛記錄有助于達成更好的調解結果,本文將交易層、買家層和賣家層的輸出以及推理層的輸出進行了拼接,作為結果層的共同輸入,這一步驟使用 Highway Network 進行了處理。帶權重的原因標簽嵌入表示如下:
子任務 3:訴訟事實預測
這一部分的任務是預測法官會采用的法律事實,考慮到一些糾紛原因和測定的法律事實存在關聯,該內容涉及糾紛原因預測過程。本文將交易層和原因層的拼接作為輸入,并使用Highway Network進行處理。之后,模型將結果輸入了一個包含 sigmoid 函數的全連接神經網絡。和糾紛層的任務的不同之處在于,作者在這一部分對 sigmoid 激活使用了二元交叉熵,相較于 softmax 激活函數,這一方法對多標簽分類任務更加有效。
主任務:訴訟判決預測
這一部分,作者結合了交易信息、訴訟當事人對歷史信息以及訴訟事實,并將四個部分的輸出拼接為這一部分模型的輸入。為了直接使用事實層的輸出,作者對結果進行了標簽嵌入。最后的結果同樣適用Highway Network進行拼接,并輸入到判決分類器。該分類器是一個包含 sigmoid 函數的全連接神經層,和事實分類器類似。這一部分,作者同樣使用了二元交叉熵。
訓練過程包含兩部分。作者首先使用所有的離散數據訓練原因層和結果層,并在這一步中關閉了事實層和判決層,以使用大量的數據對離散表示進行優化。之后,作者啟動了四個任務層,并使用訴訟數據來微調參數。作者將主任務和子任務的損失權重設定為0.6, 0.2, 0.1, 0.1,并加和得到最總的損失函數值。
實驗分析
(1)數據集:作者在兩個數據集上進行了實驗:淘寶歷史糾紛數據,以及最高法院提供的訴訟數據。盡管數據集均為中國的電商數據和訴訟數據,但模型可用于世界各國的應用。
糾紛數據集(ODR):論文收集了40萬條歷史糾紛記錄,記錄包含 46 種糾紛原因和 3 種調解結果。最常見的糾紛原因為質量問題,錯誤訂單,退換貨和錯誤商品信息。調解結果包括退款并退貨,拒絕和僅退款。
訴訟數據集:該數據集從中國在線判例網站爬取,判決文件由最高法院提供,可在線上公開獲取。本文通過關鍵詞檢索,將判例限制在和淘寶相關的內容中。本文共收集了6858個案例。
本文使用 Word2Vec 對文本嵌入進行了預訓練,使用百萬級的糾紛記錄進行了訓練。使用的 CNN 網絡包含的卷積核寬度為{1, 2, 3, 4, 5},輸出維度為{32,32,64,128,256}。GRU維度為100。
(2)評價指標:本文使用了 Micro_F1 和 Micro_F2 作為主要的的評級指標。Macro-average)能夠對每個類別的每個矩陣進行單獨評估,并取平均值作為最終的分數。這一指標對于多標簽多分類任務較為有效。
(3)基線:由于沒有已有的針對法律判決任務的多任務學習的研究,本文通過比較多個最新的單任務判決預測模型效果對模型進行了評估,涉及方法包括傳統機器學習模型(BSVM),深度學習模型兩種,結果如下表。
(4)模型表現:論文從以下四個角度展示了模型對評估結果:(a)和基線的比較;(b)使用多任務框架進行訓練的優勢;(c)使用多視角的有效性;(d)使用電商經濟糾紛數據的影響。
從基線比較來看,LDJ_Multi 的效果超越了最好的模型表現。作者對最優模型和最優基線模型分別進行了消融實驗,結果如表3。
表3:多視角消融實驗
從使用電商糾紛數據對影響來看,作者展示了在訴訟判決預測上使用糾紛數據帶帶來的模型效果提升,如圖3。
圖3:電商糾紛數據帶來的多任務效果提升
結論
作為一個交叉學科研究,進行法律糾紛預測能夠將兩個不相關的領域較好地連接在一起。在本文中,作者介紹了一個多視角糾紛表示技術,并提供了一個針對訴訟判決預測的端到端解決方法,該方法采用了包含三個子任務的聯合學習。實驗數據表明,聯合學習能夠有效提升現有模型的效果。另外,電商平臺糾紛數據的使用也能夠有效提升判決預測的效果。通過評估結果和錯誤分析,本文展示了糾紛表示的各個分面,并為未來工作進行了鋪墊。
-
機器人
+關注
關注
211文章
28524瀏覽量
207533 -
AI
+關注
關注
87文章
31155瀏覽量
269481 -
阿里巴巴
+關注
關注
7文章
1617瀏覽量
47308
原文標題:阿里達摩院SIGIR 2019:AI判案1秒鐘,人工2小時 | 技術頭條
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論