人工智能技術與司法制度的深度結合可能會深度凸顯在兩個方面:
其一是AI速裁,以智能機器人和法官相結合所完成的簡易案件速裁;
其二是案件預測全覆蓋,輔助當事人參與訴訟,或者幫助訴訟參與人作出理性的預判。
Q:高某某將面臨何種處罰?
當高某某的案件來到法院后,一套智能辦案輔助系統會自動告訴法官,自家法院已經判決了多少起類似案件,平均量刑為多長時間,這些判決書中的判決依據是什么。
同樣的技術服務也已面向普通公眾,市面上多款法律AI產品都已具備這種類案推送功能,有的產品甚至還能夠支持當事人的語音查詢識別。
【甚至系統可以告訴你某個法官處理這類案件中上訴率、二審發回率、他常采信的證據、他的裁判觀點、他關注的爭議焦點等等】法律科技公司華宇元典總經理、曾經的檢察官鄒劭坤在1月5日接受記者采訪時表示。
這種智能輔助辦案技術正在越來越多的法院中應用,建立在海量司法大數據、語義識別,以及初步的機器學習技術之上。盡管受訪的司法和技術人士均表示,這還只是“極低水平的智能化”,但已經開始為司法領域描繪一幅人工智能前景。
“智能輔助辦案系統出現的背景,是近年來司法機關‘案多人少’的矛盾日漸突出,司法效率亟待提升,同時大數據、人工智能技術取得了很大突破,最高檢、最高法先后提出了智慧檢務和智慧法院建設。”北京大學法律人工智能實驗室副主任江溯說。
從政策脈絡中,最高司法機關從最初的“信息化”到“商業智能”,最終大膽提出了“人工智能”的應用目標。
《人民法院信息化五年發展規劃(2016-2020)》提出建設基于大數據智能服務的審判支持系統,并提出利用商業智能、大數據分析和可視化手段,對司法審判信息資源庫中的數據進行挖掘、分析和展現。
在2016年11月17日的第三屆世界互聯網大會智慧法院暨網絡法治論壇上,最高人民法院院長周強正式提出積極推動人工智能在司法領域的應用,“現在同案類推都是為人工智能的發展奠定了基礎”。
國務院2017年7月印發的《新一代人工智能發展規劃》也納入了“智慧法庭”,提出促進人工智能在證據收集、案例分析、法律文件閱讀與分析中的應用。
“目前法律人工智能領域涌現了多種市場主體,還有更多的創業公司在進入,比如電子政務領域的上市公司華宇軟件成立了華宇元典”江溯告訴記者。
“BAT也有布局,他們因為具有強大的云計算實力而更占優勢,但相對低調,他們更愿意用已有技術為司法提供公眾服務,而不是切入人工智能領域。”一名互聯網企業從事法律服務工作的人士告訴記者。
據報道,騰訊與深圳、廣州、北京等地法院合作了小程序訴訟服務,提供在線立案、送達、開庭等服務。記者獲悉,騰訊近日將上線智慧法院開放平臺,此前騰訊已推出了智慧城市等開放合作平臺。
“在中國,有許多像華宇元典這樣的法律科技公司在競逐,他們用自己的方法在探索,試圖改變當前的法律服務市場。”鄒劭坤告訴記者,華宇元典與母公司華宇軟件合作,已推出了面向法院的智慧裁判解決方案和面向檢察院的智慧公訴輔助系統。
智能輔助辦案系統中,上海的“206工程”是一項標桿,它的全稱是上海刑事案件智能輔助辦案系統。這項工程由中央政法委交辦,因交辦日期為2月6日而得名。
最高法院司改辦規劃處處長何帆曾公開介紹,法官決定判決某個罪名的案件時,寫好判決書放入系統里,系統會自動提示跟本院以及上級法院有將近85%的類似情況下的判決是不一樣的,問法官是否堅持這樣做,若堅持該判決,那么系統將自動把判決推送給庭長以供討論。
這可以被理解為一個具有法律機器人雛形的智能輔助辦案系統是如何運作的。
廣州市中院向記者提供的材料顯示,廣州兩級法院平均每天產生2500件新收、結案案件信息,歷史案件數字化信息超過300萬件。基于海量案件信息,廣州法院以案由為分類,建立了龐大的案件特征要素庫(案件詞庫),并輔助辦案。
第一步是【智能提取案件要素】。一件案件的案件材料涉及當事人提供的紙質材料、從立案到結案審判輔助人員錄入的各類信息、庭審中訴訟參加人的實時語音數據、審判人員撰寫的各類法律文書。
這些材料形成后,系統按照“從圖片、語音到文字,從文本到結構化數據”的思路,利用OCR(光學字符識別)技術、語音識別技術、文本分析技術,將每件案件關鍵信息提取出來,錄入案件要素特征庫。
案件要素特征庫中的海量數據由系統自動采集,數據質量相對較差,無法直接運用于輔助辦案工作。
廣州市中院提供的材料顯示,大數據中心數據質量模塊通過人工調整和自動調整兩種手段對海量數據進行處理,補充不完整數據,修正錯誤數據,去除冗余數據。
“比如在紙質案卷掃描成電子文檔,以及庭審錄音轉化成文字后,法院工作人員對生成的文字進行校對糾錯,在糾錯過程中,系統進行一定的自動學習,逐漸提高轉化的準確率,這是目前比較成熟的智能化應用。”中國社科院國家法治指數研究中心副主任呂艷濱說。
在此基礎上,法官辦案時,系統通過案件畫像技術理解在辦案件,根據案件要素特征庫中匹配案件特征,推送關聯案件信息。
推送的信息主要包括:與在辦案件當事人有關的訴訟、信訪情況;與在辦案件特征類似的生效裁判文書;全市法院對此類案件的裁判趨勢;符合在辦案件特征的法律法規條文。
“在外行人的潛意識里,可能認為法律是一個封閉的規則體系,按照三段論,系統中具有法律規定的大前提,輸入發生的案件事實,就會得出相應的裁判結果。但實際上存在數不清的爭議點和模糊地帶。”鄒劭坤告訴21世紀經濟報道記者。
2017年初,一則南京市中院將引入智能機器人判案的報道激起了輿論,但南京市中院隨即辟謠稱,該院并未成立機器人項目組,更沒有任命項目負責人,并稱“個別企業為了推銷產品,無中生有地編造我院引進所謂‘法律機器人’項目”。
事實上,直到現在,智能輔助辦案系統也尚未普及。南京市某基層法院法官告訴21世紀經濟報道記者,“這種類案推送可以提高簡單案件的審理效率,但實際作用不大,因為每個案件事實有差異,不可能都檢索到相同案例,還是要依法、獨立思考。”
“目前的人工智能輔助司法還處在極低的水平上,比如刑法規定了幾百個罪名,可目前能自動推送的只有20幾個簡單罪名。”江溯說。
“有的法律智能產品能針對輸入的案情材料,給出罪名的預測,并分析不同刑期的百分比,這只是一種數據統計技術,屬于比較初級的大數據技術,不能算作人工智能。理想中的司法人工智能,應該是系統通過對類案的學習,對法官的裁判進行糾偏。”呂艷濱告訴21世紀經濟報道記者。
“目前的法律人工智能仍處于要解決基礎性、程序性工作的階段,集中于搭建好基礎設施,讓散見于法、檢、律之間的數據能夠聯動、流通,用機器取代大量重復性、低附加值的工作,也即解放整個法律行業的生產力。”鄒劭坤說。
“法律智能研發目前最大的困難和整個計算智能行業是相同的,即如何取得足夠專業、大量的行業知識標簽數據。突破這個困難需要大量的法律行業專家和計算機算法專家,甚至非常可能是需要培養法律 - 算法的跨學科專家。”他說。
數據是機器學習的前提。對于市場化的法律人工智能服務來說,其大數據來源是中國裁判文書網上公布的文書。截至1月2日,中國裁判文書網的訪問總量近125億次,累計公開裁判文書超過4131萬篇。
“但這些公開的文書只是海量文書的一部分,數據的不完備會影響系統識別、推送的精確度。”江溯說。
相較于市場化公司,智能輔助辦案系統可以使用法院內部數據庫,但采取“全樣本庫”仍是一個逐漸的過程。最高法院司改辦規劃處處長何帆2017年12月曾公開介紹,全國法院司法數據系統還沒有完全打通,在數據流通與可獲取性上還存在一定問題。
機器學習本身也需完善。2017年12月11日,紐約市議會通過了算法問責法案,以解決算法歧視問題。原因是一些算法,在犯罪預測、量刑輔助等決策活動中的使用存在著嚴重的歧視問題,尤其是對黑色人種的歧視。
“某種程度上,這也可以看做是數據的質量問題,因為美國歷史上的很多判例中包含了種族歧視的因素,而這些判例又作為數據被機器所學習。事實上,世界各國都存在數據污染問題,不是種族歧視也會是其他問題,需要今后給予解決。”江溯說。
“人工智能未來肯定能助力司法審判工作,但我認為它能取代法官則是危
[1] [2]
-
人工智能
+關注
關注
1795文章
47642瀏覽量
239771
發布評論請先 登錄
相關推薦
評論