以人工智慧讀取親權酌定裁判文本:homepage.ntu.edu.tw/~schhuang/publication_files/49_1_195人工智慧讀取裁判.pdf實證研究之文獻...

30
以人工智慧讀取親權酌定裁判文本: 自然語言與文字探勘之實踐 * 黃詩淳、邵軒磊 ** <摘要> 近期人工智慧的研究,使電腦(機器)能夠部分模擬人類思考過程、輔 助人類決策,並應用至法學領域。過去著重在解析法官思考過程以及預測裁 判結果,讓律師與當事人參考;而為了獲得高度正確的成果,必須倚賴法學 專家先閱讀裁判或法律條文,抽取出關鍵因素,將之編碼之後,再由機器建 立模型並預測。本研究嘗試不同的方法,直接將自然語言的文本(即法院裁 判原文)輸入機器,觀察機器能否成功解析法官的語意,判斷裁判之結果。 具體言之,本文以三年期間地方法院第一審結果為「單獨親權」之裁判文書 之部分段落作為樣本,使機器讀入這些文本後,以自動斷詞等文字探勘技術, 製作出詞彙矩陣,再使用機器學習領域中的類神經網路方法,訓練機器「理 解」法官的語氣與裁判方向(親權歸屬父親或母親)。接著以此為基礎,要 求機器讀入其他未知裁判,並判斷結果。其準確率約 77.25% F1 分數 0.8674 * 作者感謝匿名審查人的寶貴意見。本文為科技部【人工智慧輔助法律資料分析之 實踐】(MOST 108-2628-H-002 -005 -MY2)、科技部【中國大陸之日本研究知識 社群:系譜學、社會網絡、數位人文】(104-2410-H-003 -021 -MY3)以及國立臺 灣大學系統104年度「年輕學者創新性合作計畫」之相關研究成果。 ** 國立臺灣大學法律學院副教授;北海道大學法學博士。 E-mail: [email protected]國立臺灣師範大學東亞學系副教授;國立政治大學法學博士。 E-mail: [email protected]‧投稿日:11/23/2018;接受刊登日:06/20/2019‧責任校對:辜厚僑、簡凱葳、吳霈桓。 DOI:10.6199/NTULJ.202003_49(1).0004 © 臺大法學論叢 NTU Law Journal 49 卷第 1 ∕ Vol.49, No.1 (03. 2020) 論著

Upload: others

Post on 22-Oct-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

  • 以人工智慧讀取親權酌定裁判文本:

    自然語言與文字探勘之實踐*

    黃詩淳、邵軒磊**

    近期人工智慧的研究,使電腦(機器)能夠部分模擬人類思考過程、輔

    助人類決策,並應用至法學領域。過去著重在解析法官思考過程以及預測裁

    判結果,讓律師與當事人參考;而為了獲得高度正確的成果,必須倚賴法學

    專家先閱讀裁判或法律條文,抽取出關鍵因素,將之編碼之後,再由機器建

    立模型並預測。本研究嘗試不同的方法,直接將自然語言的文本(即法院裁

    判原文)輸入機器,觀察機器能否成功解析法官的語意,判斷裁判之結果。

    具體言之,本文以三年期間地方法院第一審結果為「單獨親權」之裁判文書

    之部分段落作為樣本,使機器讀入這些文本後,以自動斷詞等文字探勘技術,

    製作出詞彙矩陣,再使用機器學習領域中的類神經網路方法,訓練機器「理

    解」法官的語氣與裁判方向(親權歸屬父親或母親)。接著以此為基礎,要

    求機器讀入其他未知裁判,並判斷結果。其準確率約 77.25%,F1分數0.8674,

    * 作者感謝匿名審查人的寶貴意見。本文為科技部【人工智慧輔助法律資料分析之

    實踐】(MOST 108-2628-H-002 -005 -MY2)、科技部【中國大陸之日本研究知識

    社群:系譜學、社會網絡、數位人文】(104-2410-H-003 -021 -MY3)以及國立臺

    灣大學系統104年度「年輕學者創新性合作計畫」之相關研究成果。 ** 國立臺灣大學法律學院副教授;北海道大學法學博士。

    E-mail: [email protected]

    國立臺灣師範大學東亞學系副教授;國立政治大學法學博士。

    E-mail: [email protected]

    ‧投稿日:11/23/2018;接受刊登日:06/20/2019。

    ‧責任校對:辜厚僑、簡凱葳、吳霈桓。

    ‧DOI:10.6199/NTULJ.202003_49(1).0004

    © 臺大法學論叢 NTU Law Journal

    第 49 卷第 1 期 ∕Vol.49, No.1 (03. 2020)

    論著

  • 196 臺大法學論叢第 49卷第 1期

    如此證實了機器可以某種程度「讀懂」裁判文本並做出分類。由於機器的運

    算速度遠大於人類,此成果將能更快速地讓人們找到所需的裁判(例如:母

    親取得單獨親權的裁判),而減少人工檢索、閱讀、挑選。「人機協作」的

    結果,將能增進人類決策的效率與正確性,也是法律資料分析學的近期目標。

    關鍵詞:法律資料分析、親權酌定、類神經網路、文字探勘、人機協作

    目 次

    壹、研究背景

    貳、文獻回顧與研究方法:法律資料分析

    參、研究設計與架構

    肆、研究成果與評估

    伍、比較與討論

    一、與先行類似研究之比較

    二、人工智慧如何「讀懂」裁判

    陸、結論

    壹、研究背景

    人工智慧(artificial intelligence, AI)與機器學習(machine learning)在

    大數據(big data)的背景下,近期獲得飛躍式的發展,甚至成為我國之科研

    戰略的一環。例如政府預期以五年期間,以五項策略組成的「AI 科研戰略」,

    引導臺灣成為全球研發重鎮,孕育產業發展1。人工智慧逐漸進入生活的各

    個層面,除了帶來便利與效率外,也引發對市場秩序及政府權能之衝擊。有

    識之士呼籲,政府應盡快邀集學者,針對如何因應人工智慧帶來的倫理、法

    1 科技部(2017),〈行政院院會議案:我國AI的科研戰略〉,https://www.ey.gov.tw/Page/

    448DE008087A1971/a76aec69-0950-44c5-bcb8-8e106cd735c5 ( 最 後 瀏 覽 日 :

    07/19/2019)。

  • 以人工智慧讀取親權酌定裁判文本 197

    律、社會和經濟等面向的挑戰,及早累積政府決策所需的充分知識基礎2。

    目前已有若干研究討論相關問題,如:區塊鏈涉及的專利爭議3、金融科技

    監理4、人工智慧倫理5、人工智慧對法律人才養成之挑戰6,或綜合性的議題

    盤點等7。

    本文在系列前作8,探討了機器學習等法律資料科學技術,在分析法院

    裁判時可能帶來之益處,並實踐比較不同的機器學習演算法分析親權酌定裁

    判的結果與意義。在前作,我們需要人工閱讀作為基礎,亦即將資料集中的

    訓練組的各個法院裁判,依照專家設定的 22 項特徵值(feature),由人工

    予以標記。其次,機器再依據此些已標記過的資料,進行運算,找出最合適

    的模型。本文則讓電腦直接從原始的判決原文來「學習」,而不再使用人工

    2 劉靜怡(2018),〈「人工智慧相關法律議題工作坊」簡介〉,《人文與社會科學

    簡訊》,19卷2期,頁59-60,https://www.most.gov.tw/most/attachments/f8231e21-

    69a2-4274-bb83-ad2175016920(最後瀏覽日:10/19/2018)。 3 宋皇志(2017),〈方興未艾之區塊鏈專利〉,《月旦法學雜誌》,266期,頁52-

    68。 4 張冠群(2017),〈自金融監理原則與金融消費者保護觀點論金融科技監理沙盒制

    度:兼評行政院版「金融科技創新實驗條例草案」〉,《月旦法學雜誌》,266期,

    頁5-34;臧正運(2017),〈區塊鏈運用對金融監理之啟示與挑戰〉,《月旦法學

    雜誌》,267期,頁136-152。 5 陳譽文(2017),〈人工智慧規範性議題綜觀〉,《科技法律透析》,29卷4期,

    頁43-51。 6 郭雨嵐、汪家倩、侯春岑(2017),〈法律科技與人工智慧時代,科技法律人才的

    養成與挑戰〉,《萬國法律》,214期,頁51-59。 7 林勤富、劉漢威(2018),〈人工智慧法律議題初探〉,《月旦法學雜誌》,274

    期,頁195-215。 8 包括:黃詩淳、邵軒磊(2017),〈運用機器學習預測法院裁判:法資訊學之實

    踐〉,《月旦法學雜誌》,270期,頁86-96(以下簡稱「類神經網路文」);黃詩

    淳、邵軒磊(2018),〈酌定子女親權之重要因素:以決策樹方法分析相關裁判〉,

    《臺大法學論叢》,47卷1期,頁299-344(以下簡稱「決策樹文」);黃詩淳、邵

    軒磊(2019),〈人工智慧與法律資料分析之方法與應用:以單獨親權酌定裁判的

    預測模型為例〉,預定刊登於《臺大法學論叢》,48卷4期,頁2023-2073(以下簡

    稱「梯度提升法文」)。

  • 198 臺大法學論叢第 49卷第 1期

    標記過的資料。舉例而言,下面這段是本文資料集中的其中一則裁判的部分

    段落:

    「本院依調查結果及參酌上開訪視報告內容,認為聲請人無論在親子依

    附、支持系統、居住環境、親職能力等各方面均能單獨勝任親權行使,且自

    劉○○出生至今,皆由其擔任主要照顧者,無任何不適任表現,因認兩造所

    生未成年子女劉○○其權利義務之行使負擔,由聲請人單獨任之,應符合未

    成年子女之最佳利益。」(臺北地方法院 101年度監字第 77 號民事裁定)

    人類在閱讀此段落後,應可得知法官會將親權酌定給聲請人,但聲請人

    是父或母,卻尚無從推知。本文將使用這樣的文本資料,訓練並測試機器能

    否「讀懂」裁判,做出正確的分類(亦即該裁判的親權酌定結果是歸屬父或

    母)。

    以往的研究程序有四個階段:「蒐集資料→人工編碼→訓練模型→預測

    結果」,主要的時間與精力,往往花費在「從事與校正編碼」即第二階段。

    因此,本文希冀使用文字探勘(text mining, TM)、自然語言處理(Natural

    Language Process, NLP)等技術,簡化甚至省卻人類編碼的流程,此舉將能

    節省許多勞動時間,儘快進入第三階段之後的訓練與預測(如下圖一)。

    要言之,本文之研究目的是為了「使法律資料分析流程更接近直接使用

    原始裁判文書」,讓機器能「讀懂」法官所寫文字,並對照實際判決結果。

    【圖一】本文研究目的與先前研究比較

    ※ 資料來源:作者自製

  • 以人工智慧讀取親權酌定裁判文本 199

    貳、文獻回顧與研究方法:法律資料分析

    隨著人工智慧相關研究的進展,將機器學習乃至資料分析(data

    analytics)的技術應用至法律領域,形成了「法律資料分析(legal analytics)」

    的新專業9。法律資料分析的技術可用來觀察較大量的法院裁判,此種作法

    也屬於法實證研究之一環。

    法實證研究重視的是法學經驗的面向,其意義在於描述重要的、與法律

    有關的現象,亦即提供一個論證與分析的基礎10。法實證研究的對象,是一

    種法律規範與真實社會間的空白狀態。對空白狀態增加理解、掌握,進而減

    少空白範疇、降低法律規範的不確定性,即是法實證研究的目的所在11。當

    研究的素材是裁判時,主要重視的是裁判整體性的描述與分析,而非判決指

    涉之理論與推導。為了理解現實世界的情狀,許多法實證研究採用統計方法,

    例如與本文主題(親權酌定)相關者,過去即有以敘述統計12、卡方檢定13為

    實證研究之文獻。

    9 Daniel Martin Katz, Quantitative Legal Prediction - or - How I Learned to Stop Worrying

    and Start Preparing for the Data-Driven Future of the Legal Services Industry, 62

    EMORY L. J. 909, 930-932 (2013). 10 王鵬翔、張永健(2015),〈經驗面向的規範意義:論實證研究在法學中的角色〉,

    《中研院法學期刊》,17期,頁232-239。 11 蘇凱平(2018),〈法律數據分析與刑事證據:概念的建立、學習與應用〉,發

    表於:《第二屆兩岸刑事訴訟法學術研討會:「現代風險社會下之刑事訴訟法學

    的對應與展望」》,台灣刑事法學會、中國刑事訴訟法學研究會(主辦),臺北,

    頁12。 12 劉宏恩(2011),〈「子女最佳利益原則」在臺灣法院離婚後子女監護案件中之

    實踐:法律與社會研究(Law and Society Research)之觀點〉,《軍法專刊》,57

    卷1期,頁93;Chao-Ju Chen, The Chorus of Formal Equality: Feminist Custody Law

    Reform and Fathers’ Rights Advocacy in Taiwan, 28 CAN. J. WOMEN & L. 116, 145

    (2016). 13 鄭諺霓(2015),《離婚後未成年子女親權酌定之實證研究》,頁120-121,國立

    臺灣大學法律學院法律學研究所碩士論文。

  • 200 臺大法學論叢第 49卷第 1期

    隨著硬體、機器學習演算法的進展,資料科學(data science)的其他技

    術如文字探勘、自然語言處理逐漸融入,使得電腦能夠直接從法律文本(legal

    texts)例如裁判或法規中,萃取出有意義的資訊,並依此進行運算、推理14。

    當研究者運用文字探勘、機器學習(machine learning)等人工智慧技術,分

    析大量的法律文本時,則稱為法律資料分析。有論者主張法律資料分析是「對

    有價值法律資料的發掘、詮釋和溝通過程」15。亦有認為法律資料分析乃涉

    及對於法律文書和資料的探勘,並將探勘得到的資料合併觀察,以獲致關於

    法律人(如律師和法官)、法律組織(如法院或法律事務所)、或特定法律

    主題(如專利)方面原先未知的知識(insight)16。

    本文系列前作的「決策樹文」,即是使用機器學習中的決策樹分析法,

    當時主要貢獻在於,呈現大多數法官作裁判的思考路徑(如下圖二)。

    14 J. Sobowale, How Artificial Intelligence Is Transforming the Legal Profession, ABA J.

    (Apr. 1, 2016), http://www.abajournal.com/magazine/article/how_artificial_intelligenc

    e_is_transforming_the_legal_profession (last visited October 20, 2018). 15 Jeremy Hill, How Legal Analytics is Changing the Legal Landscape, LEGAL IT INSIDER.

    (Aug. 15, 2018), https://www.legaltechnology.com/latest-news/how-legal-ana

    lytics-is-changing-the-legal-landscape/ (last visited October 20, 2018). 16 Owen Byrd, Legal Analytics vs. Legal Research: What’s the Difference?, LAW TECH.

    TODAY. (June 12, 2017), https://www.lawtechnologytoday.org/2017/06/

    legal-analytics-vs-legal-research/ (last visited October 20, 2018). (“Legal analytics

    involves mining data contained in case documents and docket entries, and then

    aggregating that data to provide previously unknowable insights into the behavior of the

    individuals (judges and lawyers), organizations (parties, courts, law firms), and the

    subjects of lawsuits (such as patents) that populate the litigation ecosystem.“)

  • 以人工智慧讀取親權酌定裁判文本 201

    【圖二】親權酌定因素決策樹

    ※ 資料來源:決策樹文,頁 285。

    【圖三】親權酌定因素類神經網路

    ※ 資料來源:類神經網路文,頁 94。

  • 202 臺大法學論叢第 49卷第 1期

    另一系列前作「類神經網路文」,則使用「類神經網路」演算法,用以

    分類同一批裁判(如上圖三)。決策樹模型的準確率為 94%17,人工神經網

    路的準確率為 98.80%18。決策樹雖然準確度不如類神經網路,但其成果卻較

    容易解釋,能明確得知法官重視的要素為何。

    最近一篇系列前作「梯度提升法文」,則使用決策樹更進化而來的梯度

    提升法,說明法官作親權酌定裁判時,各種因素的重要性高低,並能繪製出

    具體個案的思考過程19。相較於決策樹只能看到全體裁判平均的思考路徑,

    梯度提升法能更深入到個案層次,說明機器預測個案的邏輯為何。不過,上

    述三篇的作法,如前所述,仍仰賴人工標記的資料集20。

    綜上,在系列前作中,須將人工理解並轉譯後的資訊(亦即編碼),提

    供給機器運算:決策樹運算法可展現大部分法官的思考路徑;類神經網路分

    析法,優勢在於輸入層(input layer)可負荷大量的參數,模型準確率提高至

    99%;梯度提升法則可探析每個因素的權重,並繪製出個案的決策流程。本

    文與前作之差異,在於不再使用人工編碼過的資料集,減少人工介入,使用

    「未經編碼」的裁判文本資料;在分詞之後,將大量詞彙資訊匯入輸入層,

    使用類神經網路模型使機器判斷,為的是增加自動化程度並拓展「人工智慧」

    在法律領域的應用可能性。這四篇著作之間的關聯性在於,它們使用了共同

    的裁判資料集(但有「編碼」與否的差異),不同的機器學習方法,以便客

    觀地評估與比較其結果(每個方法的準確度與可解釋性均不同),有助未來

    對結合法律與人工智慧有興趣的讀者,在分析各自的議題時,選擇合適的方

    17 黃詩淳、邵軒磊,前揭註8,〈決策樹文〉,頁323。 18 黃詩淳、邵軒磊,前揭註8,〈類神經網路文〉,頁92。 19 黃詩淳、邵軒磊,前揭註8,〈梯度提升法文〉,頁2053-2061。

    20 近期法律資料分析最代表性的書籍KEVIN D. ASHLEY, ARTIFICIAL INTELLIGENCE AND

    LEGAL ANALYTICS: NEW TOOLS FOR LAW PRACTICE IN THE DIGITAL AGE 4 (2017). 指

    出,至今為止電腦的模型建置,均須倚賴人工將裁判、法條、契約或其他法律文

    件的法律概念,輸入該系統中;亦即由專家先閱讀文本,再將內容中相關的部分

    以電腦能理解的形式輸入。電腦的推理系統無法直接閱讀法律文本,使得此系統

    在真實世界中萃取資訊、預測結果以及做決策方面,都受到相當限制。

  • 以人工智慧讀取親權酌定裁判文本 203

    法。本文的研究設計將於第參部分詳述;而上述三種作法的優劣,也於第伍

    部分之「一、與先行類似研究之比較」中呈現。

    參、研究設計與架構

    本研究將 2012年至 2014年共三年期間21的地方法院及少家法院關於親

    權酌定的第一審裁判,共 448 件,經過「自然語言處理」、「文字探勘」與

    「類神經網路」(Artificial Neural Network, ANN),三個步驟,最後給出一

    個「裁判分類值」(即目標值,意味著電腦閱讀現有裁判的情狀之下,判斷

    親權酌定給父親母親)。之後將「機器分類結果」與「實際裁判結果」做比

    較,用來檢視模型的準確程度。

    【圖四】本文研究架構

    ※ 資料來源:作者自製

    文字探勘係運用語言學、統計、機器學習等技術,對文件執行編輯、組

    織與分析的過程,目的在瞭解內容事實和趨勢,並探勘隱性特徵的有用價值

    22。文字探勘主要程序包含資料檢索與處理、分詞(word segmentation)、特

    21 之所以選擇2012-2014年的裁判,而沒有放入更新的裁判,是為了客觀地比較「不

    同的資料分析方法」適用於同一批資料時的結果差異。易言之,就是為了與過去

    的系列文相比較,故仍使用2012-2014三年間之裁判資料。 22 DAN SULLIVAN, DOCUMENT WAREHOUSING AND TEXT MINING: TECHNIQUES FOR

    IMPROVING BUSINESS OPERATIONS, MARKETING, AND SALES 326 (2001); Xia Hu & Huan

    Liu, Text Analytics in Social Media, in MINING TEXT DATA 385, 387-388 (Charu C.

    Aggarwal & Chengxiang Zhai eds., 2012). 關於中文的文字探勘在社會科學領域的

    應用,參見陳世榮(2015),〈社會科學研究中的文字探勘應用:以文意為基礎

  • 204 臺大法學論叢第 49卷第 1期

    徵萃取(feature selection)、分類與集群、文本表示與詮釋等23。承此,在第

    一步,本研究與前作相同,先蒐集了上述 448件裁判。蒐集方法,是在法源

    法律網24,使用「裁判書」子資料庫,選擇「民事類」當中全部的地方法院

    以及少家法院,限定裁判日期為 2012年 1月 1 日至 2014 年 12月 31 日25,

    接著在「全文檢索」欄位鍵入「離婚&審酌&(子女最佳利益+子女之最佳

    利益)」字串,再於「案由」欄位輸入「離婚+監護-改定」。之後人工剔

    除民法第 1094 條(監護)之事件,以及原告之訴駁回之事件,如此所得事

    件數為 2,031 件。之後再剔除父母其中一方無意願或意願不明者,以及父母

    其中一方為外籍或陸籍配偶者。以上述方法篩選後,所剩件數為 540件26。

    此 540件裁判中,子女親權的歸屬結果,可分成四種:由父或母單獨行使有

    448 件(82.96%);由父母雙方共同行使者有 55 件(10.19%);子女有數

    人而其親權分別由父、母行使者有 35件(6.48%);親權不歸屬於父母,而

    由第三人開始監護者有 2件(0.37%)。本文為了與前作系列文相比較,亦

    的文件分類及其問題〉,《人文及社會科學集刊》,27卷4期,頁684;邵軒磊、

    吳國清(2019),〈法律資料分析與文字探勘:跨境毒品流動要素與結構研究〉,

    《問題與研究》,58卷2期,頁96-97。 23 曾元顯(2002),〈文件主題自動分類成效因素探討〉,《中國圖書館學會會報》,

    68期,頁62-83;RONEN FELDMAN & JAMES SANGER, THE TEXT MINING HANDBOOK:

    ADVANCED APPROACHES IN ANALYZING UNSTRUCTURED DATA 13-17 (2006). 24 法源法律網網站,www.lawbank.com.tw(最後瀏覽日:12/06/2016)。 25 須留意者,家事事件法於2012年6月1日生效,不過原本的民事訴訟法中的人事訴

    訟程序仍重疊適用,至2013年5月8日始刪除,此等新舊法令的適用,是否影響法

    院在親權酌定裁判之結果,固有探討之必要。惟本文在蒐集裁判時,是選取「民

    事類」當中全部的地方法院以及少家法院,且並未限定裁判類別(包括判決及裁

    定),應可涵括地方法院家事法庭與高雄少家法院作出的所有關於親權酌定之裁

    判,不致疏漏。其次,上述程序的差異,亦不至於影響本文模型與預測結果,原

    因在於本文所使用的文本不是裁判全文,如後所述,僅限於法院在「事實與理由」

    之中法院判斷「親權酌定」的段落,並未包括字號(才會列出法院名稱與裁判種

    類)、主文與相關法條的段落。亦即,經過再度檢視,可確認訴訟程序相關文字

    並未進入分析樣本中,也沒有出現在本文使用的輸入層(input)。因此,應可認

    為新舊程序法的變動並不影響本文的分析結果。 26 更詳細的蒐集方法以及理由,參照黃詩淳、邵軒磊,前揭註8,〈決策樹文〉,頁

    306-312。

  • 以人工智慧讀取親權酌定裁判文本 205

    同樣使用父母單獨行使親權之 448件,作為資料集。不過,本文與前作不同

    之處在於,係用下列方法將裁判原文(texts)直接輸入電腦,而不再提供電

    腦「由人工編碼過的資料」(即經過人工標記的 22 項特徵值)。換言之,

    本文的資料集是由 448 件裁判所構成。

    首先,如同文字探勘的一般作法,本研究先將裁判做分詞(segmentation)

    處理。惟此際並非使用完整的裁判全文,而是先由人工閱讀,並剪取出該裁

    判中,法官判斷「親權酌定」的該當段落,且不包括社工調查報告的內容。

    這是因為,每則裁判包含了許多訊息,例如原告(或聲請人)主張、被告(相

    對人)答辯、法院之判斷;此外,由於酌定親權行使事件常被合併於離婚事

    件審理,故一個裁判中可能包含對離婚、親權酌定、扶養費等數個爭點的判

    斷。若將法官對親權酌定以外的判斷段落輸入電腦,會造成資訊過於龐雜,

    不利於模型的建置。實際上,類似議題之既存研究亦指出,僅以文件的部分

    內容進行分析,與全文本分析之結果並無太大差異27。

    段落選取以及分詞的方式,以臺北地方法院 101 年度監字第 77 號民事

    裁定為例,整理如下表一。由此表可知,本文所剪取的裁判段落,包含了親

    權酌定結論之訊息,亦即「因認兩造所生未成年子女劉秉承其權利義務之行

    使負擔,由聲請人單獨任之,應符合未成年子女之最佳利益」。不過,我們

    並未讓電腦得知,聲請人是父親或母親(下述第伍部分將進一步討論,若提

    供此訊息給電腦,結果是否有不同)。因此電腦僅能從本段的其他文字,去

    計算、推測究竟法院將親權判給父親或母親。此點是本文與過去的系列研究

    不同之處:過去僅提供電腦 22 項特徵值,完全不包含親權酌定結果資訊;

    27 Bjorn Burscher et al., Using Supervised Machine Learning to Code Policy Issues: Can

    Classifiers Generalize Across Contexts?, 659 ANNALS AM. ACAD. POL. & SOC. SCI.

    122, 128, 130 (2015). 分析素材是1995至2011年荷蘭三大報的頭版文章(共11,089

    篇),其中一個方式是給予電腦全文,另一個方式是僅給予前10%的內容(大約

    是該報導的第一個段落),用以測試電腦能否正確將該新聞報導分類為正確的議

    題種類(例如:公民權與少數議題、健康、農業、勞動與雇用、教育、環境、能

    源等)。結果發現,給予全文時,F1分數為0.71,給予前10%的內容時,F1分數為

    0.68,兩者並無太大差異。

  • 206 臺大法學論叢第 49卷第 1期

    本文則是不提供預先標示的特徵值,但文本中包含親權酌定結果的資訊,以

    測試電腦是否能如人類一般「讀懂」(推理)該件裁判的法官將親權判給了

    誰。在這個角度而言,本文的研究目的與前作不盡相同,本文並非要找出法

    官在酌定親權時的思考邏輯或重視的因素,而是要究明機器能否如讀者你我

    一般,看到裁判的特定段落,能運用語言學與推理,分辨出法官將親權酌定

    給何人。

    【表一】臺北地方法院 101年度監字第 77號民事裁定之文本分詞結果

    原文 分詞後結果

    本院依調查結果及參酌上開訪

    視報告內容,認為聲請人無論在親

    子依附、支持系統、居住環境、親職

    能力等各方面均能單獨勝任親權行

    使,且自劉秉承出生至今,皆由其

    擔任主要照顧者,無任何不適任表

    現,因認兩造所生未成年子女劉秉

    承其權利義務之行使負擔,由聲請

    人單獨任之,應符合未成年子女之

    最佳利益。(2012/7/3,101,監,77)

    本院,依,調查結果 ,及,參酌,上

    開,訪視,報告,內容,認為,聲請人,無

    論,在,親子,依附,支持系統,居住,環

    境,親職能力,等,各,方面,均,能,單獨,

    勝任,親權,行使,且,自劉,秉承,出生,

    至今,皆,由,其,擔任,主要,照顧者,無,

    任何,不適任,表現,因認,兩造,所生,

    未成年,子女,劉,秉承,其,權利義務,

    之,行使,負擔,由聲請人單獨,任,之,

    應,符合,未成年,子女,之,最佳,利益

    (2012/7/3,101,監,77)

    ※ 資料來源:作者自製

  • 以人工智慧讀取親權酌定裁判文本 207

    其次,將分詞完成後的文本內容數據化為詞彙出現頻率28,亦即,將每

    個裁判「分詞後結果」累加起來,可以得到本文資料集內之文本詞彙矩陣

    (document term matrix, DTM),以向量空間來呈現資料(vector-based

    representation)29。第一階段的 DTM 之維度為(448, 5640),意指有 448個

    不同判決(列),而有 5690 個詞彙所組成(欄)。之後使用「文字探勘」

    (text mining)方法,去除停用詞,取適當之出現詞頻比率,並與法學專業

    研究者共同討論,最後選取出 412個重要詞彙,製作成如下圖五之 DTM。

    【圖五】文本詞彙矩陣示意圖

    ※資料來源:作者自製

    讀者可以大略看出,本研究所取出的詞大部分合乎「常識」,是可以理

    解的法律用語。若要進一步描述,在此一階段,我們將每個文本(裁判)視

    為「詞袋模型」(bag of words model),在理論上詞袋中的元素組合構成了

    某些訊息(就是他們原來實際上使用的意義),而研究者可接續使用機器學

    習甚至深度學習(deep learning)來探究其意義。雖然這種詞袋的處理方式,

    看似違反直覺,但相關研究證實此種方式對文本分類頗為有效30。

    28 GARY MINER ET AL., PRACTICAL TEXT MINING AND STATISTICAL ANALYSIS FOR NON-

    STRUCTURED TEXT DATA APPLICATIONS 30 (2012). 29 Catherine Blake, Text Mining, 45 ANN. REV. INFO. SCI. & TECH. 121, 127 (2011). 30 Daniel J. Hopkins & Gary King, A Method of Automated Nonparametric Content

    Analysis for Social Science, 54 AM. J. POL. SCI. 229, 232 (2010).

  • 208 臺大法學論叢第 49卷第 1期

    之後,本研究將上述 412個重要詞彙作為神經元輸入項,使用類神經網

    路來訓練機器、建置模型並分類裁判結果。類神經網絡是一種監督式機器學

    習(supervised machine learning),其大要已在系列前作有詳細介紹31。為了

    讓機器有可茲學習之標的,我們亦以人工標記了每一則裁判的親權酌定結果

    (目標值)是父或母,亦即標記出法院裁判的結果,作為輸出項。總體模型

    結構請參看下圖六:

    【圖六】判決分類模型結構

    ※資料來源:作者自製

    綜上,自圖六的最左端開始,第一步,我們以人工蒐集了 448篇裁判,

    並以人工擷取了該裁判當中法官對親權酌定判斷的文字段落,作為本研究之

    資料集。第二步進行裁判文本的分詞,成為 448×5690 的大型矩陣。第三

    步,藉由專家協助以及文字探勘技巧,縮小關鍵詞至 412 組,意即成為

    448×412的較小矩陣。最後,再將此矩陣的內容輸入類神經網路機器模型。

    在上述過程中,裁判的蒐集與文本擷取、減少關鍵詞、目標值的標記這三個

    步驟,依然有若干人工之介入。不過本文與前作不同者,在於直接使用分詞

    的結果(412個詞彙)作為神經網路的輸入項(亦即機器學習所需的特徵值),

    31 黃詩淳、邵軒磊,前揭註8,〈類神經網路文〉,頁90。

  • 以人工智慧讀取親權酌定裁判文本 209

    而不再是人工定義並閱讀文本後所標記的「變項」(在前作有例如子女性別、

    子女意願、父母品行等共 22 個專家定義並標記的變項)。如此,將能大幅

    降低人工標記的成本,在短時間內處理大量資料。

    肆、研究成果與評估

    本研究亂數抽選總資料集的樣本中之 70%作為訓練組(training dataset,

    約 313-314件),用以訓練模型,再將剩餘樣本(約 134-135 件)作為測試

    組(test dataset),製作機器學習模型。在評估模型表現時,需要有一定客

    觀之方法。本文使用混淆矩陣(confusion matrix)來定義模型的準確率

    (accuracy rate)及計算 F1分數。在下表二中,將人工神經網路運算判斷之

    結果(判斷值),與真實世界中的法官裁判結果(實際值)做對照。矩陣的

    一維代表模型的預測值(機器判斷),而另一維則代表實際值(真實結果)。

    【表二】親權歸屬混淆矩陣

    親權歸屬

    混淆矩陣

    機器判斷

    判母 判父

    109

    正確正例數

    (true positive,TP)

    6

    錯誤負例數

    (false negative,FN)

    15

    錯誤正例數

    (false positive,FP)

    5

    正確負例數

    (true negative,TN)

    說明:seed=9076。

    ※ 資料來源:作者自製。

    「準確率」(Accuracy)表示機器作出正確判斷的比例,定義為(TP +TN)

    ∕全樣本數。以上表二之數據為例,測試組的準確率為 84.44%。

  • 210 臺大法學論叢第 49卷第 1期

    另外如果要更進一步檢驗機器學習模型正確程度,還可使用 F1 分數

    (F1-Score,又稱 F度量(F-measure))。這是一種同時兼顧精確率(precision,

    P)與召回率(recall, R)的度量方式。對照前表代號,準確率的計算公式如

    下:P = TP∕( TP + FP );而召回率的計算公式如下:R = TP∕( TP + FN )。

    而 F1 分數的計算公式則為 P 與 R的調和平均 F1 = 2∕( 1∕P + 1∕R)。以

    9076種子之分組為例,訓練組的 F1分數為 0.999,測試組的 F1分數為 0.868。

    為了避免只隨機測試一次而發生測量結果的偏差,我們重複運行模型

    50 次(且訓練組與測試組的樣本不相混淆),發現雖然訓練組準確率一直

    都接近 100%,但測試組準確率多在 80%前後徘徊(詳細數值請參考附錄),

    50 次的平均為 77.25%。

    伍、比較與討論

    一、與先行類似研究之比較

    本次建制的模型與前幾次研究相比,在準確率上各有長處。在訓練組準

    確率上,因為特徵值變多(412個詞彙),很容易達到相當高的準確率。不

    過,在測試組準確率上,則是傳統人工編碼的模型(特徵值為 22 項「酌定

    親權之考量因素」)表現較好(見下表三)。

  • 以人工智慧讀取親權酌定裁判文本 211

    【表三】數種模型之正確率比較

    Train

    accuracy

    Test accuracy 人工介

    入程度

    「人工編碼+決策樹」模型 94.41% 95.17% 多

    「人工編碼+類神經網路」模型 98.73% 98.55% 多

    「人工編碼+梯度提升法」模型 95.12% 95.70% 多

    「自然語言+文字探勘+類神經

    網路」本文模型 99.99% 77.25% 少

    說明:類神經網路文 seed=1184,本文 seed=9076。

    ※ 資料來源:作者自製。

    不過若是考慮到人工編碼所需要的勞動力與時間,相較於「人工編碼+

    類神經網路」,本文「自然語言+文字探勘+類神經網路」的模型可謂犧牲部

    分準確率,換取節省的勞力。若在更大量例如數千、數萬件的法律資料分析

    的狀況,則更為經濟;但若欲分析的對象只限於少數樣本,則還是建議研究

    者精讀並使用傳統人工編碼之方法。

    另外,若將本文的模型與其他同樣採用「自然語言+文字探勘+機器學

    習」方法的法學研究相較,測試組平均 F1 分數為 0.868,已算表現不錯。舉

    例言之,過去有對中文的強盜罪與恐嚇取財罪相關之裁判,以機器自動標記

    並進行案件分類,F1 分數為 0.80132;英文方面,有研究分析了美國 2008-

    2011 年藥品專利訴訟,使用機器標記並分類之結果,測試組之準確率為

    77.78%33;本研究之測試組準確率平均為 77.25%,與之不相上下。

    32 林琬真、郭宗廷、張桐嘉、顏厥安、陳昭如、林守德(2012),〈利用機器學習

    於中文法律文件之標記、案件分類及量刑預測〉,《中文計算語言學期刊》,17

    卷4期,頁66。 33 Viju Raghupathi et al., Legal Decision Support: Exploring Big Data Analytics Approach

    to Modeling Pharma Patent Validity Cases, 6 IEEE ACCESS 41518, 41524 (2018).

  • 212 臺大法學論叢第 49卷第 1期

    由上述事實顯示,本研究的模型成效與近年其他相同方式的研究相差無

    幾甚至更好,應值肯定;惟仍不如傳統人工編碼之作法,此際或許需要進一

    步精選關鍵字,來提升模型表現。

    二、人工智慧如何「讀懂」裁判

    欲探討此問題,可能必須回到模型使用的文本。本研究最初以人工揀選

    出各裁判中,法官就親權酌定判斷之相關段落,以下舉出其中三個裁判34為

    例:

    依該訪視報告之調查內容,兩造均有意願及能力照顧扶養未成年子女陳

    ○○,然相對人長期為未成年子女陳○○之主要照顧者,且陳○○已相當熟

    悉由相對人及其家人所組成之家庭生活環境及照顧模式,渠等間並建立起緊

    密之依附關係,相對人對於陳○○之身心發展及生活狀況知之甚詳,由其行

    使負擔未成年子女陳○○之權利義務應較聲請人適合。(臺北地方法院 101

    年度監字第 239 號民事裁定,下稱 A裁判)

    綜合上開事證,本院認兩造固均表達單獨監護子女之意願,惟相對人現

    無固定收入,職業及經濟狀況不如聲請人穩定,而聲請人於兩造分居後,獨

    自負擔子女扶養費,伊保護教養子女之態度積極,應可認定;又相對人因婚

    外情事件致罹刑章,對子女自非良好之榜樣;參以未成年子女林○○年紀尚

    幼,又與聲請人同屬女性,就性別、年齡上,亦以聲請人較為合適。綜此,

    本院從兩造之職業及經濟能力、父母之品行、保護教養子女之意願及態度、

    子女之年齡、性別等因素審酌,認林○○權利義務之行使或負擔由聲請人任

    之。(臺南地方法院 101年度家親聲字第 48號民事裁定,下稱 B裁判)

    審酌前開各情,並參考前揭訪視報告,認相對人在與聲請人離婚前即多

    次離家,鮮少照顧、關懷乙○○等 2人,且未分擔扶養費,相對人長期在母

    職角色上缺位,對未成年人未盡保護教養義務;又相對人有吸食毒品惡習,

    34 請讀者留意,如上述第肆部分所示,本文用來確認機器是否「讀懂」裁判的測試

    組,共有134-135件,而非只有此3件。此處之所以只舉出3件,是因為篇幅限制而

    無法逐一檢討134-135件之故。

  • 以人工智慧讀取親權酌定裁判文本 213

    屢戒不悛,對未成年子女有不良身範;再相對人現因案通緝,除規避事責外,

    且未實際擔負照護未成年子女之責,其請求監護次女甲○○形同空談,相對

    人顯不適任監護人堪可肯認。而聲請人為乙○○等 2人之父,有監護意願,

    且為實際照顧者,對於未成年人感情深厚,又得其親屬有力支持,本院乃認

    由聲請人獨任未成年人乙○○等 2 人之監護人符合未成年人之最佳利益,

    爰依法酌定未成年子女乙○○等 2 人之權利、義務之行使或負擔由丙○○

    單獨任之。(屏東地方法院 103年度家親聲字第 159號民事裁定,下稱 C裁

    判)

    在前述的 A、B兩則裁判,未成年子女之親權最後歸屬「母親」,而 C

    裁判是判給「父親」。在上述三個段落之中,B、C二者若經由仔細閱讀,

    一般人或許能判斷法院將親權酌定給何人。例如 B裁判提及:「參以未成年

    子女林○○年紀尚幼,又與聲請人同屬女性,就性別、年齡上,亦以聲請人

    較為合適。綜此,本院……認林○○權利義務之行使或負擔由聲請人任之。」

    如此,可推知聲請人為母親,而法院認定聲請人(母親)較適合擔任親權人。

    又例如 C裁判提及:「相對人長期在母職角色上缺位,對未成年人未盡保護

    教養義務……本院乃認由聲請人獨任未成年人乙○○等 2 人之監護人符合

    未成年人之最佳利益」可推知相對人為母親,聲請人為父親,法院認為聲請

    人(父親)適合擔任親權人。相較之下,A則是很難判斷;僅能得知法院認

    為相對人適合擔任親權人,但卻缺乏相對人是父或母的線索。

    如果機器對 B、C兩則裁判做出了正確的判斷,或許代表著,機器對文

    本的理解已經跟人類相同,比喻的說法,就是機器「讀懂」了法院的裁判。

    不過,機器實則並非使用與人類相同的方式閱讀並理解文本,我們給機器的

    文本,乃是經過分詞處理的詞彙矩陣,已經去除了原來語句與敘述結構,而

    由文字探勘方式挖掘出意義。因此,更正確的說法毋寧是,機器確實能夠透

    過將文本單元化、法則化之作法,正確地汲取文本的意義(判父或判母)。

    至於 A 裁判,即使人類閱讀也只能猜測而無從推理;但我們可以想見,如

    果能得知聲請人是父親、相對人是母親,則人類就能正確判斷結果。

  • 214 臺大法學論叢第 49卷第 1期

    因此,本文以上述人類的推論過程為基礎,製作了對照實驗:以上述第

    肆部分主要研究成果作為對照組(只有文字探勘變數,稱 non-plaintiff set,

    NP-set);加上了「原告(聲請人)∕被告(相對人)參數」之後的作法稱

    實驗組(即文字探勘關鍵字變數+原告/被告參數,即 plaintiff set, P-set)。這

    樣設計的意義是,對照組代表「僅有單純的自動化模型」,實驗組代表「自

    動化模型加上主體知識(domain knowledge)」,亦即加上了人工所標記的

    原告∕被告是父或母之資訊。同樣地,實驗組亦重複隨機抽樣 50 次做出結

    果。此目的在於,試圖瞭解加入「主體知識」對於自動化模型的影響。其結

    果如下表四所示,加入「原告∕被告資訊」,會讓準確率以及 F1-score 都獲

    得提升,證明了現今「人工智慧」若有人類協作其表現會更好。

    【表四】實驗組與對照組之平均準確率與平均 F1 分數

    average Test accuracy F1-score

    P-set 79.05 0.879

    NP-set 77.25 0.867

    ※ 資料來源:作者自製。

    如果分次細讀其模型穩定程度也可以發現,雖然互有消長,但總體而言

    加入「原告∕被告資訊」的主體知識後,可以讓模型更為穩定。茲將歷次的

    準確率、F1 分數表示如下圖七與圖八:

  • 以人工智慧讀取親權酌定裁判文本 215

    【圖七】實驗組與對照組之歷次準確率

    ※ 資料來源:作者自製。

    【圖八】實驗組與對照組之歷次 F1 分數

    ※資料來源:作者自製。

    由前述實驗組與對照組之範例可以發現,提供了「原告∕被告」的特徵

    值資訊後,機器與人類相似,判斷之準確率及 F1 分數均提升。這意味著,

    電腦文字探勘所採用的方式(借助各種演算法挖掘文本的意義),雖然與人

    類閱讀文本的方式不同,但同樣都能根據某些資訊,分辨出法官的「語意」

  • 216 臺大法學論叢第 49卷第 1期

    是「偏向原告∕被告」。因此在目前,完全仰賴機器進行全自動化的法律資

    料分析雖仍有困難,但若能「人機協作」,將可獲得較值得信賴之結果。

    陸、結 論

    本研究運用了自然語言處理與文字探勘方法,以機器分析裁判文本(而

    非經過人工挑選與標記的特徵值),接著使用人工神經網路的機器學習方式

    讓電腦對裁判進行分類,亦即電腦必須判斷,測試集內的裁判係將親權酌定

    給父親或母親。結果顯示,平均準確率約 77%,在 F1分數的表現也優於其

    他類似方法的研究。

    本研究所剪取的裁判內文(文本),除了法官審酌兩造的表現外,尚包

    含「認未成年子女○○○權利義務之行使或負擔由聲請人任之」這樣類似結

    論的句子,不過,並無任何一則裁判寫明聲請人是父親或母親。亦即,機器

    不知道原告(或聲請人)、被告(或相對人)係父或母,其判斷最終親權酌

    定結果的線索,係來自於文本內的其他資訊,例如聲請人的性別、母職、父

    職等相關描述。因此我們可以說,機器確實捕捉到了法官的語意,理解了法

    官心證究竟偏向父或母。如果吾人能接受「能從自然語言文本中提取概念,

    並且將概念延伸應用到原來不知道的事物上」,這個行為是一種「智慧」的

    話,那麼我們確實讓機器讀入一段話(法院裁判),也能在不知道「結果」

    的前提下猜測其結果,準確率約 8成,可謂這個機器有了某種「智慧」。

    機器能有效地分類裁判文本,意味著在短時間內處理大量法律資料的需

    求將能獲得一定程度之滿足。例如,若有人想得知法院在什麼樣的情形下會

    將親權酌定給母親、想搜尋「母親獲得單獨親權」結果的裁判,在目前裁判

    搜尋系統(檢索資料庫)的檢索欄位,鍵入「母親獲得單獨親權」或「母親

    &獲得&單獨&親權」,並無法找到所需裁判;而必須靠人工鍵入關鍵字,找

    出所有「親權酌定」類型的裁判後,再用人工閱讀每一則裁判的原、被告姓

    名與主文,才能判斷該事件係由何人獲得親權。有時從原、被告姓名難以辨

    識性別,則必須再往下閱讀,從裁判內文中的蛛絲馬跡推測原、被告為父親

  • 以人工智慧讀取親權酌定裁判文本 217

    或母親。本研究的突破在於,證明機器確實能從裁判的自然語言文本中,提

    取出有意義的資訊(親權歸父或親權歸母),省卻人工閱讀的步驟,在適當

    的設計之下,將能提升裁判查詢的效率。

    過去「人工智慧與法律」領域的發展的主要方向在於建立「法律專家系

    統(legal expert system)」,將專家的知識輸入於電腦系統,基於此知識,

    由電腦像專家般提供諮詢、建議解決方法35。但此作法必須仰賴人工(專家)

    預先設定各種規則,耗時且昂貴,故僅在個別少數的法領域被運用36。近來

    則不再是專注於讓電腦解決使用者的法律問題,而更重視讓電腦從法律文件

    中提取語意資訊,「幫助」人們解決法律問題,包括「概念資訊提取(conceptual

    information retrieval)」與「認知運算(cognitive computing)37」等技術。過

    去的專家系統需要人類將規則寫在系統程式,才能讓電腦有某種功能;相較

    之下,認知運算則是從自然語言文本的大數據中幫助人們找到適合的解答,

    換言之,它建基在語料庫(既有數據)中已存在「與問題最相關的資訊」的

    假設,而電腦的作用是在幫助人們發現該些有用的資訊。也因此,認知運算

    強調「人機協作」,機器可以提供百科全書般的知識與運算能力、可能做到

    理性分析,人類則是提供專業、判斷、直覺、道德指引與創造力,如此共作

    以達成更好的決策38。結合了上述技術的「法律資料分析學」,目的正是希

    望從法院裁判或法規當中,以機器自動提取有意義的資訊,進而協助回答法

    律問題、估計裁判結果、擬具訴訟攻防主張39。

    本研究也做了「是否加入主體知識」的實踐,發現若是給予機器「原告

    ∕被告是父∕母」的資訊(即人工標記的知識),將更提升機器判讀的成果。

    35 相關介紹參見Lothar Philipps(著)、陳顯武(譯)(1988),〈專家系統:法學

    方法論上之挑戰〉,《政大法學評論》,37期,頁175。 36 R. Hoekstra, The Knowledge Reengineering Bottleneck, 1 SEMANTIC WEB J. 111, 112

    (2010). 37 所謂認知運算,是指模擬人腦的人工智慧,能處理自然語言和非結構化資料,然

    後從經驗中學習,根據最佳的可用資料,幫助人類做出更有效的決策。 38 JOHN E. KELLY III & STEVE HAMM, SMART MACHINES: IBM'S WATSON AND THE ERA OF

    COGNITIVE COMPUTING 5 (2013). 39 ASHLEY, supra note 20, at 5.

  • 218 臺大法學論叢第 49卷第 1期

    這個實驗證明了兩點:一、機器是有「根據」而非單純猜測其結果;二、人

    類主體知識可能融入機器的人工智慧,「人機協作」雖然會犧牲若干效率,

    但能提升結果的正確性。換言之,本文的技術正是一種「概念資訊提取」的

    範例,在適當的配套設計下,有助人們快速地找到自己所需的裁判,也證明

    了認知運算的人機協作方式能夠增加決策的正確度。

    在未來可能改善的方向上,就普遍性研究發展而言,在自然語言處理,

    或許可尋找其他方式,提高機器挑選有意義的關鍵詞的能力,降低專家需要

    介入的程度;或是在模型建置上,可嘗試其他更困難的演算法如遞歸神經網

    路(Recurrent Neural Networks, RNN)和長短期記憶模型(Long Short-Term

    Memory, LSTM)等。其次,就研究對象而言,未來則應納入更新的親權酌

    定裁判,並可將類似的方法運用至其他與本文相關的議題例如「夫妻剩餘財

    產差額配請求」或「特留分扣減權行使」判決,將以另文探討之。

    此外,關於研究限制,如第伍部分指出,目前吾人尚無法完全理解到人

    工神經網路如何判斷該件裁判為何親權歸屬於父親或母親,本研究結果亦難

    謂為絕對之裁判基準。因此本文主要的貢獻並非提出裁判規範或行為規範,

    而是在於「法學跨領域研究」的範例展示。換言之,在裁判數量愈來愈多、

    資訊爆炸的今日,提供一個「讓機器理解人類需求、替人類找尋合適資料」

    的手段。預期此方法的應用,將能改變人們看待「裁判資料」的方式,促進

    法律資訊的普及。

  • 以人工智慧讀取親權酌定裁判文本 219

    參考文獻

    一、中文文獻

    Lothar Philipps(著)、陳顯武(譯)(1988),〈專家系統:法學方法論上

    之挑戰〉,《政大法學評論》,37期,頁 175-181。

    王鵬翔、張永健(2015),〈經驗面向的規範意義:論實證研究在法學中的

    角色〉,《中研院法學期刊》,17期,頁 205-294。

    宋皇志(2017),〈方興未艾之區塊鏈專利〉,《月旦法學雜誌》,266期,

    頁 52-68。doi: 10.3966/102559312017070266003

    林琬真、郭宗廷、張桐嘉、顏厥安、陳昭如、林守德(2012),〈利用機器

    學習於中文法律文件之標記、案件分類及量刑預測〉,《中文計算語言

    學期刊》,17卷 4期,頁 49-67。doi: 10.30019/IJCLCLP.201212.0004

    邵軒磊、吳國清(2019),〈法律資料分析與文字探勘:跨境毒品流動要素

    與結構研究〉,《問題與研究》, 58 卷 2 期,頁 91-114。doi:

    10.30390/ISC.201906_58(2).0003

    林勤富、劉漢威(2018),〈人工智慧法律議題初探〉,《月旦法學雜誌》,

    274期,頁 195-215。doi: 10.3966/102559312018030274010

    科技部(2017),〈行政院院會議案:我國 AI 的科研戰略〉,載於:

    https://www.ey.gov.tw/Page/448DE008087A1971/a76aec69-0950-44c5-

    bcb8-8e106cd735c5。

    郭雨嵐、汪家倩、侯春岑(2017),〈法律科技與人工智慧時代,科技法律

    人才的養成與挑戰〉,《萬國法律》,214期,頁 51-59。

    張冠群(2017),〈自金融監理原則與金融消費者保護觀點論金融科技監理

    沙盒制度:兼評行政院版「金融科技創新實驗條例草案」〉,《月旦法

    學雜誌》,266期,頁 5-34。doi: 10.3966/102559312017070266001

    陳世榮(2015),〈社會科學研究中的文字探勘應用:以文意為基礎的文件

    分類及其問題〉,《人文及社會科學集刊》,27 卷 4期,頁 683-718。

    http://dx.doi.org/10.30019%2fIJCLCLP.201212.0004

  • 220 臺大法學論叢第 49卷第 1期

    陳譽文(2017),〈人工智慧規範性議題綜觀〉,《科技法律透析》,29 卷

    4 期,頁 43-51。

    曾元顯(2002),〈文件主題自動分類成效因素探討〉,《中國圖書館學會

    會報》,68期,頁 62-83。

    黃詩淳、邵軒磊(2017),〈運用機器學習預測法院裁判:法資訊學之實踐〉,

    《月旦法學雜誌》,270 期,頁 86-96。doi: 10.3966/1025593120171102

    70006

    --------(2018),〈酌定子女親權之重要因素:以決策樹方法分析相關裁判〉,

    《臺大法學論叢》,47卷 1期,頁 299-344。doi: 10.6199/NTULJ.201803_47

    (1).0005

    --------(2019),〈人工智慧與法律資料分析之方法與應用:以單獨親權酌

    定裁判的預測模型為例〉,《臺大法學論叢》,48卷 4期,頁 2023-2073。

    doi: 10.6199/NTULJ.201912_48(4).0005

    臧正運(2017),〈區塊鏈運用對金融監理之啟示與挑戰〉,《月旦法學雜

    誌》,267 期,頁 136-152。doi: 10.3966/102559312017080267008

    劉宏恩(2011),〈「子女最佳利益原則」在臺灣法院離婚後子女監護案件

    中之實踐:法律與社會研究(Law and Society Research)之觀點〉,《軍

    法專刊》,57卷 1期,頁 84-106。

    劉靜怡(2018),〈「人工智慧相關法律議題工作坊」簡介〉,《人文與社

    會科學簡訊》,19卷 2期,頁 53-60,載於:https://www.most.gov.tw/most/

    attachments/f8231e21-69a2-4274-bb83-ad2175016920。

    鄭諺霓(2015),《離婚後未成年子女親權酌定之實證研究》,國立臺灣大

    學法律學院法律學研究所碩士論文(未出版),臺北。

    蘇凱平(2018),〈法律數據分析與刑事證據:概念的建立、學習與應用〉,

    發表於:《第二屆兩岸刑事訴訟法學術研討會:「現代風險社會下之刑

    事訴訟法學的對應與展望」》,台灣刑事法學會、中國刑事訴訟法學研

    究會(主辦),臺北。

  • 以人工智慧讀取親權酌定裁判文本 221

    二、英文文獻

    Ashley, K. D. (2017). Artificial Intelligence and Legal Analytics: New Tools for

    Law Practice in the Digital Age. Cambridge, England: Cambridge University

    Press. doi: 10.1017/9781316761380

    Blake, C. (2011). Text Mining. Annual Review of Information Science and

    Technology, 45(1), 121-155. doi: 10.1002/aris.2011.1440450110

    Burscher, B., Vliegenthart, R., & de Vreese., C. H. (2015). Using Supervised

    Machine Learning to Code Policy Issues: Can Classifiers Generalize Across

    Contexts? The ANNALS of the American Academy of Political and Social

    Science, 659(1), 122-131. doi: 10.1177/0002716215569441

    Byrd, O. (2017, June 12). Legal Analytics vs. Legal Research: What’s the

    Difference? [Online forum comment]. Retrieved from https://www.lawtech

    nologytoday.org/2017/06/legal-analytics-vs-legal-research/

    Chen, C.-J. (2016). The Chorus of Formal Equality: Feminist Custody Law

    Reform and Fathers’ Rights Advocacy in Taiwan. Canadian Journal of

    Women and the Law, 28(1), 116-151. doi: 10.3138/cjwl.28.1.116

    Feldman, R. & Sanger, J. (2006). The Text Mining Handbook: Advanced

    Approaches in Analyzing Unstructured Data. Cambridge, England:

    Cambridge University Press. doi: 10.1017/CBO9780511546914

    Hill, J. (2018, August 15). How Legal Analytics is Changing the Legal Landscape

    [Online forum comment]. Retrieved from https://www.legaltech

    nology.com/latest-news/how-legal-analytics-is-changing-the-legal-

    landscape/

    Hoekstra, R. (2010). The Knowledge Reengineering Bottleneck. Semantic Web

    Journal, 1(1,2), 111-115. doi: 10.3233/SW-2010-0004

  • 222 臺大法學論叢第 49卷第 1期

    Hopkins, D. J., & King, G. (2010). A Method of Automated Nonparametric

    Content Analysis for Social Science. American Journal of Political Science,

    54(1), 229-247. doi: 10.1111/j.1540-5907.2009.00428.x

    Hu, X. & Liu, H. (2012). Text Analytics in Social Media. In Aggarwal C. & Zhai

    C. (Eds.), Mining Text Data (pp. 385-414). Boston, MA: Springer US. doi:

    10.1007/978-1-4614-3223-4_12

    Katz, D. M. (2013). Quantitative Legal Prediction - or - How I Learned to Stop

    Worrying and Start Preparing for the Data-Driven Future of the Legal

    Services Industry. Emory Law Journal, 62, 909-966.

    Kelly III, J. E., & Hamm, S. (2013). Smart Machines: IBM's Watson and the Era

    of Cognitive Computing. New York, NY: Columbia University Press. doi:

    10.7312/columbia/9780231168564.001.0001

    Miner, G., Elder, J., Fast, A., Hill, T., Nisbet, R., & Delen, D. (2012). Practical

    Text Mining and Statistical Analysis for Non-structured Text Data

    Applications. Amsterdam, Netherlands: Elsevier Science. doi: 10.1016/C20

    10-0-66188-8

    Raghupathi, V., Zhou, Y., & Raghupathi, W. (2018). Legal Decision Support:

    Exploring Big Data Analytics Approach to Modeling Pharma Patent Validity

    Cases. IEEE Access, 6, 41518-41528. doi: 10.1109/ACCESS.2018.

    2859052

    Sobowale, J. (2016, April 1). How artificial intelligence is transforming the legal

    profession. ABA Journal, 2016(8). Retrieved from http://www.abajournal.

    com/magazine/article/how_artificial_intelligence_is_transforming_the_lega

    l_profession

    Sullivan, D. (2001). Document Warehousing and Text Mining: Techniques for

    Improving Business Operations, Marketing, and Sales. New York, NY: John

    Wiley & Sons.

  • 以人工智慧讀取親權酌定裁判文本 223

    Applying Natural Language Processing and Text Mining to

    Classifying Child Custody Cases and Predicting Outcomes

    Sieh-Chuen Huang & Hsuan-Lei Shao *

    Abstract

    Recently there have been many studies of artificial intelligence that enable

    computers (machines) to simulate human thinking processes, assist human

    decision-making, and apply them to the field of law. However, most of previous

    studies have focused on analyzing the judges' thinking process and predicting the

    case outcomes, so that lawyers and the parties can refer to them. In order to obtain

    highly accurate results on analyzing cases or statutes, these studies must rely on

    legal experts to extract or retrieve key legal factors and code them manually. Based

    on the human coded data, the machine will build models and predict outcomes.

    On the other hand, this study attempts to adopt different methods. Instead of using

    manually coded data, we directly input legal texts which are in the form of

    unstructured natural language data (i.e., the original texts of court cases) into the

    machine, and observe whether the machine can successfully “understand” the

    judges' semantics and classify the cases. We collected 448 cases regarding child

    custody from 2012 through 2014. These parents were both Taiwanese and willing

    to acquire the custody, where the Taiwanese district court granted one parent sole

    custody. The machine used word segmentation techniques to build the Document

    Term Matrixm. Next, we built the artificial neural network (ANN) model to

    classify the cases into two groups: father-sole-custody and mother-sole-custody.

    The model has a 77.25% overall accuracy and 0.8674 average F1 score on the

    *

    Associate Professor, College of Law, National Taiwan University.

    E-mail: [email protected]

    Associate Professor, Department of East Asian Studies, National Taiwan Normal

    University.

    E-mail: [email protected]

  • 224 臺大法學論叢第 49卷第 1期

    testing data set. This confirms that the machine can "read" the legal texts to some

    extent and classify it. Since the speed of the machine is much faster than that of

    humans, this result, if being used in the legal data search system, will allow people

    to find the information (for example, to find the cases where the mother receives

    sole custody) more efficiently without the bother to rely on manual searching,

    reading, and selection of the most relevant cases. This research will also contribute

    to "human-machine collaboration" to support human decision-making, which is

    exactly the goal of legal data analytics in recent years.

    Keywords: legal analytics, custody case, artificial neural network, text

    mining, human-machine collaboration