本中心顧以謙研究員、吳瑜專案研究人員與謝沛怡專案研究人員共同發表「毒品施用緩起訴處分預測模型-自然語言與機器學習在檢察書類文本之應用」研究論文於「矯政期刊」
- 發布日期:
- 最後更新日期:115-01-28
- 資料點閱次數:45
本中心顧以謙研究員、吳瑜專案研究人員與謝沛怡專案研究人員撰寫「毒品施用緩起訴處分預測模型-自然語言與機器學習在檢察書類文本之應用」論文,經匿名雙審後,發表於《矯政期刊》第15第1期。摘要如下:
隨著人工智慧( Artificial Intelligence, AI )與大型語言模型( Large Language Models, LLMs )之進展,自然語言處理(Natural Language Processing, NLP )技術已廣泛應用於語音識別、客服系統、教育諮詢與程式輔助等領域。然而,檢察書類文本因其專業性與結構不規則,過去少有研究成功導入自然語言模型進行自動判讀與分析。本研究以臺灣地方檢察署9,474 筆毒品施用案件之起訴書與緩起訴書為資料來源,結合自然語言模型與機器學習方法,從中自動擷取18 項書類特徵,並配合32 項區域變項,建立結構化資料集,進而訓練五種分類模型(決策樹、邏輯斯迴歸、貝氏分類器、支持向量機與隨機森林),預測檢察官是否作成緩起訴處分。
結果顯示,自動判讀模型之文本標註正確率超過80%;在後續預測階段,邏輯斯迴歸於交叉驗證與測試資料上皆展現穩健效能,其準確率達87%、AUC 値達0.936,顯示該模型兼具效度與解釋性,具備實務應用潛力。本研究另透過具可解釋性的決策樹模型進一步揭示檢察官決策邏輯。研究結果顯示,「是否累犯」為首要分類節點,預測力最強。於非累犯、未抗辯個案中,「犯後態度」為關鍵次層節點,態度不佳或不明者通常被預測為起訴,態度良好者則進一步由「完成戒癮次數」決定處分方向。此顯示檢察官對於毒品施用者之處分判斷,並非僅依賴靜態特徵,亦重視動態表現與行為修復意願。本研究提供以自然語言模型為基礎之結構化分析途徑,驗證其應用於檢察書類文本之可行性,未來可望作為建置AI 初步篩選機制之基礎。在改善檢察機關辦理毒品施用案件之效率上,本研究亦呼籲法務部應於地端建置封閉式AI 模型,輔助處理單純毒品施用案件之預篩流程,減輕檢察人力負擔,並推動數據導向之司法判斷透明化與效率化。
*該研究為法務部司法官學院112年自體研究「以再犯預防為導向之 AI 人工智慧毒品犯罪大數據應用分析計畫-以自然語言分析檢察書類為核心」之部分研究成果。

