本中心發表「以自然語言模型自動判讀毒品施用與竊盜犯罪起訴書類初探」論文於「藥物濫用防治」期刊
- 發布日期:
- 最後更新日期:113-10-17
- 資料點閱次數:630
本中心顧以謙研究員、吳瑜專案研究人員與張道行副教授共同撰寫「以自然語言模型自動判讀毒品施用與竊盜犯罪起訴書類初探」論文,並獲匿名雙審通過,發表於臺灣藥物濫用防治學會所發行「藥物濫用防治」期刊第九卷第一期。本項論文之作者序列、研究單位與中文摘要如下:
1. 作者序列:顧以謙、張道行、吳瑜
2. 研究單位:法務部司法官學院犯罪防治研究中心
3. 中文摘要:以自然語言技術進行檢察機關書類之文字自動判讀,擷取出可用於犯罪分析之變項,可在節省人工標記的耗能下,有效率的建置犯罪研究分析之數據資料庫,有利於犯罪研究外,也能成為落實政策的基礎。本研究利用1206份施用毒品罪、689份竊盜罪遭檢察官起訴,並具體求刑案件起訴書類投入自然語言分析,並觀察建構完成之BERT(Bidirectional Encoder Representations from Transformers)-based自然語言演算模型是否可順利自動判讀竊盜犯罪與施用毒品起訴書類文字。本研究結果指出,透過機器自動擷取起訴書類特徵效能優異,據以建立巨量資料庫可行性高。同時,本研究認為將正規表示法與BERT整合運用下會具有較好轉換效率。在與人工進行標記比較下,機器於擷取效能與自動編碼起訴書的錯誤率低於人工標記。本研究建議,賡續挹注資源予檢察書類之人工智慧自然語言分析研究,持續投入不同年份、不同偵查終結類型的檢察書類於自然語言模型。本研究也建議持續加強導入各種人工智慧模型於犯罪防治與司法研究,深化自然語言應用於發展犯罪防治研究和司法實務工作之學術與實務價值。
本文為法務部司法官學院111年自體研究「AI人工智慧司法應用第二階段先導研究--兼以探索毒品犯罪與財產犯罪之關聯性」之部分研究成果。