1、2009/06/09以機器學習分析個人筆跡特徵及身分辨識之研究新竹教育大學資訊科學所林怡均2009/06/09目錄1.緒論2.相關研究3.研究方法與研究工具4.實驗結果5.結論2009/06/091.緒論身份辨識無所不在進出住家、公司等保全系統網路認證使用生物特徵作為身份認證不需記憶密碼、不需攜帶感應卡人權與隱私問題找出取代生物認證作為辨識身分之方法三個特性:普遍性、唯一性、永恆性2009/06/091.1 研究背景與動機取代生物特徵作為辨識身分的方法蒐集個人生物特徵的隱私問題提出無隱私問題之特徵作為身分辨識的方法-筆跡人工的檢測筆跡方式十分耗資源檢測人員需有筆跡特徵之相關知識檢測公正性與客觀
2、性有爭議以筆跡特徵作為更具便利性之辨識系統具有普遍、唯一、永恆等特性無需記憶密碼2009/06/091.2 目的建構可將筆跡數位化紀錄之工具便於未來資料使用儲存方便、容易保存建構可分析筆跡之系統 系統分析省時省力可擷取人工不可為之特徵使用筆跡特徵辨識個人身分具有普遍、為一、永恆等特性無需記憶密碼2009/06/091.2 目的筆跡模型建製個人筆跡筆跡特徵寫字過程中產生使用者筆跡模型經決策樹訓練個人資料使用者輸入2009/06/091.3 研究問題如何選擇測驗特定字並篩選出有效特徵?如何在47000中文字中挑選各國筆跡特徵超過100種,如何找出所需?如何建立筆跡分析與特徵蒐集系統?記錄寫字座標軌
3、跡使用機器學習建立模組如何找出具代表性之筆跡特徵並建構筆跡辨識身分系統?筆跡特徵不單就外型而言挑選個人具代表性特徵2009/06/092.相關研究2.1 生物特徵指紋、虹膜、聲紋、臉型等2.2 筆跡學及其應用筆跡、筆跡特徵、筆跡測量2.3 機器學習data mining、決策樹2009/06/092.1 生物特徵何謂生物特徵?根據生物的型態、構造、生理及生態等特徵生物特徵之用途?將生物分門別類能夠加以描述 生物特徵作為身分認證指紋、虹膜、DNA、聲紋、臉型2009/06/092.2 筆跡學及其應用2.2.1 筆跡2.2.2 筆跡學2.2.3 筆跡測量2.2.4 筆跡特徵2009/06/092.
4、2.1 筆跡何謂筆跡?由大腦、運動神經及身體肌肉互相搭配的行為無法刻意模仿、任意亂寫不足以表達筆跡筆跡之獨特性?每個人的筆跡是絕無僅有除非擁有相同的大腦、知覺、神經等 2009/06/092.2.2 筆跡學義大利教授Camillo Baldi首次出版筆跡相關書籍 法國學者JH Michon首先提出筆跡學之英文名詞Graphology 透過改變寫字風格可達到性情的轉變(Brewer)筆跡學是一種投射技術,用在推斷個人人格依據方面(Tett)2009/06/092.2.3 筆跡測量 筆跡測量問題 人格測量工具之缺乏(楊國樞林碧峰)傳統測量資料保存不易 作業人員需要相關知識與事前訓練 筆跡測量應注意
5、 中文字與外文字背景構造不同,不應盲從 評判者之公正性2009/06/092.2.4 筆跡特徵2009/06/092.3 機器學習2009/06/093.研究方法與工具3.1 研究流程3.2 研究對象與工具限制3.3 筆跡測試樣本3.4 建構記錄數位筆跡之工具3.5 分析筆跡特徵2009/06/093.1 研究流程2009/06/093.2 研究對象與工具限制研究對象限制本校大學及研究所學生男女不拘研究工具限制使用電子筆書寫書寫文字為特定之95字2009/06/093.3 筆跡測試樣本中文字數繁多:康熙字典47000 參考楊國樞與林碧峰研究之159字扣除重複以及常用字等,修改文95字為測驗內容
6、2009/06/093.4 建構記錄數位筆跡之工具 一般特徵:結構特徵:2009/06/093.5 分析筆跡特徵筆跡變項定義說明平均字寬各別計算出95個字的單字寬後,求其平均。平均字高各別計算出95個字的單字高後,求其平均。字寬/字高單字字寬/單字字高,後加總取平均。平均面積單字面積加總後,取平均。寫字接觸時間單筆下筆到起筆,單取紙筆接觸的時間,加總後取平均。寫字停頓時間單筆起筆到下個字下筆,單取筆畫間停頓的時間,加總後取平均。寫字接觸速單筆下筆到起筆,單取紙筆接觸的速,加總後取平均。整體速自首筆下筆到尾筆起筆的速。平均停頓時間單筆起筆到下個字下筆之時間加總/(筆畫-1)2009/06/094
7、.實驗結果4.1 筆跡紀錄工具 4.2 筆跡結構特徵擷取工具4.3 決策樹分析結果與應用2009/06/094.1 筆跡紀錄工具 實驗設備書寫工具:NAVInote電子筆產品系統開發:Borland C+Builder資料庫:MS SQL2009/06/094.1 筆跡紀錄工具 2009/06/094.1 筆跡紀錄工具受測者使用功能項目下個字、橡皮擦、單字清除、全部清除名稱使用時機功用下個字當寫完某字並確認無誤立即計算本字特徵並跳出下一個文字橡皮擦當寫字過程中需要少許塗改文字出現橡皮擦圖型移動至想塗改部分,按壓滑鼠左鍵並拖曳單字清除當寫字過程中需要整體清除此字清除本字全部清除當寫字過程中需要整
8、體清除整體清除2009/06/094.1 筆跡紀錄工具 2009/06/094.2 筆跡結構特徵擷取工具2009/06/094.2 筆跡結構特徵擷取工具2009/06/094.3 決策樹分析結果與應用4.3.1 決策樹分析結果4.3.2 應用4.3.3 應用實用正確率偏低之探討2009/06/094.3.1 決策樹分析結果 使用者9410218為例 列出完全正確率、交叉測試正確率2009/06/094.3.1 決策樹分析結果 使用者9725506為例 2009/06/094.3.1 決策樹分析結果 使用者9725510為例2009/06/094.3.2 應用實作一個以筆跡特徵作為身分辨識的系統
9、 系統結構操作步驟辨識結果 2009/06/094.3.2 應用使用者9725510之2009/06/094.3.3 應用實用正確率偏低之探討2009/06/094.3.3 應用實用正確率偏低之探討使用者9725518為例特徵類型首次書寫在次書寫差異平均字寬40.0210535.48421平均字高41.1578938.96842平均字寬/字高1.0040610.939101平均單字面積1648.0951392.179寫字接觸時間1.1581051.165621寫字接觸速度138.3555125.4483整體速度92.4556586.06954平均停頓時間0.1270050.1080462009/06/092009/06/095.結論2009/06/09報告完畢請各位評審委員指教