自然语言浮水印(Natural-Language-Water-Marking)课件.ppt

上传人(卖家):晟晟文业 文档编号:4527119 上传时间:2022-12-16 格式:PPT 页数:37 大小:510.50KB
下载 相关 举报
自然语言浮水印(Natural-Language-Water-Marking)课件.ppt_第1页
第1页 / 共37页
自然语言浮水印(Natural-Language-Water-Marking)课件.ppt_第2页
第2页 / 共37页
自然语言浮水印(Natural-Language-Water-Marking)课件.ppt_第3页
第3页 / 共37页
自然语言浮水印(Natural-Language-Water-Marking)课件.ppt_第4页
第4页 / 共37页
自然语言浮水印(Natural-Language-Water-Marking)课件.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

1、自然語言浮水印(Natural Language Water Marking)International Workshop on Digital WatermarkingIWDW 2003What is NL Watermarking文字數位浮水印技術資訊市場情報中心著作權所有 版權資訊事實上Intel 在CPU 市場的領導地位是難以撼動的,但是在不同的市場區隔中,提供客戶第二個或是更多元的選擇,應是系統廠商在開發產品時的原則之一,因此在Banias 上市後,Transmeta 一定仍會有機會取得系統廠商的青睞,但是能不能進一步的攻下更多的市場佔有率,就要看新的CPU 在耗電量、電源管理與效能

2、上的表現,是否能與Banias 相匹敵,或者在價格與效能比上是否足以吸引系統廠商。事實上Intel 在CPU 市場的領導地位是難以撼動的,但是在不同的市場區隔中,提供客戶第二個或是更多元的選擇,應是系統廠商在開發產品時的原則之一,因此在Banias 上市後,Transmeta 一定仍會有機會取得系統廠商的青睞,但是能不能進一步的攻下更多的市場佔有率,就要看新的CPU 在耗電量、電源管理與效能上的表現,是否能與Banias 相匹敵,或者在價格與效能比上是否足以吸引系統廠商。原文n將浮水印加入數位文字內容中,此浮水印技術與文字的內容語意相關而無關於文字儲存的格式,可以加強數位文字內容的保護。加入浮

3、水印之後的文章事實上在CPU 市場中Intel的領導地位是難以動搖的,但是以不同市場為區隔,提供客戶第二個或是更多元的選擇,應是系統廠商在開發產品時的原則之一,因此在Banias 上市後,Transmeta 一定仍會有機會取得系統廠商的青睞,但是能不能在市場佔有率上有進一步的擴張,就要看新的CPU 在效能、耗電量與電源管理上的表現,是否能與Banias 互相抗衡,或者在效能比與價格上是否對系統廠商有足以吸引力。事實上在CPU 市場中Intel的領導地位是難以動搖的,但是以不同市場為區隔,提供客戶第二個或是更多元的選擇,應是系統廠商在開發產品時的原則之一,因此在Banias 上市後,Transm

4、eta 一定仍會有機會取得系統廠商的青睞,但是能不能在市場佔有率上有進一步的擴張,就要看新的CPU 在效能、耗電量與電源管理上的表現,是否能與Banias 互相抗衡,或者在效能比與價格上是否對系統廠商有足以吸引力。浮水印技術規格n透明性(transparency)n被加入浮水印(watermark)須感官上(perceptually)看不見(invisible)或聽不到(inaudible)亦即無法察覺(imperceptible)以免影響原來資訊的品質。n非偵測性(undetectability)n所加入的浮水印須無法被偵測出其位置,以免被不法者輕易剪下而移除。n強健性(robustness

5、)n安全的浮水印需能忍受各種數位處理與攻擊(attacks)以維持其功能,或者至少在其被破壞前原始影像已嚴重失真。n安全性(security)n即使知道加入的浮水印的程序也無法讓未經授權者移除所加入的浮水印。n非模糊性(unambiguousness)n解決合法擁有者死結的問題,亦即確認唯一合法擁有者。n鑑定時勿需原始影像(authentication without original source)浮水印示意圖文字文字(Doc,Txt)密鑰密鑰加密後語意不變加密後語意不變修改後之文字修改後之文字浮水印浮水印解析解析公開發表公開發表第三者修改第三者修改公開發表公開發表23456浮水印浮水印植入

6、植入1使用者使用者上載上載2005我於台北發表2005我於台北發表自然語言浮水印-研發規格說明n詞彙分析技術:n發展一句子語意解析技術,了解句子中的語意,包含斷詞、詞性標記與詞彙分析技術等功能。n語句句型解析技術:n發展一語句技術分析是那一種句型,再依照不同的句型解析成不同句型樹。n句子選擇技術:n發展一句子選擇技術,從文件中分析語句得重要性已選擇適當的句子。n浮水印encoding技術:n發展一浮水印encoding技術,將欲植入的浮水印分解成小部分,分別植入選定的句子中。而此浮水印encoding技術採用密鑰(encryption key)approach,只有在獲得密鑰(encrypti

7、on key)以及encoding後的文章才可解析浮水印。n發展一句型替換技術,將語句的語意保留而進行不同句型的替換,替換的方式包括同義詞與同義句型樹替換。自然語言浮水印技術突破n句型替換技術:n同義詞替換n以ACT thesaurus 為基礎之同義詞替換n同義句型替換nZero Anaphora 技術研發nCo-Reference 技術研發n浮水印encoding技術:n以同義詞替換方法為基礎之資訊隱藏方法n二元樹分法,可隱藏 logn 個bit,n 為同義詞個數。n完成以同義詞替換為主的浮水印加密方式植入文字格式數位浮水印流程圖 文字格式數位浮水印研發技術創新前瞻語意利解搜尋引擎既有成果斷

8、句技術斷句技術OriginalText Content句子句子詞彙詞彙解析技術解析技術語句句型語句句型解析技術解析技術句型句型替換技術替換技術浮水印浮水印Encoding技術技術句子句子選擇技術選擇技術WatermarkedText ContentWatermarkencryption key中文語料庫知網知識庫中文句結構樹資料庫分詞及詞性標注系統Parser同義中文結構樹關聯資料庫同義詞庫Actthesaurus文字格式數位浮水印技術-詞彙分析技術n了解句子中的語意,當進行Watermark encoding時便能維持文字中的語意n斷詞與詞性標記n中研院分詞及詞性標注Autotag系統n詞彙

9、分析n知網(How Net)n創新前瞻語意搜尋引擎計畫中所研發的”ACT thesaurus”文字格式數位浮水印技術-語句句型解析技術(續)n同義中文結構樹關聯技術:由於選定做Watermark encoding的句子的結構不一定能將Watermark encoding在此結構中,需保留句子的語意並且更改句子的結構文字格式數位浮水印技術-句子選擇演算法(續)n句子重要性分析技術:n原因n一篇文章中句子數目眾多,浮水印的資訊有限,不可能每一句子都encoding浮水印資訊於其中。n侵權者往往只會盜用重要的句子。n增加浮水印之彈性。n計算句子資訊量的方法,計算每一句的資訊量,資訊量高的句子假設為重

10、要的句子 文字格式數位浮水印技術-句子選擇演算法n句子排序技術:將句子做一排序,以決定浮水印的每一小部分資訊encoding到句子中的順序,這樣可保護浮水印資訊不容易被偵測與不容易被破壞。文字格式數位浮水印技術-句型替換演算法n當選定做Watermark encoding的句子不符合時,可將此句的語意保留而進行不同句型的替換。文字格式數位浮水印技術-句型替換演算法(續)n同義詞替換技術:n知網(How Net)與”ACT thesaurus”所定義之詞義,進行詞之相似度計算建立同義詞庫。常識的樹狀分類人男女常識的樹狀分類常識的樹狀分類人男女RelationGeneratorRelationGe

11、nerator老師教師0.95關聯辭庫老師教師0.95關聯辭庫Term YDEF:人職位教教育Term XDEF:D1D2D3詞彙與定義Term YDEF:人職位教教育Term YDEF:人職位教教育Term XDEF:D1D2D3Term XDEF:D1D2D3詞彙與定義文字格式數位浮水印技術-句型替換演算法(續)n同義中文結構樹轉換技術:當Watermark要encoding到選定句子的結構樹之結構中,而結構樹的結構不符合時,將語意保留而進行不同句型的替換。n利用同義中文結構樹關聯技術所建立出來的同義結構樹進行替換 文字格式數位浮水印技術-浮水印encoding技術 n發展一浮水印enco

12、ding技術,將欲植入的浮水印分解成小部分,分別植入選定的句子中,而即使知道加入的浮水印的encoding程序,未經授權者也無法移除所加入的浮水印。n此浮水印encoding技術採用密鑰(encryption key)approach,只有在獲得密鑰(encryption key)以及encoding後的文章才可解析浮水印。文字格式數位浮水印技術-浮水印encoding技術(續)n浮水印分解技術:將欲植入的浮水印分解成小部分,分別植入選定的句子結構樹之結構中。nUnicode轉換 自然語言實驗室10000111010011101Unicode文字格式數位浮水印技術-浮水印encoding技術(

13、續)n浮水印植入技術:將經過分解過後的浮水印資訊的每一小部分,分別Encoding到選定的句子樹狀結構中。WatermarkUnicode 轉換1 0 0 1 1 1Bit轉換Bit轉換Bit轉換句子1句子2句子n.Encryption key Encryption key Encryption key1 0 1 0 0 1 1 0 0 0 1 0 MatchMatchMatchYesYesno成功 成功 句型替換 文字格式數位浮水印技術-浮水印encoding技術(續)n浮水印解析技術:為浮水印植入技術的一個反向操作 n滿足就算知道Encoding的方式,只有拿到Encoding用的密鑰(e

14、ncryption key)以及encoding後的文章才可解析浮水印 Quadratic Residue 二次殘差(quadratic residue)目前做法n找一質數p,產生 Quadratic Residue Table123456.Is Quadratic Residue?111101Quadratic Residue :1Quadratic nonResidue:0同義句型替換目的n維持一句子的語意,而將句子的結構(句型)進行替換(換句換說)。同義句型替換-Zero anaphorann mn他買了一顆蘋果,很新鮮。n他買了一顆蘋果,蘋果很新鮮。VPVHDfa很新鮮SVPVHDfa

15、很新鮮NPNa蘋果S同義句型替換-CoReferencen代名詞以其所指涉之名詞替換n張三是老師,他教學很認真。n張三是老師,張三教學很認真。SVPDfa很VH認真NPNh他VA教學SVPDfa很VH認真NPNb張三VA教學同義句型替換-CoReference(Con.)n代名詞(名詞)以其所指涉之(名詞+屬性)替換n張三是老師,同時,他也是一位好爸爸。n張三是老師,同時,張三老師也是一位好爸爸。SNPNf位NPNh他Neu一D也SHI是NPNa爸爸VH好NPSNPNf位NPNb張三Neu一D也SHI是NPNa爸爸VH好NPNa老師同義句型替換-以 Grammar 分析為基礎之同義句型替換n分

16、析中文 Grammar 以獲得各種同義句型替換規則。n並列連接詞(Ca)(Ca)n關聯連接詞關聯連接詞(Cb(Cb)nn需有中文人才支援n整理出各種Grammar轉換rulenRule如何套用在同義句型替換?n寫死在程式中?n發展一套用rule的 adapter並列連接詞(Ca)(Ca)n並列連接詞連接兩個概念相似的成分,形成向心式結構,組成成分的作用與其連接成分相同。n對等連接詞(Caa)關聯連接詞關聯連接詞(Cb(Cb)n一般關聯連接詞存在有前後相對的連接詞(e.g.因為所以)。n我因為因為生病了所以所以媽媽不給我出去玩n我生病了所以所以媽媽不給我出去玩n媽媽不給我出去玩是因為因為我生病了

17、 X Y雖然雖然可是可是因為因為所以所以縱然縱然何況何況如果如果 那麼那麼 除非除非 否則否則 與其與其 不如不如 要麼要麼 不麼不麼 非但非但 而且而且 首先首先 其次其次 以同義句型替換方法為基礎之資訊隱藏方法Encoding Watermark in Tree Structuren以詞性與structure為依據。n依照詞性標上對應之數字n利用 DFS,BFS 將數字連接起來n一個Tree structure,兩個”很大的數”。n可以利用“and”,“or”,“xor”等bit operation 增加其encoding bit的能力。n將所得到的”很大的數”利用 bit operati

18、on合併之後 mod P(Key)去查 table。DFS1547021718470847154747BFS47024715471547081718Bit operation21232512346235Mod P&Lookup table1435241241241241Bit operationMod P&Lookup table0浮水印評量標準n透明性nPSNRn資訊隱藏量n互斥條件n強健性n透明性n容量n1long nn攻擊n同義字替換n句子語意結構樹之替換n部分句子取用n句子順序掉換n新增/刪除句子 n竄改偵測nRetrieval Watermark rationNormal Corre

19、ctionnGaussian sequence22max),(),(yxXyxXXXEPSNRWH 10102,1010,)(WWWHWiHjjiWiWjjijiwWWNCWWWWsim未來應用的情境nText watermarkingnData hidingn使用者輸入一文章、密鑰,與一訊息,系統自動將訊息隱藏於文章中,而文章的語意不變。nSub Set of watermarkingnSearch engine for plagiarized textsn使用者輸入一篇文章,系統自動於Internet中替使用者搜尋,涉嫌抄襲的文章。文件中隱藏文件中隱藏之資訊之資訊Search engine for plagiarized texts文字文字(Doc,Txt)系統密鑰系統密鑰使用者上載使用者上載文件文件涉嫌抄襲涉嫌抄襲之文章之文章浮水印解析浮水印解析123A網路上網路上之文件之文件文件中隱藏文件中隱藏之資訊之資訊KnowledgeBase浮水印解析浮水印解析B匯入知匯入知識庫識庫比對比對謝謝請指教

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(自然语言浮水印(Natural-Language-Water-Marking)课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|