自然语言浮水印NaturalLanguageWaterMarking.ppt_第1页
自然语言浮水印NaturalLanguageWaterMarking.ppt_第2页
自然语言浮水印NaturalLanguageWaterMarking.ppt_第3页
自然语言浮水印NaturalLanguageWaterMarking.ppt_第4页
自然语言浮水印NaturalLanguageWaterMarking.ppt_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自然語言浮水印(Natural Language Water Marking),International Workshop on Digital Watermarking IWDW 2003,What is NL Watermarking,文字數位 浮水印技術,原文,將浮水印加入數位文字內容中,此浮水印技術與文字的內容語意相關而無關於文字儲存的格式,可以加強數位文字內容的保護。,加入浮水印之後的文章,浮水印技術規格,透明性(transparency) 被加入浮水印(watermark)須感官上(perceptually) 看不見(invisible)或聽不到(inaudible) 亦即無法察覺(imperceptible)以免影響原來資訊的品質。 非偵測性(undetectability) 所加入的浮水印須無法被偵測出其位置,以免被不法者輕易剪下而移除。 強健性(robustness) 安全的浮水印需能忍受各種數位處理與攻擊(attacks)以維持其功能,或者至少在其被破壞前原始影像已嚴重失真。 安全性(security) 即使知道加入的浮水印的程序也無法讓未經授權者移除所加入的浮水印。 非模糊性(unambiguousness) 解決合法擁有者死結的問題,亦即確認唯一合法擁有者。 鑑定時勿需原始影像(authentication without original source),浮水印示意圖,文字(Doc,Txt),密鑰,加密後語意不變,修改後之文字,浮水印解析,公開發表,第三者修改,公開發表,2,3,4,5,6,浮水印植入,1,使用者上載,2005我於台北發表,2005我於台北發表,自然語言浮水印-研發規格說明,詞彙分析技術: 發展一句子語意解析技術,了解句子中的語意,包含斷詞、詞性標記與詞彙分析技術等功能。 語句句型解析技術: 發展一語句技術分析是那一種句型,再依照不同的句型解析成不同句型樹。 句子選擇技術: 發展一句子選擇技術,從文件中分析語句得重要性已選擇適當的句子。 浮水印encoding技術: 發展一浮水印encoding技術,將欲植入的浮水印分解成小部分,分別植入選定的句子中。而此浮水印encoding技術採用密鑰(encryption key) approach,只有在獲得密鑰(encryption key)以及encoding後的文章才可解析浮水印。 發展一句型替換技術,將語句的語意保留而進行不同句型的替換,替換的方式包括同義詞與同義句型樹替換。,自然語言浮水印技術突破,句型替換技術: 同義詞替換 以ACT thesaurus 為基礎之同義詞替換 同義句型替換 Zero Anaphora 技術研發 Co-Reference 技術研發 浮水印encoding技術: 以同義詞替換方法為基礎之資訊隱藏方法 二元樹分法,可隱藏 logn 個bit ,n 為同義詞個數。 完成以同義詞替換為主的浮水印加密方式,植入文字格式數位浮水印流程圖,文字格式數位浮水印研發技術,創新前瞻語意利解搜尋引擎既有成果,文字格式數位浮水印技術-詞彙分析技術,了解句子中的語意,當進行Watermark encoding時便能維持文字中的語意 斷詞與詞性標記 中研院分詞及詞性標注Autotag系統 詞彙分析 知網(How Net) 創新前瞻語意搜尋引擎計畫中所研發的”ACT thesaurus”,文字格式數位浮水印技術-語句句型解析技術(續),同義中文結構樹關聯技術:由於選定做Watermark encoding的句子的結構不一定能將Watermark encoding在此結構中,需保留句子的語意並且更改句子的結構,文字格式數位浮水印技術-句子選擇演算法(續),句子重要性分析技術: 原因 一篇文章中句子數目眾多,浮水印的資訊有限,不可能每一句子都encoding浮水印資訊於其中。 侵權者往往只會盜用重要的句子。 增加浮水印之彈性。 計算句子資訊量的方法,計算每一句的資訊量,資訊量高的句子假設為重要的句子,文字格式數位浮水印技術-句子選擇演算法,句子排序技術:將句子做一排序,以決定浮水印的每一小部分資訊encoding到句子中的順序,這樣可保護浮水印資訊不容易被偵測與不容易被破壞。,文字格式數位浮水印技術-句型替換演算法,當選定做Watermark encoding的句子不符合時,可將此句的語意保留而進行不同句型的替換。,文字格式數位浮水印技術-句型替換演算法(續),同義詞替換技術: 知網(How Net) 與”ACT thesaurus” 所定義之詞義,進行詞之相似度計算建立同義詞庫。,文字格式數位浮水印技術-句型替換演算法(續),同義中文結構樹轉換技術:當Watermark要encoding到選定句子的結構樹之結構中,而結構樹的結構不符合時,將語意保留而進行不同句型的替換。 利用同義中文結構樹關聯技術所建立出來的同義結構樹進行替換,文字格式數位浮水印技術-浮水印encoding技術,發展一浮水印encoding技術,將欲植入的浮水印分解成小部分,分別植入選定的句子中,而即使知道加入的浮水印的encoding程序,未經授權者也無法移除所加入的浮水印。 此浮水印encoding技術採用密鑰(encryption key) approach,只有在獲得密鑰(encryption key)以及encoding後的文章才可解析浮水印。,文字格式數位浮水印技術-浮水印encoding技術(續),浮水印分解技術:將欲植入的浮水印分解成小部分,分別植入選定的句子結構樹之結構中。 Unicode轉換,文字格式數位浮水印技術-浮水印encoding技術(續),浮水印植入技術:將經過分解過後的浮水印資訊的每一小部分,分別Encoding到選定的句子樹狀結構中。,Watermark,Unicode 轉換,1 0 0 1 1 1,Bit轉換,Bit轉換,Bit轉換,句子1,句子2,句子n,. . .,Encryption key,Encryption key,Encryption key,1 0 1 0 ,0 1 1 0 ,0 0 1 0 ,Match,Match,Match,Yes,Yes,no,成功,成功,句型替換,文字格式數位浮水印技術-浮水印encoding技術(續),浮水印解析技術:為浮水印植入技術的一個反向操作 滿足就算知道Encoding的方式,只有拿到Encoding用的密鑰(encryption key)以及encoding後的文章才可解析浮水印,Quadratic Residue,二次殘差(quadratic residue),目前做法,找一質數p, 產生 Quadratic Residue Table,Quadratic Residue :1 Quadratic nonResidue:0,同義句型替換,目的,維持一句子的語意,而將句子的結構(句型)進行替換(換句換說) 。,同義句型替換- Zero anaphora,n m 他買了一顆蘋果,很新鮮。 他買了一顆蘋果,蘋果很新鮮。,VP,VH,Dfa,很,新鮮,S,VP,VH,Dfa,很,新鮮,NP,Na,蘋果,S,同義句型替換-CoReference,代名詞以其所指涉之名詞替換 張三是老師,他教學很認真。 張三是老師,張三教學很認真。,S,VP,NP,Nh,他,S,VP,NP,Nb,張三,同義句型替換-CoReference (Con.),代名詞(名詞)以其所指涉之(名詞+屬性)替換 張三是老師,同時,他也是一位好爸爸。 張三是老師,同時,張三老師也是一位好爸爸。,S,NP,NP,NP,NP,S,NP,NP,NP,NP,同義句型替換-以 Grammar 分析為基礎之同義句型替換,分析中文 Grammar 以獲得各種同義句型替換規則。 並列連接詞(Ca) 關聯連接詞(Cb) 需有中文人才支援 整理出各種Grammar轉換rule Rule如何套用在同義句型替換? 寫死在程式中? 發展一套用rule的 adapter,並列連接詞(Ca),並列連接詞連接兩個概念相似的成分,形成向心式結構,組成成分的作用與其連接成分相同。 對等連接詞(Caa),關聯連接詞(Cb),一般關聯連接詞存在有前後相對的連接詞(e.g.因為所以) 。 我因為生病了所以媽媽不給我出去玩 我生病了所以媽媽不給我出去玩 媽媽不給我出去玩是因為我生病了,以同義句型替換方法為基礎之資訊隱藏方法,Encoding Watermark in Tree Structure,以詞性與structure為依據。 依照詞性標上對應之數字 利用 DFS, BFS 將數字連接起來 一個Tree structure, 兩個”很大的數” 。 可以利用 “and”, “or”, “xor”等bit operation 增加其encoding bit的能力。 將所得到的”很大的數”利用 bit operation合併之後 mod P (Key) 去查 table。,DFS,1547021718470847154747,BFS,47024715471547081718,Bit operation,21232512346235,Mod P & Lookup table,1,435241241241241,Bit operation,Mod P & Lookup table,0,浮水印評量標準,透明性 PSNR 資訊隱藏量 互斥條件 強健性 透明性 容量 1long n 攻擊 同義字替換 句子語意結構樹之替換 部分句子取用 句子順序掉換 新增/刪除句子 竄改偵測 Retrieval Watermark ratio Normal Correction Gaussian sequence,未來應用的情境,Text watermarking Data hiding 使用者輸入一文章、密鑰,與一訊息,系統自動將訊息隱藏於文章中,而文章的語意不變。 Sub Set of

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论