Nghiên cứu một số kỹ thuật phát hiện ảnh giấu tin

Tính cấp thiết của luận án

“Giấu thông tin” (Steganography1) là kỹ thuật liên lạc mật dựa trên hình thức giấu thông tin quan trọng vào đối tượng khác. Từ thời kỳ cổ đại người ta đã sử dụng phương pháp này để liên lạc mật cho nhau. Một ví dụ cổ điển hình về giấu tin (485-525 trước công nguyên) là câu chuyện của một người tên là Histaiæus muốn gửi thông tin quan trọng về “Kế hoạch ủng hộ cuộc nổi dậy chống lại đức vua Ba tư Xerxes” cho nhà nhiếp chính thành phố Miletus bằng cách xăm thông tin lên da đầu người nô lệ tin cậy của mình, cho đến khi tóc mọc dài trở lại ông ta cử người nô lệ đó đến gặp nhà nhiếp chính. Hay một phát minh khác của Pliny T. Elder (23- 79 sau công nguyên) về mực “không màu” chính là sữa động vật, khi mực này viết trên giấy để khô khó phát hiện ra, và chỉ khi giấy đó được hơ nóng các vết mực sẽ chuyển sang nâu. Vào thời kỳ phục hưng, năm 1518 Johannes Trithemius viết cuốn sách về mã hóa “Polygraphia”. Trong cuốn sách này người ta thấy xuất hiện đầu tiên thuật ngữ “Steganographia”, đây là một từ ghép bắt nguồn từ ngôn ngữ Hy lạp steganos nghĩa là bao bọc “cover” và graphia nghĩa là bản viết “writing”.

Trải qua nhiều thời kỳ biến động của xã hội loài người, ngày nay khi mà kỹ thuật số bùng nổ, con người cũng “số hoá” lĩnh vực giấu tin phục vụ cho cuộc sống hiện đại. Do tính ưu việt của các kỹ thuật giấu tin là “vô hình” nên nó trở thành công cụ hữu ích cho một số tổ chức trao đổi thông tin quan trọng trong môi trường truyền thông công cộng. Vì vậy giấu tin mật phát triển một cách nhanh chóng và ngày càng tinh sảo hơn với một lượng lớn công trình giấu tin được công bố thường niên (chưa kể đến số kỹ thuật giấu không công bố công khai).

Giấu tin có một ưu điểm mà mật mã học (Cryptography) còn hạn chế đó là có thể “bảo vệ được bản quyền số, hay khi giữa các đối tượng liên lạc mật với nhau trên các kênh thông tin công cộng mà ít bị nghi ngờ”. Lý do vì bản quyền số đã mã hóa sau khi được giải mã thì khó có thể giữ được bản quyền, hay thông tin mật cần trao đổi giữa các bên, sau khi được mã hóa sẽ làm cho người khác biết rõ là các bên có trao đổi thông tin mật nào đó cho nhau. Giấu tin trong dữ liệu đa phương tiện chính là những “bổ khuyết” cho các vấn đề trên của mật mã học.

Về nguyên lý, giấu tin trong dữ liệu video, dữ liệu âm thanh hay trong dữ liệu ảnh số không khác gì nhiều. Tuy nhiên, do giấu tin trong ảnh dễ thực hiện hơn, giấu được nhiều thông tin hơn, và ảnh là đối tượng được sử dụng khá phổ biến trên Internet hiện nay, nên kỹ thuật giấu tin trong ảnh chiếm tỉ lệ nhiều nhất trong các loại dữ liệu đa phương tiện.

Vậy giấu tin trong ảnh là gì ? Tại sao nó lại phát triển nhanh và sôi động như vậy ? Giấu thông tin là kỹ thuật “nhúng” một lượng thông tin vào dữ liệu ảnh số sao cho đảm bảo các yêu cầu sau:

1/. Không thể phát hiện (undetectability) thông tin giấu trong ảnh gốc bằng cảm nhận của con người.

2/. Không thể phân biệt được (undistinguishable) đâu là ảnh gốcvà đâu là ảnh có giấu tin bằng cảm nhận của con người.

3/. Lượng thông tin giấu lớn nhất có thể (steganographyic capacity) trong gốc sao cho không vi phạm yêu cầu 1/ và yêu cầu 2/ nêu trên. Ngoài ra, việc giấu thông tin trong ảnh còn đem lại khả năng tiết kiệm bộ nhớ và thời gian truyền tin đáng kể. Ví dụ: Giả sử một ảnh xám 8 – bit có kích cỡ 4×6 cm tương ứng với 630×945 pixel (tương đương 595350 pixel). Nếu mỗi pixel giấu được một bit thông tin, thì 595350 pixel có thể giấu lượng thông tin lấp đầy 19 trang giấy A4 (trung bình mỗi trang A4 chứa được 75 ký tự × 50 dòng).

Thông tin có thể được giấu trên miền không gian hoặc trên các hệ số biến đổi của ảnh như biến đổi tần số cosine rời rạc, wavelet rời rạc, fourier rời rạc hay biến đổi sai phân (difference image).

Kỹ thuật giấu tin trong ảnh đa số là phương pháp giấu trên bit có ít ý nghĩa nhất LSB (Least Significant Bit) của điểm ảnh hoặc của các hệ số biến đổi, vì thay đổi trên bit LSB ít ảnh hưởng đến chất lượng ảnh theo khả năng cảm nhận của con người. Ngoài ra còn có một số phương pháp giấu khác theo cách thức có sự thay đổi nhỏ trên ảnh như phương pháp giấu theo hình thức chèn nhiễu – kỹ thuật giấu tin SS (Spread Spectrum), phương pháp giấu tin theo hình thức điều chỉnh hệ số lượng tử QIM (Quantization Index Modulation), hay một số kỹ thuật giấu đặc biệt khác: MBNS, RCM, RVH,…

Giống như trong Mật mã học, Thám mã (Cryptanalysis) là kỹ thuật đối lập nhưng song song tồn tại và phát triển cùng với sự phát triển của kỹ thuật Mật mã, nhằm giải mã các “bản mã” thu nhận được để hiểu rõ nội dung ban đầu của bản mã, thì phát hiện ảnh có giấu tin (image steganalysis2) là kỹ thuật đối lập với kỹ thuật giấu tin nhằm dò tìm ảnh số nào đó có giấu thông tin hay không.

Việc nghiên cứu phát hiện ảnh giấu tin ngoài ý nghĩa khoa học còn có hai ý nghĩa thực tiễn, đó là: Thứ nhất, nhằm phục vụ đắc lực cho an ninh quốc phòng của mỗi quốc gia; Thứ hai, nhằm nâng cấp và thúc đẩy sự phát triển của kỹ thuật giấu tin trong ảnh. Chính vì vậy, ở các nước, nhất là các nước có nền công nghiệp phát triển như: Mỹ, Anh, Đức, Israel, Trung Quốc, Hàn Quốc, Nhật Bản … đã đầu tư rất nhiều kinh phí cho việc nghiên cứu này. Tại Việt Nam, cũng đã có một số cơ quan đơn vị nghiên cứu về giấu tin trong ảnh và phát hiện ảnh có giấu tin như: Tổng Cục an ninh I – Bộ Công An, Viện Công Nghệ Thông tin – Viện khoa học Việt Nam, trường Đại học bách khoa Hà Nội, trường Đại học Khoa học Tự nhiên Thành phố Hồ Chí Minh… nhưng vẫn còn rời rạc và chưa được đầu tư đúng mức.

Với hai mục đích nêu trên dẫn đến hai hướng nghiên cứu khác nhau : Hướng thứ nhất, cố gắng xây dựng thuật toán phát hiện mù (blind steganalysis) cho ảnh có giấu tin sử dụng kỹ thuật giấu bất kỳ; Hướng thứ hai, dựa vào kỹ thuật giấu tin nào đó đã biết, có thể xây dựng được thuật toán phát hiện phù hợp (phát hiện có ràng buộc – constraint steganalysis).

Đã có nhiều công trình công bố nghiên cứu trên thế giới thành công theo hai hướng này :

  • Với kỹ thuật phát hiện mù cho ảnh có giấu tin trên LSB của miền không gian có các công trình [31, 38, 84, 95, 102] và miền tần số có công trình [71], kỹ thuật phát hiện mù cho ảnh giấu tin sử dụng kỹ thuật giấu SS có công trình [83], kỹ thuật giấu QIM có các công trình [59, 81, 82] hay phát hiện mù cho ảnh JPEG có giấu tin [66].
  • Với kỹ thuật phát hiện có ràng buộc cho ảnh có giấu tin sử dụng một số kỹ thuật giấu đã biết, như các công trình: [36] (tấn công kỹ thuật giấu OutGuess), [33] (tấn công kỹ thuật giấu F5), [46] (tấn công kỹ thuật giấu HKC), [24] (tấn công kỹ thuật giấu RCM), [14] (tấn công kỹ thuật giấu tin MBNS).

Tuy nhiên, các kỹ thuật giấu tin ra đời sau ngày càng tinh xảo hơn đòi hỏi các nhà phân tích ảnh có giấu tin không ngừng tìm ra phương pháp phát hiện phù hợp bắt kịp với xu hướng phát triển của kỹ thuật giấu thông tin. Đặc biệt với tốc độ phát triển nhanh chóng của Internet ngày nay thì nhu cầu trao đổi thông tin bằng ảnh ngày càng lớn mạnh, do đó để đảm bảo an toàn an ninh, quốc phòng hay hỗ trợ nâng cấp, cải tiến kỹ thuật giấu nào đó an toàn hơn đang là bài toán cấp thiết đặt ra cho các nhà nghiên cứu trong lĩnh vực an toàn thông tin ở nước ta hiện nay.

Mục tiêu và phạm vi nghiên cứu

Từ phân tích nêu trên, luận án này tập trung nghiên cứu cải tiến và đề xuất một số kỹ thuật phát hiện ảnh có giấu tin theo hai hướng chính:

– Thứ nhất, đưa ra một số kỹ thuật phát hiện mù cho ảnh có giấu tin trên LSB của miền không gian và miền tần số. Từ việc khảo sát, phân tích kỹ thuật giấu LSB và một số kỹ thuật phát hiện của tác giả khác luận án đưa ra phương pháp phát hiện khác cho kết quả phân loại tương đương hoặc tốt hơn trong trường hợp nào đó so với các kỹ thuật phát hiện khác.

– Thứ hai, đưa ra một số kỹ thuật phát hiện có ràng buộc cho ảnh có giấu tin với kỹ thuật giấu biết trước. Kỹ thuật giấu biết trước thường là trường hợp riêng của kỹ thuật giấu LSB, nó cho phép giấu với lượng thông tin giấu thấp, vì vậy nếu quy về bài toán phát hiện mù sẽ cho kết quả phát hiện không cao, trong các trường hợp riêng này thường sẽ cố gắng tìm ra phương pháp phát hiện tối ưu hơn các phương pháp phát hiện mù.

Đối tượng ảnh nghiên cứu là các ảnh dạng BITMAP vì hầu hết các ảnh trong máy tính, các ảnh chụp từ máy ảnh kỹ thuật số hoặc các ảnh từ các trang web là lưu dưới dạng này (như các định dạng: jpg, gif, png, tif, psp, bmp, …), còn ảnh dạng vector (như các định dạng: pdf, eps, ai, cdr, svg, dwg ,…) không nằm trong phạm vi nghiên cứu của luận án này.

Những đóng góp của luận án

Những đóng góp chính của luận án là đưa ra kỹ thuật phát hiện ảnh có giấu tin theo hai bài toán sau:

Bài toán 1: Kỹ thuật phát hiện mù cho ảnh có giấu tin trên LSB của miền không gian (miền tần số) với các kỹ thuật đề xuất sau:

  • Đề xuất ba kỹ thuật phát hiện mù cho ảnh có giấu tin trên LSB của miền không gian bằng: phương pháp phân tích độ lệch chuẩn, phương pháp thống kê một bậc tự do, phương pháp phân tích tỉ lệ xám.
  • Đề xuất một kỹ thuật phát hiện mù cho ảnh giấu tin trên LSB của miền tần số bằng phân tích tỉ lệ xám.
  • Đề xuất phương pháp phát hiện mù bằng cách ước lượng thông tin giấu trên LSB của miền không gian dựa trên lý thuyết trùng khớp.Bài toán 2: Kỹ thuật phát hiện có ràng buộc cho ảnh có giấu tin sử dụng kỹ thuật giấu đã biết gồm:
  • Kỹ thuật giấu thuận nghịch IWH trên hệ số wavelet.
  • Kỹ thuật giấu thuận nghịch DIH trên hệ số sai phân.
  • Kỹ thuật giấu HKC trên miền không gian.
  • Kỹ thuật giấu RVH với hai pha ngang dọc.Tiến hành thực nghiệm trên những bộ dữ liệu có số lượng ảnh lớn để so sánh kỹ thuật mới đề xuất với các kỹ thuật khác đã biết. Tập ảnh sử dụng để thử nghiệm gồm một phần ảnh tải về từ các thư viện ảnh trực tuyến của trường đại học Washington [103], đại học Southern California [107] và một phần được tạo ra từ máy ảnh kỹ thuật số và điện thoại di động.

Tổ chức luận án

Luận án gồm ba chương, mỗi chương đều có phần giới thiệu và phần kết luận chương.

  • Chương 1 giới thiệu tổng quan về giấu tin trong ảnh, phát hiện ảnh có giấu tin và các nghiên cứu liên quan. Ngoài ra, chương này còn nêu ra phương pháp đánh giá các kỹ thuật phát hiện ảnh có giấu tin theo chuẩn đánh giá độ chính xác (Precision), độ bao phủ (Recall), độ trung bình điều hòa (F-measure) và nguồn dữ liệu ảnh sử dụng để thử nghiệm.
  • Chương 2 đề xuất một số kỹ thuật phát hiện mù cho ảnh có giấu tin trên LSB gồm các kỹ thuật phát hiện: “độ lệch chuẩn”, “tỉ lệ xám” và phát hiện bằng phương pháp ước lượng thông tin giấu trong sử dụng lý thuyết “trùng khớp”. Từ đó đưa ra kết quả so sánh giữa các kỹ thuật đề xuất và một số phương pháp phát hiện mù khác: 2 với n bậc tự do của A. Westfeld [15], LLRT của K. Sullivan [80] và kỹ thuật ước lượng: RS của Jessica Fridrich và cộng sự [31], DI của T. Zhang và X. Ping [102] cho thấy kết quả tương đương và hiệu quả hơn ở một số trường hợp.
  • Chương 3 đề xuất bốn kỹ thuật phát hiện có ràng buộc cho ảnh có giấu tin sử dụng một số kỹ thuật giấu tin đã biết: DIH, HKC, IWH và RVH. Các kết quả thử nghiệm cho thấy độ tin cậy của kỹ thuật phát hiện đề xuất.
  • Phần cuối cùng là phần kết luận chung và phụ lục. Phụ lục chương trình đề mô với hai mô đun chính: Mô đun giấu tin và mô đun phát hiện ảnh giấu tin. Mỗi mô đun gồm các chức năng phục vụ các thử nghiệm trong luận án.

Link tải tài liệu: https://tii.la/4fBlughv

Lưu ý: Link tải có chứa quảng cáo được rút gọn bằng Shrinkearn.com

Mật khẩu mở tệp PDF: sharetailieu.net

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Mới Nhất

Cùng Chuyên Mục

Đọc Nhiều Nhất