henry_d_880

New Member

Download miễn phí Giấu tin trong mô hình sinh thơ lục bát





Ta chọn xây dựng văn phạm sinh thơ lục bát. Lục bát là thể thơ truyền thống của Việt Nam, một bài thơ lục bát là tập hợp của nhiều câu lục bát, mỗi câu thường ngắt nhịp theo 2 tiếng, độ dài của bài thơ là không giới hạn. Điều này thuận lợi cho việc xây dựng văn phạm, mã hóa văn phạm, có khả năng chống tấn công, đặc điểm thể loại thơ (mức độ trừu tượng của ngữ nghĩa, tính chất vần điệu chặt chẽ) còn hạn chế được sự nghi ngờ do vẫn còn sự ngô nghê của câu chữ.



Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:

GIẤU TIN TRONG MÔ HÌNH SINH THƠ LỤC BÁT
Nguyễn Vũ Linh, Nguyễn Xuân Hoài, Nguyễn Văn Xuất
Nhóm nghiên cứu NC (Natural Computation Group),
Khoa CNTT – Học viện Kỹ Thuật Quân Sự.
E-mail: [email protected], [email protected], [email protected]
Tóm tắt
Bài báo này trình bày một nghiên cứu của nhóm tác giả về các phương pháp giấu tin bằng mô hình sinh ngôn ngữ và thể hiện cụ thể trong việc sinh một dạng văn bản đặc biệt, dạng thơ lục bát cổ truyền. Kết quả nghiên cứu cho thấy giấu tin trong mô hình sinh thơ lục bát là một kỹ thuật giấu tin hứa hẹn mang đặc trưng ngôn ngữ và văn hoá Việt nam, đồng thời nghiên cứu cũng chỉ ra một số cách tấn công và chống tấn công vào các file chứa thơ.
I. Đặt vấn đề
Giấu tin là để thông tin được truyền đi một cách bí mật, tránh việc ăn cắp thông tin hay xuyên tạc nó. Người ta đã sử dụng nhiều kỹ thuật để giấu thông tin cần truyền vào nhiều nơi như giấu vào file ảnh, file văn bản, file âm thanh … Thông điệp mật thường được chèn vào file chứa, ghi đè lên một phần file chứa (thay thế) hay file chứa được sinh ra có chứa thông điệp. Ta gọi là các phương pháp chèn, thay thế và sinh. Trên thực tế người ta chủ yếu dùng phương pháp chèn và thay thế, phương pháp sinh cũng đã được nghiên cứu trong [1] nhưng rất hạn chế và khó áp dụng vào thực tế . Dùng phương pháp chèn thì sẽ làm tăng kích thước file chứa, phương pháp thay thế thì sẽ làm giảm chất lượng file chứa, đây là những điều không thể tránh khỏi. Với phương pháp sinh, vì file chứa là được sinh ra mới hoàn toàn nên không sợ có sự thay đổi về kích thước hay chất lượng file nhưng nội dung file chứa thường khó giống thật ( ví dụ như sinh file ảnh thì ảnh đó phải là ảnh gì đó hay file văn bản thì nội dung không được ngô nghê quá). Và điều này có thể hạn chế được.
Vậy ta chọn mô hình sinh để giấu tin, nhưng vấn đề đặt ra là sinh cái gì?
Thực tế xảy ra chiến tranh, khi điều kiện truyền đa phương tiện số không thực hiện được, thông tin chỉ có thể truyền qua sóng radio hay những tài liệu viết tay như các bài phát thanh, bình luận, báo in, thư tay. Giấu tin vào những đoạn văn bản đó là một ý tưởng rất hay. Như vậy ta sẽ chọn mô hình sinh ngôn ngữ để nghiên cứu, cụ thể là mô hình sinh thơ lục bát, một thể thơ cổ truyền đặc sắc và rất Việt Nam.
II. Giấu tin
1. Định nghĩa
Giấu tin là thao tác nhúng thông tin vào trong các dạng dữ liệu số hóa như tập tin ảnh, tập tin âm thanh, tập tin văn bản … Thao tác này được tiến hành theo nhiều cách khác nhau tùy theo từng phương pháp và mục đích. Nhìn chung bài toán giấu tin gồm hai quá trình :
Nhúng tin ( hay còn gọi là mã hóa ).
Trích rút tin ( giải mã ).
Ví dụ :
Trên ảnh :
Mã hóa thông điệp và nhúng các bít của thông điệp vào trong ảnh
Bức ảnh dưới đã được nhúng thông tin.
Trên văn bản :
Giả sử đối tượng chứa là đoạn văn bản có nội dung sau
“Apparently neutral’s protect is thoroughly discounted and ignored. Isman hard hit. Blockade issue affects for pretext embargo on by-products, ejecting suets and vegetable oils”
Và thông điệp cần chuyển tải là : “Pershing sails for YN June 1”
Đoạn văn bản trên chính là đoạn thông điệp mật mà gián điệp Đức đã sử dụng trong chiến tranh thế giới lần II.
2. Đối tượng của bài toán giấu tin
Trong bài toán giấu tin có 4 đối tượng chính là:
- Thông tin mật : Là thông tin nhúng vào đối tượng chứa và là thông tin cần được bảo vệ. Tùy theo từng phương pháp cụ thể thông tin này được bảo vệ với các mức độ khác nhau.
- Đối tượng chứa : Là đối tượng dùng để chứa thông điệp mật. Đối tượng này còn được gọi là Cover - , tùy thuộc vào loại dữ liệu mà nó mang tên khác nhau : Cover – Image, Cover – Audio, Cover – Text …
- Đối tượng đã nhúng: Là đối tượng chứa sau khi nhúng thông tin mật, còn được gọi là Stego - , với Data Type tương ứng với kiểu dữ liệu của đối tượng chứa. Ví dụ nếu đối tượng chứa là ảnh thì đối tượng đã nhúng là Stego – Image. Một số tài liệu đã gọi đối tượng đã nhúng là đối tượng đã đánh dấu.
- Khóa mật: Là khóa tham gia vào quá trình nhúng, tùy theo từng thuật toán mà khóa này có tham gia hay không. Đối tượng này còn có tên Stego – Key.
3. Yêu cầu trong một bài toán giấu tin
- Tính bền vững : Thể hiện khả năng ít bị thay đổi trước những tấn công từ bên ngoài như thay đổi định dạng, nội dung. Hiện nay chưa có phương pháp nào đảm bảo biện pháp này một cách tuyệt đối. Với từng ứng công cụ thể thì yêu cầu này cũng thể hiện khác nhau.
- Khả năng không bị phát hiện: thể hiện ở việc khó xác định được đối tượng có chứa thông tin mật hay không. Hầu hết các phương pháp giấu tin dựa trên đặc điểm của hai hệ tri giác người: thị giác và thính giác. Khả năng này còn gọi là khả năng giả dạng.
- Khả năng lưu trữ: Khả năng này thể hiện ở lượng thông tin của thông điệp mật có thể nhúng trong đối tượng chứa. Do tính bảo mật nên khả năng lưu trữ luôn bị hạn chế. Do đó trong trường hợp muốn ẩn một thông tin có kích thước tương đối lớn ta thường chia nhỏ ra nhiều thành phần và thực hiện nhúng từng phần.
Lưu trữ
Bảo mật
Bản quyền
Khả năng Lưu trữ
Khả năng không bị phát hiện
Tính bền vững
4. Steganography
Steganography là một trong hai kỹ thuật ( Steganography và Watermarking ) của lĩnh vực giấu tin. Kỹ thuật sử dụng trong bài báo này là Steganogaphy. Ta có thể hiểu kỹ thuật này như sau:
Giấu thông tin (Steganography) là một kỹ thuật nhúng thông tin (embeding) vào trong một nguồn đa phương tiện gọi là phương tiện chứa (host data) mà không gây ra sự nhận biết về sự tồn tại của thông tin giấu (invisible).
Sự khác biệt chủ yếu giữa mã hóa thông tin và giấu thông tin là phương pháp mã hóa làm cho các thông tin hiện rõ là nó có được mã hóa hay không còn đối với phương pháp giấu tin thì người ta sẽ khó mà biết được là có thông tin giấu bên trong do tính chất ẩn của thông tin được giấu.
Còn với Watermarking thì Steganography quan tâm đến ứng dụng che giấu các bản tin đòi hỏi có độ bí mật và dung lượng càng lớn càng tốt (thường là truyền thông tin). Thông tin được giấu sao cho người khác không biết được là có thông tin giấu trong đối tượng chứa. Còn Watermarking quan tâm nhiều đến giấu những mẩu tin ngắn nhưng đòi hỏi độ bền vững cao (thường là chữ ký số). Bảo mật cho chính đối tượng chứa (host data).
5. Phân loại
Nếu xem xét các phương pháp giấu tin qua việc xem thông điệp được ẩn như thế nào và nơi thông điệp sẽ được ẩn người ta chia Steganography thành 3 loại: Giấu tin bằng phương pháp chèn, giấu tin bằng phương pháp thay thế, giấu tin bằng phương pháp sinh.
a. Giấu tin dựa vào phương pháp chèn
Kỹ thuật chèn này có sự khác biệt là ở chỗ nó tìm một vị trí trong file mà ứng dụng bỏ qua khi đọc file. Về cơ bản, bạn chèn dữ liệu vào một file, việc này làm tăng kích thước của file lên nhưng không làm ảnh hưởng đến sự thể hiện (tái hiện, nghe nhìn) của dữ liệu.
Ví dụ với một vài file có gọi cờ EOF. Cờ này báo hiệu cho ứng dụng rằng đang đọc file đến tận cuối file và vì th
 

Các chủ đề có liên quan khác

Top