2

Lý lịch:

Xử lý dữ liệu sản xuất là một thách thức, nhưng hầu hết các tổ chức trên thế giới đều có biện pháp bảo vệ môi trường sản xuất đúng cách. Tuy nhiên, khi nói đến môi trường phi sản xuất như môi trường Dev (Phát triển) hoặc Môi trường thử nghiệm, v.v., họ vẫn làm không có an ninh thích hợp tại chỗ. Bảo vệ dữ liệu nhạy cảm không chỉ là trách nhiệm đạo đức của một tổ chức, nhưng trong một số trường hợp nhất định, nó cũng được yêu cầu bởi các tiêu chuẩn quản lý. Dữ liệu này có thể thuộc về khách hàng hoặc thậm chí là nhân viên của tổ chức. Dù bằng cách nào, nên có biện pháp bảo vệ thích hợp để đảm bảo dữ liệu cư trú với tổ chức được an toàn.  Để có cái nhìn sâu hơn về mặt nạ dữ liệu, hãy xem các  khóa học bảo mật thông tin  được cung cấp bởi Viện Infecec. 

Mục tiêu & Phạm vi:

Bài viết này sẽ tập trung vào việc cung cấp cho người đọc một cái nhìn tổng quan về mặt nạ dữ liệu. Các chiến lược triển khai tập trung vào các yếu tố của các giải pháp che giấu dữ liệu trên phạm vi hướng tới phạm vi của bài viết này. Có nói rằng, chúng ta vẫn sẽ trình bày một ví dụ cho thấy toàn bộ quá trình hoạt động như thế nào để đơn giản hóa khái niệm và giải thích tương tự cho người dùng. Người đọc nên lưu ý rằng đây không phải là cách duy nhất để che giấu dữ liệu có thể được thực hiện.

Mục đích của bài viết này là giới thiệu cho người dùng về khái niệm mặt nạ dữ liệu và những gì nó có thể đạt được cho một tổ chức. Chúng tôi cũng sẽ liệt kê một số sản phẩm thương mại có thể được sử dụng để che giấu dữ liệu tổ chức nhạy cảm.

Dữ liệu nhạy cảm là gì?

Định nghĩa của dữ liệu Nhạy cảm khá rộng và thay đổi từ quốc gia này sang quốc gia khác, tổ chức này sang tổ chức khác, và thậm chí từ cá nhân sang cá nhân. Ở một số quốc gia như Hoa Kỳ - dữ liệu như Số An sinh Xã hội được coi là cực kỳ nhạy cảm. Tương tự hồ sơ sức khỏe cũng được coi là thông tin nhạy cảm.

Trên toàn cầu, mọi quận đều chấp nhận rằng Dữ liệu thẻ tín dụng / thẻ ghi nợ là dữ liệu nhạy cảm - rõ ràng là chi tiết về số thẻ và mã pin / CVV / CVV2.

Mặc dù chúng tôi đã thảo luận về SSN và Dữ liệu Thẻ, chúng tôi đã đề cập đến từng khu vực. Mọi tổ chức cũng có dữ liệu nhất định được phân loại là nhạy cảm. Ví dụ: Chi tiết mức lương của nhân viên có thể được coi là dữ liệu nhạy cảm. Tương tự, sở hữu trí tuệ hoặc dữ liệu nghiên cứu cũng được coi là nhạy cảm trong tự nhiên. Điều này thay đổi từ tổ chức để tổ chức.

Tại sao dữ liệu an toàn?

Đã có trường hợp dữ liệu khách hàng quan trọng, khi bị mất, khiến một tổ chức phải đối mặt với các vụ kiện và chi hàng triệu đô la để giải quyết chúng. Đây có thể là một chi phí rất lớn cho bất kỳ tổ chức nào trong trường hợp không may khi mất dữ liệu quan trọng của khách hàng.

Một số tiêu chuẩn tuân thủ như PCI DSS có các yêu cầu cụ thể liên quan đến Bảo mật dữ liệu. Tôi sẽ không bao gồm từng tiêu chuẩn tuân thủ, tuy nhiên tôi sẽ giải thích tiêu chuẩn PCI DSS là một ví dụ.

Một trong những yêu cầu về PCI DSS 6.3.4 cho biết dữ liệu Sản xuất (PAN sống) không được sử dụng để thử nghiệm hoặc phát triển.

Yêu cầu nêu trên đủ rõ ràng - một tổ chức không thể sử dụng PAN trực tiếp (Số tài khoản vĩnh viễn). Tuy nhiên, phần khó hơn là thực hiện. Không có dữ liệu này - làm thế nào để phát triển và thử nghiệm ứng dụng? Vì thực tế, chúng tôi chỉ cần Số tài khoản vĩnh viễn, không cần phải là số hợp lệ!

Hiểu rõ điều này có thể giúp chúng tôi che giấu dữ liệu của mình bằng cách ánh xạ các PAN trực tiếp hiện tại sang PAN giả. Người kiểm thử chỉ cần sản xuất như dữ liệu có thể giúp họ mô phỏng thử nghiệm - không phải dữ liệu trực tiếp. Yêu cầu PCI DSS nhấn mạnh vào PAN vì đây là một trong những dữ liệu chủ thẻ nhạy cảm nhất. Yêu cầu bổ sung thêm rằng dữ liệu sản xuất không nên được sử dụng trong môi trường phát triển hoặc Thử nghiệm. Đây là nơi che giấu dữ liệu có thể hữu ích.

Dữ liệu mặt nạ là gì?

Mặt nạ dữ liệu không có gì ngoài che khuất các hồ sơ cụ thể trong cơ sở dữ liệu. Việc che giấu dữ liệu đảm bảo rằng dữ liệu nhạy cảm được thay thế bằng dữ liệu thực nhưng không phải dữ liệu thực trong môi trường thử nghiệm, do đó đạt được cả hai mục đích - bảo vệ dữ liệu nhạy cảm và đảm bảo dữ liệu thử nghiệm là hợp lệ và có thể kiểm tra được.

Có thể có nhiều cách để che giấu dữ liệu có thể được thực hiện. Nó có thể là sự thay thế của các bản ghi hiện tại bằng dữ liệu thử nghiệm dự kiến ​​hoặc xáo trộn một số ký tự hoặc số nhất định, do đó tạo ra một bản ghi mới. Ngoài ra, nó có thể phức tạp như sử dụng thuật toán độc quyền để xáo trộn hoặc làm xáo trộn một phần của bản ghi một cách ngẫu nhiên dữ liệu được tạo bằng thuật toán có tất cả các thuộc tính mà dữ liệu gốc có.

Mặt nạ dữ liệu không chỉ là về Dữ liệu thử nghiệm. Trong thực tế, khái niệm này có thể được áp dụng cho mọi tình huống trong đó một tổ chức không muốn tiết lộ dữ liệu thực. Ví dụ: Thông tin về lương của mỗi nhân viên. Cho dù bất kỳ tiêu chuẩn tuân thủ nào rõ ràng coi đây là dữ liệu nhạy cảm hay không, thông tin liên quan đến tiền lương vẫn là thông tin nhạy cảm từ quan điểm của tổ chức, và do đó bảo vệ điều tương tự cũng có ý nghĩa đối với nó. Kỹ thuật mặt nạ dữ liệu cũng có thể được áp dụng ở đây. Có thể có nhiều kịch bản như vậy. Phần sau đây giải thích chi tiết ví dụ này để hiểu cách

Kịch bản mẫu:

Hãy thử và mở rộng về tuyên bố vấn đề đã thảo luận trước đây. Làm thế nào chúng tôi có thể đảm bảo rằng dữ liệu kiểm tra hợp lệ có mặt, nhưng đồng thời, chúng tôi cũng không làm rò rỉ bất kỳ mức lương nào của nhân viên? Chúng tôi không thể thay đổi id hoặc số nhân viên vì id hoặc số nhân viên có thể là khóa chính trong cơ sở dữ liệu làm rối tung các bản ghi này và áp dụng mã hóa, hoặc thay đổi khóa chính sẽ khiến hồ sơ dữ liệu trở nên vô dụng.

Chúng ta có thể giải quyết vấn đề này bằng cách xáo trộn các chi tiết tiền lương của nhân viên. Tuy nhiên, có một vài thử thách trước khi chúng ta tranh giành các chi tiết. Nếu kỳ vọng là khôi phục dữ liệu bị xáo trộn trở lại, nó có thể không được chuyển thẳng. Giả sử dữ liệu trực tiếp là độc lập và chúng tôi không quan tâm đến những gì xảy ra để kiểm tra dữ liệu miễn là độ dài, loại dữ liệu và các ràng buộc kinh doanh khác được đáp ứng, chúng tôi có thể sử dụng Substitutionto thay đổi dữ liệu thử nghiệm.

Chúng tôi có thể tạo một bản sao của trường lương của nhân viên và chọn ngẫu nhiên các hồ sơ. Khi chúng tôi có sẵn một danh sách các trường lương ngẫu nhiên, chúng tôi có thể sử dụng nó để thay thế các trường lương hiện có bằng cách thay thế chúng bằng danh sách mới. Thay phiên, chúng tôi cũng có thể tự tạo một danh sách các mức lương và sau đó thay thế chúng. Mục tiêu cuối cùng là đảm bảo rằng tiền lương của mỗi nhân viên được xáo trộn với dữ liệu thực tế - nhưng không phải là dữ liệu thực.

|