Bông tuyết Python lấy tên cột

Tóm tắt nội dung. Ngoài các bộ phân loại tích hợp sẵn, Sensitive Data Discovery có thể sử dụng các bộ phân loại tùy chỉnh để khám phá và áp dụng các thẻ cho dữ liệu nhạy cảm. Trang này trình bày chi tiết cách tạo trình phân loại biểu thức chính quy tên cột tùy chỉnh. Để biết chi tiết cụ thể và ví dụ về các trình phân loại khác, hãy xem hướng dẫn Tạo trình phân loại từ điển tùy chỉnh hoặc Tạo trình phân loại Regex tùy chỉnh

Trường hợp sử dụng. Tên cột tùy chỉnh Trình phân loại Regex

Kịch bản. Bạn đã liệt kê các trình phân loại tích hợp sẵn của Immuta cho Khám phá dữ liệu nhạy cảm, nhưng bạn phát hiện ra rằng không có trình phân loại nào có thể tự động phát hiện và gắn thẻ các cột chứa số tài khoản trong cơ sở dữ liệu của bạn

Trình phân loại biểu thức chính quy [regex] tên cột tùy chỉnh cho phép bạn tạo trình phát hiện của riêng mình, cho phép Khám phá dữ liệu nhạy cảm của Immuta để tìm tên cột khớp dựa trên mẫu biểu thức chính quy. Ví dụ: nếu cơ sở dữ liệu của bạn chứa các bảng có số an sinh xã hội, bạn có thể xác định một mẫu biểu thức chính quy để đối sánh lại tên của cột thay vì các giá trị trong cột. Hướng dẫn dưới đây sử dụng kịch bản này để minh họa việc tạo bộ phân loại này

Các thuộc tính của Trình phân loại Regex tên cột tùy chỉnh

Các thuộc tính của tất cả các trình phân loại tùy chỉnh được cung cấp trên trang API Khám phá dữ liệu nhạy cảm. Tuy nhiên, các thuộc tính dành riêng cho trình phân loại biểu thức chính quy tên cột tùy chỉnh được nêu trong bảng bên dưới

AttributeDescriptionRequiredname
immuta api sdd/classifier -X POST --input ./example-payload.json
1 Tên bộ phân loại duy nhất, thân thiện với yêu cầu. YesdisplayName
immuta api sdd/classifier -X POST --input ./example-payload.json
1 Tên phân loại duy nhất, con người có thể đọc được. Yesdescription
immuta api sdd/classifier -X POST --input ./example-payload.json
1 Mô tả bộ phân loại. Yestype
immuta api sdd/classifier -X POST --input ./example-payload.json
1 Loại phân loại.
immuta api sdd/classifier -X POST --input ./example-payload.json
5. Yesconfig
immuta api sdd/classifier -X POST --input ./example-payload.json
6 Bao gồm
immuta api sdd/classifier -X POST --input ./example-payload.json
0 và
immuta api sdd/classifier -X POST --input ./example-payload.json
1. *Xem mô tả cho những điều dưới đây. Yestags*
immuta api sdd/classifier -X POST --input ./example-payload.json
2 Tên của các thẻ sẽ áp dụng cho nguồn dữ liệu. Ghi chú. Tất cả các thẻ phải bắt đầu bằng
immuta api sdd/classifier -X POST --input ./example-payload.json
3. YescolumnNameRegex*
immuta api sdd/classifier -X POST --input ./example-payload.json
1 Biểu thức chính quy không phân biệt chữ hoa chữ thường để đối sánh với tên cột. Đúng

Tạo một tên cột tùy chỉnh Trình phân loại Regex

  1. Tạo khóa API của bạn trên và lưu khóa API ở nơi an toàn. Bạn sẽ bao gồm khóa API này trong tiêu đề ủy quyền khi bạn yêu cầu API Immuta hoặc sử dụng nó để

  2. Lưu tải trọng của trình phân loại biểu thức chính quy tên cột tùy chỉnh trong một. tập tin json. Regex

    immuta api sdd/classifier -X POST --input ./example-payload.json
    
    5 tìm kiếm các tên cột phù hợp với
    immuta api sdd/classifier -X POST --input ./example-payload.json
    
    6,
    immuta api sdd/classifier -X POST --input ./example-payload.json
    
    7 hoặc
    immuta api sdd/classifier -X POST --input ./example-payload.json
    
    8

    ________số 8

  3. Tạo trình phân loại bằng một trong các phương pháp này

    API CLIHTTP bất biến

    CLI bất biến

    immuta api sdd/classifier -X POST --input ./example-payload.json
    

    API HTTP

    immuta api sdd/classifier -X POST --input ./example-payload.json
    
    0

  4. Nếu yêu cầu thành công, bạn sẽ nhận được phản hồi chứa thông tin chi tiết về trình phân loại

    Snowflake là một trong số ít kho dữ liệu đám mây sẵn sàng cho doanh nghiệp mang lại sự đơn giản mà không phải hy sinh các tính năng. Nó tự động thay đổi quy mô, cả lên và xuống, để đạt được sự cân bằng phù hợp giữa hiệu suất so với. Giá cả. Tuyên bố nổi tiếng của Snowflake là nó tách máy tính khỏi bộ lưu trữ. Điều này rất quan trọng vì hầu hết mọi cơ sở dữ liệu khác, bao gồm Redshift, kết hợp cả hai, nghĩa là bạn phải xác định quy mô cho khối lượng công việc lớn nhất của mình và chịu chi phí đi kèm. Trong kịch bản này, chúng ta sẽ tìm hiểu cách tạo cơ sở dữ liệu trong Snowflake, tạo bảng và đổi tên cột bằng câu lệnh thay đổi

    Tìm hiểu cách xây dựng đường ống dữ liệu trong Snowflake

    Yêu cầu hệ thống

    Bước 1. Đăng nhập vào tài khoản

    Chúng tôi cần đăng nhập vào tài khoản bông tuyết. Đi đến bông tuyết. com và sau đó đăng nhập bằng cách cung cấp thông tin đăng nhập của bạn. Thực hiện theo các bước được cung cấp trong liên kết ở trên

    Bước 2. Tạo cơ sở dữ liệu trong Snowflake

    Chúng ta có thể tạo nó theo hai cách. sử dụng câu lệnh CREATE DATABASE

    Ghi chú. Bạn không cần tạo lược đồ trong cơ sở dữ liệu vì mỗi cơ sở dữ liệu được tạo trong Snowflake chứa một lược đồ mặc định có tên là public

    Cú pháp của tuyên bố

    immuta api sdd/classifier -X POST --input ./example-payload.json
    
    8

    Ví dụ về tuyên bố

    immuta api sdd/classifier -X POST --input ./example-payload.json
    
    9

    Đầu ra của tuyên bố trên. Như bạn có thể thấy, câu lệnh trên được chạy thành công trong hình bên dưới

    Bước 3. Chọn cơ sở dữ liệu

    Để chọn cơ sở dữ liệu mà bạn đã tạo trước đó, chúng ta sẽ sử dụng câu lệnh "use"

    Cú pháp của tuyên bố

    immuta api sdd/classifier -X POST --input ./example-payload.json
    
    0

    Ví dụ về tuyên bố

    immuta api sdd/classifier -X POST --input ./example-payload.json
    
    1

    Bước 4. Tạo bảng trong Snowflake bằng cách sử dụng Tạo câu lệnh

    Ở đây chúng ta sẽ tạo một bảng bằng cách sử dụng câu lệnh tạo như hình bên dưới. Nó tạo một bảng mới trong lược đồ hiện tại/được chỉ định hoặc thay thế một bảng hiện có

    Cú pháp của tuyên bố

    immuta api sdd/classifier -X POST --input ./example-payload.json
    
    2

    Ví dụ về Tạo bảng

    immuta api sdd/classifier -X POST --input ./example-payload.json
    
    3

    Đầu ra của tuyên bố trên

    Bước 5. Đổi tên cột

    Ở đây chúng ta sẽ đổi tên cột bằng câu lệnh Alter table như hình bên dưới. Câu lệnh ALTER sửa đổi các thuộc tính, cột hoặc ràng buộc cho một bảng hiện có

    Cột Information_schema là gì?

    INFORMATION_SCHEMA. Chế độ xem COLUMNS cho phép bạn lấy thông tin về tất cả các cột cho tất cả các bảng và dạng xem trong cơ sở dữ liệu . Theo mặc định, nó sẽ hiển thị cho bạn thông tin này cho mọi bảng và dạng xem trong cơ sở dữ liệu.

    Snowflake Information_schema là gì?

    Lược đồ thông tin bông tuyết [còn gọi là “Từ điển dữ liệu”] bao gồm một tập hợp các dạng xem và hàm bảng do hệ thống xác định cung cấp thông tin siêu dữ liệu mở rộng về các đối tượng được tạo trong tài khoản của bạn< . .

Chủ Đề