Snowflake ID là gì

Lược đồ đa chiều được thiết kế để xây dựng mô hình hệ thống kho dữ liệu.

Mục đích chính của các lược đồ này là giải quyết nhu cầu của cơ sở dữ liệu lớn hơn được xây dựng cho mục đích phân tích [OLAP].

Phương pháp này được sử dụng để sắp xếp dữ liệu trong cơ sở dữ liệu với sự sắp xếp tốt các nội dung trong cơ sở dữ liệu. Lược đồ cho phép khách hàng đặt các câu hỏi liên quan đến xu hướng kinh doanh hoặc thị trường.

Hơn nữa, một lược đồ đa chiều đại diện cho dữ liệu dưới dạng các khối dữ liệu cho phép xem và mô hình hóa dữ liệu từ các góc độ và thứ nguyên khác nhau.

Nó có ba loại, nhưng nhiều người nhầm lẫn giữa ngôi sao và Snowflake. Do đó, họ trở nên khó khăn trong việc lựa chọn mô hình phù hợp.

Nếu bạn là một trong số họ, hãy thảo luận về sự khác biệt giữa giản đồ ngôi sao và bông tuyết, bắt đầu với định nghĩa và hiểu những lợi ích, thách thức, sơ đồ và đặc điểm của chúng.

  • Lược đồ đa chiều là gì?
  • Star vs. Snowflake: Họ là gì?
    • Lược đồ sao là gì?
    • Lược đồ Snowflake là gì?
  • Star vs. Snowflake: Chúng hoạt động như thế nào?
    • Lược đồ Sao hoạt động như thế nào?
    • Lược đồ Bông tuyết hoạt động như thế nào?
  • Star vs. Snowflake: Đặc điểm
    • Đặc điểm của giản đồ sao
    • Đặc điểm của giản đồ bông tuyết
  • Star vs. Snowflake: Ưu điểm
    • Ưu điểm của giản đồ sao
    • Ưu điểm của giản đồ bông tuyết
  • Star vs. Snowflake: Hạn chế
    • Hạn chế của lược đồ sao
    • Hạn chế của Lược đồ bông tuyết
  • Star vs. Snowflake: Sự khác biệt
    • Sự kết luận
    • Share this post!

Lược đồ đa chiều là gì?

Lược đồ đề cập đến mô tả logic của một cơ sở dữ liệu hoàn chỉnh và các ổ chứa dữ liệu. Nó bao gồm tên của các bản ghi và mô tả của chúng, bao gồm cả tổng hợp và các mục dữ liệu liên quan.

Cơ sở dữ liệu thường sử dụng mô hình quan hệ để mô tả, trong khi hệ thống kho dữ liệu sử dụng mô hình Lược đồ.

Lược đồ đa chiều có thể được định nghĩa bằng Ngôn ngữ truy vấn khai thác dữ liệu [DMQL].

Để xác định các kho dữ liệu và kho dữ liệu, nó sử dụng hai nguyên thủy – định nghĩa kích thước và định nghĩa hình khối.

Lược đồ nhiều chiều sử dụng các loại mô hình lược đồ khác nhau. Họ đang:

  • Giản đồ sao
  • Lược đồ bông tuyết
  • Giản đồ thiên hà

Hãy thảo luận về lược đồ ngôi sao và bông tuyết là gì.

Lược đồ sao là gì?

Lược đồ hình sao là một mô hình lưu trữ dữ liệu kiến ​​trúc và thông minh kinh doanh yêu cầu một bảng dữ kiện duy nhất để lưu trữ dữ liệu được đo lường và giao dịch. Nó cũng sử dụng các bảng có kích thước nhỏ hơn khác nhau để chứa các thuộc tính về dữ liệu kinh doanh.

Nó được đặt tên theo cấu trúc của nó. Giống như một ngôi sao, bảng dữ kiện chiếm vị trí của nó ở trung tâm của sơ đồ và các bảng có kích thước nhỏ nằm giống như các nhánh với bảng trung tâm để tạo thành một cấu trúc giống như ngôi sao.

Mỗi lược đồ hình sao đều bao gồm một bảng dữ kiện duy nhất nhưng có nhiều bảng kích thước nhỏ. Các bảng dữ kiện bao gồm dữ liệu cụ thể, có thể đo lường cần được phân tích, chẳng hạn như hiệu suất đã ghi, dữ liệu tài chính hoặc hồ sơ bán hàng. Nó có thể là một bản tóm tắt của dữ liệu lịch sử tại một thời điểm hoặc giao dịch.

Hơn nữa, lược đồ Star là giản đồ đơn giản và cơ bản nhất trong số các kho dữ liệu và lược đồ kho dữ liệu. Nó hiệu quả trong việc xử lý các truy vấn cơ bản. Giản đồ hình sao thường hỗ trợ thông minh kinh doanh, truy vấn đặc biệt, ứng dụng phân tích và các khối xử lý phân tích trực tuyến.

Lược đồ hình sao cũng hỗ trợ đếm, trung bình, tổng và các tổng hợp khác của nhiều bản ghi. Người dùng có thể dễ dàng lọc và nhóm các tổng hợp theo thứ nguyên. Ví dụ: người dùng tạo các truy vấn như “tìm tất cả hồ sơ bán hàng trong tháng 6” hoặc “phân tích tổng doanh thu từ văn phòng XYZ vào năm 2022”.

Lược đồ Snowflake là gì?

Lược đồ bông tuyết là một mô hình dữ liệu đa chiều, còn có thể được gọi là phần mở rộng của lược đồ hình sao. Điều này là do các bảng thứ nguyên trong lược đồ bông tuyết được chia thành các thứ nguyên phụ.

Một lược đồ là một bông tuyết nếu một hoặc nhiều bảng thứ nguyên không liên kết trực tiếp đến bảng dữ kiện mà là kết nối thông qua các bảng thứ nguyên khác.

Snowflaking là một hiện tượng chuẩn hóa các bảng kích thước trong giản đồ hình sao. Khi bạn chuẩn hóa tất cả các bảng kích thước, cấu trúc kết quả giống như một bông tuyết chứa một bảng dữ kiện ở giữa cấu trúc.

Nói một cách đơn giản, lược đồ bông tuyết bao gồm một bảng dữ kiện ở giữa mô hình, được kết nối với các bảng thứ nguyên, lại được liên kết với các bảng thứ nguyên khác. Lược đồ này được sử dụng để nâng cao hiệu suất của các truy vấn.

Mô hình được tạo ra để truy vấn nhanh chóng, linh hoạt trên các mối quan hệ và thứ nguyên phức tạp. Nó hữu ích cho một đến nhiều và nhiều mối quan hệ giữa các cấp kích thước khác nhau.

Do tuân thủ chặt chẽ hơn các tiêu chuẩn chuẩn hóa hơn, bạn sẽ nhận được hiệu quả lưu trữ cao hơn. Tuy nhiên, sự dư thừa dữ liệu là không đáng kể và hiệu suất thấp so với các mô hình dữ liệu không chuẩn hóa như lược đồ hình sao.

Star vs. Snowflake: Chúng hoạt động như thế nào?

Lược đồ Sao hoạt động như thế nào?

Bảng dữ kiện ở giữa mô hình ngôi sao lưu trữ hai loại thông tin – giá trị thuộc tính số và thứ nguyên. Hãy hiểu chúng với một ví dụ về cơ sở dữ liệu bán hàng.

  • Giá trị số là duy nhất cho mọi hàng và điểm dữ liệu. Điều này không tương quan hoặc liên quan đến dữ liệu được lưu trữ trong một hàng khác. Đây là những dữ kiện về một giao dịch nhất định, chẳng hạn như tổng số tiền, số lượng đặt hàng, thời gian chính xác, lợi nhuận ròng, ID đơn đặt hàng, v.v.
  • Các giá trị thuộc tính thứ nguyên không lưu trữ trực tiếp bất kỳ dữ liệu nào, thay vào đó, chúng lưu trữ các giá trị khóa ngoại cho hàng trong bảng chiều. Các hàng khác nhau trong bảng trung tâm sẽ tham chiếu thông tin này, chẳng hạn như giá trị dữ liệu, ID nhân viên bán hàng, ID văn phòng chi nhánh, ID sản phẩm, v.v.

Bảng thứ nguyên luôn lưu trữ thông tin hỗ trợ từ bảng dữ kiện. Mọi bảng thứ nguyên đều liên quan đến cột của bảng dữ kiện cùng với giá trị thứ nguyên và lưu trữ dữ liệu bổ sung về giá trị đó.

Ví dụ: Bảng thứ nguyên nhân viên sử dụng ID nhân viên làm giá trị khóa và cũng chứa thông tin, chẳng hạn như tên, giới tính, địa chỉ và số điện thoại. Tương tự, bảng kích thước sản phẩm lưu trữ thông tin, bao gồm tên sản phẩm, màu sắc, ngày đầu tiên đưa ra thị trường, chi phí sản xuất, v.v.

Lược đồ Bông tuyết hoạt động như thế nào?

Hãy nghĩ về một thiết kế bông tuyết với một hộp ở giữa và các kết nối khác nhau thông qua hộp đó với các chấm khác nhau. Để duy trì các siêu thị dữ liệu và kho dữ liệu, thiết kế giản đồ bông tuyết sẽ được đưa vào hình ảnh.

Nó tương tự như giản đồ sao nhưng với những thay đổi nhỏ. Không giống như giản đồ hình sao, giản đồ bông tuyết mở rộng các bảng thứ nguyên phụ của nó, các bảng này được liên kết với các bảng thứ nguyên.

Mục đích chính của mô hình này là chuẩn hóa thông tin không chuẩn hóa của mô hình sao. Bằng cách này, nó có thể giải quyết các vấn đề phổ biến liên quan đến giản đồ hình sao.

Ở cốt lõi của lược đồ, bạn sẽ tìm thấy một bảng dữ kiện liên kết với thông tin có trong các bảng thứ nguyên. Các bảng này lại tỏa ra bên ngoài các bảng thứ nguyên phụ có thông tin chi tiết mô tả thông tin bảng thứ nguyên.

Ví dụ: Lược đồ bông tuyết chứa bảng thông số bán hàng và vị trí cửa hàng, dòng, họ, sản phẩm và bảng thứ nguyên thời gian. Thứ nguyên thị trường bao gồm hai bảng thứ nguyên, với cửa hàng là bảng thứ nguyên chính và vị trí của cửa hàng là bảng thứ nguyên phụ. Kích thước sản phẩm có ba bảng kích thước phụ đề cập đến bảng kích thước phụ sản phẩm, dòng và gia đình.

Star vs. Snowflake: Đặc điểm

Đặc điểm của giản đồ sao

  • Lược đồ hình sao có thể lọc dữ liệu từ dữ liệu chuẩn hóa để đáp ứng nhu cầu lưu trữ dữ liệu. Khóa duy nhất được tạo từ thông tin liên quan cho mỗi bảng dữ kiện để xác định mọi hàng.
  • Nó cung cấp các tính toán và tổng hợp nhanh chóng, chẳng hạn như doanh thu của thu nhập đạt được và tổng số mặt hàng đã bán vào cuối mỗi tháng. Các chi tiết này có thể được lọc theo nhu cầu bằng cách đóng khung các truy vấn phù hợp.
  • Nó là phép đo các sự kiện bao gồm các giá trị số hữu hạn bao gồm khóa ngoại. Các khóa này có liên quan đến các bảng thứ nguyên. Có nhiều loại bảng dữ kiện khác nhau được đóng khung với các giá trị ở cấp độ nguyên tử.
  • Bảng thông tin giao dịch chứa dữ liệu về các sự kiện cụ thể, chẳng hạn như bán hàng và ngày lễ.
  • Các dữ kiện ghi chép bao gồm các khoảng thời gian nhất định như thông tin tài khoản vào cuối năm hoặc mỗi quý.
  • Bảng chiều cung cấp dữ liệu chi tiết về các thuộc tính hoặc bản ghi được tìm thấy trong bảng trung tâm.
  • Người sử dụng có khả năng tự thiết kế một chiếc bàn theo nhu cầu.
  • Bạn có thể sử dụng giản đồ sao để tích lũy các bảng ảnh chụp nhanh.

Đặc điểm của giản đồ bông tuyết

  • Lược đồ bông tuyết cần dung lượng ổ đĩa nhỏ.
  • Mô hình này dễ thực hiện do có bảng kích thước chính và riêng biệt.
  • Các bảng thứ nguyên chứa ít nhất hai thuộc tính để xác định thông tin ở nhiều hạt.
  • Do có nhiều bảng, hiệu suất thấp hơn so với giản đồ hình sao.
  • Lược đồ bông tuyết có mức toàn vẹn dữ liệu cao nhất và độ dư thừa thấp do quá trình chuẩn hóa.

Star vs. Snowflake: Ưu điểm

Ưu điểm của giản đồ sao

  • Lược đồ hình sao là cách đơn giản nhất trong số các lược đồ kho dữ liệu.
  • Nó có một logic báo cáo đơn giản. Logic này được ngụ ý động.
  • Nó được thiết kế bằng cách sử dụng các khối cho ăn được áp dụng thông qua Quy trình giao dịch trực tuyến để làm cho các khối hoạt động hiệu quả và hiệu quả.
  • Lược đồ hình sao được hình thành với các truy vấn và logic đơn giản dễ trích xuất từ ​​quá trình giao dịch.
  • Nó cung cấp hiệu suất nâng cao cho các ứng dụng báo cáo.
  • Nó được triển khai để kiểm soát việc khôi phục dữ liệu nhanh chóng.
  • Thông tin được lọc và chọn có thể được áp dụng dễ dàng trong các trường hợp khác nhau.

Ưu điểm của giản đồ bông tuyết

  • Lược đồ hình sao được sử dụng để phát triển hiệu suất truy vấn do yêu cầu lưu trữ đĩa ít hơn.
  • Nó cung cấp khả năng mở rộng lớn hơn trong các mối quan hệ giữa các thành phần và mức kích thước.
  • Nó dễ dàng hơn để bảo trì.
  • Lược đồ hình sao cung cấp khả năng truy xuất dữ liệu nhanh chóng.
  • Đó là một lược đồ dữ liệu phổ biến và đơn giản để lưu trữ dữ liệu.
  • Nó giúp nâng cao chất lượng dữ liệu.
  • Dữ liệu có cấu trúc làm giảm vấn đề về tính toàn vẹn của dữ liệu.

Star vs. Snowflake: Hạn chế

Hạn chế của lược đồ sao

Nó có một trạng thái không chuẩn hóa cao và toàn vẹn. Toàn bộ quá trình sẽ sụp đổ nếu người dùng không cập nhật dữ liệu. An ninh và bảo vệ cũng bị hạn chế. Ngoài ra, giản đồ sao không linh hoạt như mô hình phân tích. Nó không cung cấp hỗ trợ hiệu quả cho các mối quan hệ khác nhau.

Hạn chế của Lược đồ bông tuyết

Hạn chế chính mà bạn sẽ tìm thấy với Snowflake là các nỗ lực bảo trì bổ sung do số lượng bảng kích thước nhỏ ngày càng tăng. Nhiều truy vấn phức tạp khiến việc tìm kiếm dữ liệu cần thiết trở nên khó khăn. Ngoài ra, thời gian thực hiện câu hỏi cao do bảng cao hơn. Mô hình này cũng cứng nhắc và yêu cầu chi phí bảo trì cao hơn.

Star vs. Snowflake: Sự khác biệt

Star và Snowflake là loại lược đồ đa chiều nhưng có cấu trúc và tính chất khác nhau. Cái trước giống như một ngôi sao, và cái sau giống một bông tuyết, xác định tên của chúng.

Trong lược đồ hình sao, chỉ một phép nối duy nhất xây dựng mối quan hệ giữa bảng dữ kiện trung tâm và bảng thứ nguyên bên. Mặt khác, trong lược đồ bông tuyết, cần có nhiều phép nối để liên kết với các bảng thứ nguyên.

Lược đồ hình sao thường được sử dụng khi bạn có ít hàng hơn trong bảng thứ nguyên, trong khi lược đồ hình bông tuyết được sử dụng khi bảng thứ nguyên tương đối lớn.

Sơ đồ dưới đây phân biệt hai mô hình và cách các bảng kích thước và bảng dữ kiện được liên kết trong các lược đồ khác nhau.

ParametersStar SchemaSnowflake SchemaDisk space Giản đồStar sử dụng nhiều dung lượng đĩa hơn. Lược đồnowflake sử dụng ít dung lượng đĩa hơn. Chuẩn hóa hoàn toàn. cao hơn so với giản đồ hình sao.MaintenanceDo dư thừa dữ liệu cao nên việc duy trì giản đồ hình sao là một chút khó khăn.Do dư thừa dữ liệu thấp, nên dễ dàng duy trì và thay đổi giản đồ hình bông tuyết. các bản sao tồn tại trong các bảng thứ nguyên. Tính toàn vẹn của dữ liệu thấp vì nó hoàn toàn bình thường hóa các bảng thứ nguyên. Cấu trúc phân cấp Cấu trúc phân cấp cho bảng kích thước trong lược đồ hình sao được lưu trữ trong bảng kích thước. Cấu trúc phân cấp được chia thành các bảng kích thước riêng biệt.DB design Nó có một thiết kế DB đơn giản, một thiết kế DB rất phức tạp. Bảng dữ kiện được bao quanh bởi các bảng kích thước cũng được bao quanh bởi các bảng thứ nguyên phụ. Xử lý hình khối Xử lý hình khối nhanh hơn.Do phép nối phức tạp, quá trình xử lý hình khối hơi chậm.

Sự kết luận

Cả hai lược đồ Star và Snowflake đều hữu ích trong các lĩnh vực khác nhau. Vì vậy, quyết định cái nào tốt hơn trong số đó là dựa trên yêu cầu của họ.

Lược đồ bông tuyết là phần mở rộng của lược đồ hình sao, nơi nó chuẩn hóa các bảng kích thước trong lược đồ hình sao.

Lược đồ hình sao được thiết kế đơn giản, chạy các truy vấn nhanh hơn và thiết lập dễ dàng. Mặt khác, lược đồ hình bông tuyết dễ bảo trì hơn, tốn ít dung lượng ổ đĩa hơn và ít gặp vấn đề về tính toàn vẹn dữ liệu hơn.

Vì vậy, lược đồ hình sao có thể là lựa chọn tốt hơn nếu bạn cần một thiết kế đơn giản, ít khóa ngoại hơn và xử lý khối lập phương nhanh hơn. Tuy nhiên, nếu bạn cần ít dung lượng đĩa hơn, tính toàn vẹn của dữ liệu thấp và bảo trì thấp, thì lược đồ bông tuyết có thể phù hợp hơn.

Bạn cũng có thể khám phá một số giải pháp cơ sở dữ liệu đồ thị tốt nhất.

Chủ Đề