Hướng dẫn data model trong excel

Nếu bạn không biết Data Model trong Power BI là gì thì đây chính xác là bài viết dành cho bạn. Khi nhắc đến thuật ngữ “data model” không ít bạn cảm thấy phân vân, điều này cũng dễ hiểu vì nó là một từ tương đối xa lạ với những ai không chuyên về IT.

1. Data Model là gì?

Có thể nói một cách ngắn gọn, data model là tập hợp của:

  • Các bảng dữ liệu đã tải.
    • Với một hoặc nhiều cột đã được tải vì một lý do (không tải bất kỳ cột nào từ nguồn vào mô hình của bạn trừ khi có lý do).
    • Với một hoặc nhiều dòng dữ liệu đã được tải vì một lý do (không tải các dòng từ nguồn của bạn vào mô hình nếu không có lý do).
  • Mối quan hệ giữa các bản đã được tải lên.
  • Các measures (công thức) được viết áp dụng các quy tắc kinh doanh cho dữ liệu thô để trích xuất thông tin chi tiết về doanh nghiệp (ví dụ: giá bán trừ giá vốn và lợi nhuận), bao gồm:
    • Chính các công thức.
    • Định dạng được áp dụng cho công thức.
    • Những cái tên được đặt cho công thức.

Tất cả những điều trên tạo nên cái gọi là “data model” (mô hình dữ liệu) trong Power BI (cũng dành cho Analysis Services Tabular, Power Pivot cho Excel và chắc chắn là vô số công cụ BI khác).

2. Vì sao cần có một Model?

Power BI là một mô hình dữ liệu dựa trên công cụ báo cáo BI, không phải tất cả công cụ BI đều dựa trên mô hình dữ liệu. Một ví dụ không phải công cụ BI dựa trên mô hình dữ liệu là SQL Server Reporting Services (SSRS). SSRS là một công cụ BI không dựa trên mô hình dữ liệu. Các công cụ báo cáo BI không dựa trên mô hình dữ liệu cần người viết báo cáo tạo một truy vấn trước tiên để tìm nạp dữ liệu từ cơ sở dữ liệu (thường là SQL Server) và trả lại kết quả của truy vấn đó cho SSRS để kết quả có thể được hiển thị trong một báo cáo.

Nhiều công cụ báo cáo không dựa trên mô hình dữ liệu có giao diện người dùng giúp tạo truy vấn (nếu bạn muốn sử dụng) hoặc bạn cũng có thể dùng ngôn ngữ kịch bản như T-SQL để tìm nạp dữ liệu bạn cần vào mỗi báo cáo.

Ví dụ thứ hai là Excel, Excel truyền thống cũng là một công cụ BI không dựa trên mô hình dữ liệu. Theo Excel truyền thống, Excel là công cụ bảng tính không có phần bổ trợ BI hiện đại của Power Query và Power Pivot. Trong trường hợp của Excel truyền thống, người dùng tải dữ liệu vào bảng tính sau đó liên hệ và tổng hợp dữ liệu một cách logic bằng công thức Excel và xây dựng một báo cáo (thường là trên trang tính mới) để tổng hợp và trình bày kết quả.

Bây giờ, đừng nhầm lẫn giữa “một công cụ” và “một công cụ dựa trên mô hình dữ liệu”. Excel chắc chắn là một công cụ, nó là một công cụ linh hoạt cho phép bạn tạo bất kỳ báo cáo nào mà không cần phải là một lập trình viên. Trên thực tế, Excel có lẽ là công cụ BI tốt nhất từng được phát minh. Nhưng nó không phải là công cụ dựa trên mô hình dữ liệu, vì nó không có mô hình dữ liệu.

Không có gì sai với việc sử dụng công cụ BI không dựa trên mô hình dữ liệu, nó chỉ là một cách tiếp cận khác. Vấn đề lớn với các công cụ báo cáo không dựa trên mô hình dữ liệu là mỗi khi bạn cần một báo cáo mới, bạn phải bắt đầu lại. Mỗi báo cáo có một mục đích duy nhất và ít khả năng tái sử dụng hay mở rộng.

Những lợi ích của một công cụ dựa trên mô hình dữ liệu như Power BI là:

  • Tác giả của mô hình dữ liệu xây dựng một khả năng có thể tái sử dụng, được dùng để giải quyết các yêu cầu báo cáo hiện tại cũng như các yêu cầu trong tương lai mà không cần quay lại và viết thêm các truy vấn để lấy một tập hợp con mới của dữ liệu.

  • Tác giả có thể là một người dùng doanh nghiệp (thường có kỹ năng Excel tốt), họ không cần phải là một người quản trị cơ sở dữ liệu được huấn luyện chuyên nghiệp hay chuyên gia SQL.

  • Model (mô hình) là một thuật ngữ tự nhiên, được hỗ trợ một giao diện người dùng thân thiện để bạn xây dựng mô hình hợp lý với ít dòng mã nhất có thể. Lưu ý, bạn vẫn cần một vài mã (viết công thức) cho một mô hình tốt nhưng khi đã có kỹ năng nó sẽ dễ hơn so với Excel.

3. Model View trong Power BI Desktop

Trong Power BI Desktop, bạn sẽ thấy model view. Ảnh dưới đây cho thấy cấu trúc các bảng của cơ sở dữ liệu Adventure Works.

  • Các bảng.
  • Các cột trong bảng.
  • Mối quan hệ giữa các bảng (nếu có).
  • Kiểu mối quan hệ (như ảnh trên là “1 to many”).
  • Hướng của bộ lọc giữa các bảng bằng cách sử dụng các mối quan hệ.

Điều bạn không thể thấy trong model view là các measures (những công thức tạo các thuật ngữ doanh nghiệp từ dữ liệu thô).

4. Các measures là một phần của model

Các measure là một phần của data model. Những measures là tập hợp của các hướng dẫn tiêu chuẩn cho Power BI biết cách trích xuất các khái niệm kinh doanh và những khái niệm này tạo thành một phần của mô hình dữ liệu của bạn.

Ví dụ, xét cột ExtendedAmount từ bảng bán hàng trong ảnh dưới:

Đây là một cột số được lưu trữ trong bảng bán hàng trong mô hình dữ liệu. Các con số đại diện cho tổng giá trị của một mục hàng bán hàng (một dòng trong bảng là một mục hàng). Giả sử, bạn muốn mua hai sản phẩm với giá 5$ mỗi sản phẩm thì ExtendedAmount sẽ là $10. Do đó, nó sẽ theo sau:

  • Nếu bạn thêm một cột, cột này sẽ cho biết tổng giá trị bán hàng của tất cả các giao dịch.
  • Nếu bạn đếm các giá trị trong cột, nó sẽ cho biết có bao nhiêu mục hàng bán hàng trên tất cả các lần bán.
  • Nếu bạn tính trung bình các giá trị trong cột, nó sẽ cho biết giá trị trung bình mà khách hàng đã chi tiêu trên tất cả các mặt hàng sản phẩm.
  • Nếu bạn tìm thấy giá trị lớn nhất trong cột, nó sẽ cho biết giá trị đơn hàng lớn nhất đã xảy ra.

Power BI thừa khả năng thực hiện tất cả những điều trên mà không cần phải viết bất kỳ công thức nào. Nhưng Power BI không có khái niệm về ý nghĩa của mỗi công thức trên trong bối cảnh doanh nghiệp. Nó có thể thực hiện các phép tính nhưng không thể cung cấp cho bạn một tên doanh nghiệp hay kết quả, cũng như không chọn định dạng số thích hợp nhất cho kết quả. Bạn cần phải mở rộng mô hình dữ liệu để thêm measures (công thức) đáp ứng nhu cầu.

Total Sales Value = SUM(Sales[ExtendedAmount])              format as Currency, 0 decimals

Total Line Items = COUNT(Sales[ExtendedAmount])             format as whole number, comma separated

Average Line Item Value = AVERAGE(Sales[ExtendedAmount])    format as Currency, 2 decimals

Maximum Line Item Value = MAX(Sales[ExtendedAmount])        format as Currency, 2 decimals

Đây chỉ là những ví dụ đơn giản hoạt động trên một cột dữ liệu. Tất cả những điều này có thể được tính toán bằng Power BI mà không cần học bất kỳ ngôn ngữ công thức DAX nào. Nhưng nếu bạn muốn thứ gì đó phức tạp hay hữu ích hơn thì bạn chắc chắn cần DAX để tận dụng tối đa Power BI.

5. Model của bạn là một tài sản

Mô hình dữ liệu của bạn là một tài sản, một thứ mà bạn xây dựng và cải thiện theo thời gian. Bạn càng nỗ lực thì mô hình càng giá trị. Đến lúc bạn tạo báo cáo mới trên dữ liệu của mình, bạn không bắt đầu lại. Thay vào đó, bạn lấy tài sản của mình và tái sử dụng. Nếu may mắn thì bạn không cần thay đổi gì và có thể tạo một báo cáo mới trên tài sản hiện có. Đôi khi bạn cần nâng cấp tài sản một chút để đáp ứng yêu cầu mới. Trong trường hợp này, trước tiên bạn xây dựng dựa trên nội dung đã tạo trước đó và sau đó xây dựng các báo cáo mới trên đầu.

Hy vọng qua bài viết này bạn đọc đã hiểu được khái niệm data model. Vẫn còn rất nhiều thông tin thú vị và hữu ích sẽ được cập nhật thường xuyên, các bạn đừng quên đón đọc tại BAC's Blog.

Nguồn tham khảo:

https://exceleratorbi.com.au/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

  • Phân tích và trực quan hóa dữ liệu với Tableau
  • Phân tích và trực quan hóa dữ liệu với Power BI

Các bài viết liên quan Power BI: 

  • Power BI cơ bản cho người mới bắt đầu
  • Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
  • Kết hợp dữ liệu trong Power BI Desktop
  • Hướng dẫn kết nối dữ liệu trong Power BI Desktop
  • Hướng dẫn tải & cài đặt Power BI trên máy tính
  • Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
  • Power BI là gì?

Các bài viết liên quan: 

  • TABLEAU - Giải pháp BUSINESS INTELLIGENCE (BI) - click vào đây
  • Hướng dẫn cài đặt và Sử dụng TABLEAU - click vào đây
  • Tính năng mới trên tableau - verion 2019.1 - click vào đây

BAC - Biên soạn và tổng hợp nội dung

 

Click để đọc tiếp

  • Hướng dẫn data model trong excel

    6 ví dụ thực tế về Business Intelligence Dashboard

    Business Intelligence Dashboard mang đến khả năng làm chủ dữ liệu cho cả những người không chuyên. Đã có rất nhiều lĩnh vực, hoạt động nhận được lợi ích từ việc sử dụng các BI Dashboard này, đây là 6 ví dụ thực tế để bạn tham khảo.

  • Hướng dẫn data model trong excel

    9 Phần mềm khảo sát tốt nhất dành cho doanh nghiệp nhỏ

    Phần mềm khảo sát giúp bạn thu thập dữ liệu từ các nhóm mục tiêu. Qua đó, bạn sẽ có được những dữ liệu phân tích chính xác để nghiên cứu thị trường, khảo sát mức độ hài lòng của khách hàng và nhiều ứng dụng thực tế khác.

  • Hướng dẫn data model trong excel

    8 công cụ trực quan dữ liệu lớn hàng đầu hiện nay

    Dữ liệu lớn có thể xem là một khó khăn với các công cụ xử lý. Tuy nhiên, trong thời đại hiện nay dữ liệu lớn đã không còn xa lạ với các doanh nghiệp. Đây là danh sách 8 công cụ trực quan dữ liệu lớn tốt nhất mà bạn nên cân nhắc sử dụng.

  • Hướng dẫn data model trong excel

    Sự khác nhau giữa MSBI và Power BI

    Power BI và MSBI là những công cụ Business Intelligence được xếp hàng đầu về chất lượng hiện nay. Chúng giúp các doanh nghiệp đưa ra những quyết định chính xác trong thời gian ngắn thông qua việc phân tích. Nếu bạn còn đang phân vân giữa hai công cụ này thì đây là bài viết dành cho bạn.