- Dữ liệu giao dịch gọi là OLTP (Online Transaction Processing)
Ví dụ: một phần mềm kế toán, phần mềm bán hàng, phần mềm nhân sự, tiền lương, … được
nhập liệu thường xuyên bởi những người dùng cuối và dữ liệu chi tiết tới từng nghiệp vụ, mô hình thiết kế theo quan hệ thực thể, database thiết kế cho hệ thống này thường được chuẩn hóa.
Nó được đặc trưng bởi một số lượng lớn giao dịch (insert, update, delete) trong một thời gian ngắn, được thiết kế nhằm mục đích thu thập dữ liệu, duy trì tràng buộc dữ liệu trong nhiều môi trường truy cập khác nhau, đo lường hiệu quả của mô hình này chính là số lượng giao dịch trên giây.
- Dữ liệu Phân tích là OLAP (Online Analysis Processing): đặc trưng bởi khối lượng tương đối thấp của các giao dịch. Thay vào đó, hệ thống này thường có nhiều truy vấn để tính toán tổng hợp dữ liệu. Với hệ thống này, thời gian phản hồi yêu cầu là đơn vị đo lường cho tính hiệu quả. Ứng dụng OLAP được sử dụng rộng rãi bởi công nghệ Data Minning. Dữ liệu trong ứng dụng OLAP thường được lưu trữ dưới dạng đã được tính toán, có tính lịch sử và theo mô hình đa chiều (multi-dimensional) thường là mô hình hình sao (star schema).
Bảng tổng hợp so sánh giữ OLTP và OLAP:
Nội dung
|
OLTP System
(Hệ thống hoạt động)
|
OLAP System
(Data warehouse)
|
Dữ liệ nguồn
|
Dữ liệu hoạt động, do người dùng cuối nhập vào
|
Dữ liệu hợp nhât. Dữ liệu OLAP đến từ nhiều nguồn khác nhau của hệ thống OLAP
|
Mục đích của dữ liệu
|
Để kiểm soát và chạy các nghiệp vụ kinh tế cơ bản, thiết yếu xảy ra hàng ngày. Phục vụ người dùng ở cấp hoạt động trong doanh nghiệp
|
Phục vụ mục đích lập kế hoạch, giải quyết vấn đề, hỗ trợ ra quyết định. Phục vụ cho các cấp bậc quản lý chiến lượng.
|
Phản ánh dữ liệu nào
|
Cho thấy một ảnh chụp nhanh của các quá trình kinh doanh liên tục
|
Số liệu cung cấp góc nhìn đa chiều các hoạt động kinh doanh trong doanh nghiệp.
|
Thêm và sửa dữ liệu
|
Thêm, sửa nhanh chóng và được tạo bởi người dùng cuối ở cấp hoạt động.
|
Chạy theo chu kỳ, theo lô lớn các giao dịch, như vào một giờ nhất định để tập hợp, tính toán và làm mới dữ liệu.
|
Truy vấn
|
Liên quan đến các truy vấn cơ bản, số lượng dòng dữ liệu trả về ít.
|
Thường truy vấn với các câu truy vấn tính toán phức tạp dựa trên khối lượng dữ liệu rất lớn.
|
Tốc độ xử lý
|
Thường rất nhanh trong một vài giây
|
Phụ thuộc vào khối lượng dữ liệu cần xử lý và một lần xử lý một lô query để tập hợp và tính toán dữ liệu có thể kéo dài hàng giờ đồng hồ. Tăng tốc độ xử lý bằng cách tạo index và các kỹ thuật design chuyên nghiệp
|
Không gian lưu trữ
|
Tương đối nhỏ nếu dữ liệu lịch sử được cắt giảm và lưu trữ thích hợp
|
Thường rất lớn, do sự tồn tại của dữ liệu tổng hợp mang tính lịch sử, cần nhiều index hơn so với OLTP
|
Thiết kế database
|
Chuẩn hóa ở mức cao, cần nhiều table
|
Thường không cần chuẩn hóa, ít table hơn. Thường theo 2 mô hình là Star hoặc Snowflake
|
Backup và phục hồi dữ liệu
|
Tín đồ của backup. Dư liệu hoạt động là cực kỳ quan trọng với hoạt động kinh doanh nên phải bảo trì backup cẩn thận, việc mất mát dữ liệu cũng đồng nghĩa với việc mất mát thời gian, tiền bạc và công sức nhập liệu cũng như liên quan đến trách nhiệm pháp lý.
|
Thay vì phải backup đều đặn, khi mất mát dữ liệu xảy ra, nhiều hệ thống OLAP thường chọn một phương pháp đơn giản là load lại dữ liệu từ các nguồn dữ liệu gốc ở các hệ thống OLTP như là một giải pháp phục hồi dữ liệu.
|
Không có nhận xét nào:
Đăng nhận xét