Pages

Thứ Ba, 19 tháng 11, 2013

So sánh OLTP và OLAP (http://www.bigdata.com.vn/)

Về cơ bản, chúng ta có thể chia dữ liệu trong một hệ thống IT thành hai mảng: Một là dữ liệu giao dịch, hai là dữ liệu phân tích. Thông thường, dữ liệu OLTP sẽ là nguồn dữ liệu cho OLAP để phục vụ cho mục đích phân tích dữ liệu chi tiết từ hệ thống OLTP thành thông tin. Hình minh họa như sau:
Dữ liệu giao dịch gọi là OLTP (Online Transaction Processing)
Ví dụ: một phần mềm kế toán, phần mềm bán hàng, phần mềm nhân sự, tiền lương, … được 
nhập liệu thường xuyên bởi những người dùng cuối và dữ liệu chi tiết tới từng nghiệp vụ, mô hình thiết kế theo quan hệ thực thể, database thiết kế cho hệ thống này thường được chuẩn hóa. 
Nó được đặc trưng bởi một số lượng lớn giao dịch (insert, update, delete) trong một thời gian ngắn, được thiết kế nhằm mục đích thu thập dữ liệu, duy trì tràng buộc dữ liệu trong nhiều môi trường truy cập khác nhau, đo lường hiệu quả của mô hình này chính là số lượng giao dịch trên giây. 
- Dữ liệu Phân tích là OLAP (Online Analysis Processing):  đặc trưng bởi khối lượng tương đối thấp của các giao dịch. Thay vào đó, hệ thống này thường có nhiều truy vấn để tính toán tổng hợp dữ liệu. Với hệ thống này, thời gian phản hồi yêu cầu là đơn vị đo lường cho tính hiệu quả. Ứng dụng OLAP được sử dụng rộng rãi bởi công nghệ Data Minning. Dữ liệu trong ứng dụng OLAP thường được lưu trữ dưới dạng đã được tính toán, có tính lịch sử và theo mô hình đa chiều (multi-dimensional) thường là mô hình hình sao (star schema).
Bảng tổng hợp so sánh giữ OLTP và OLAP:


Nội dung
OLTP System
(Hệ thống hoạt động)
OLAP System
(Data warehouse)
Dữ liệ nguồn
Dữ liệu hoạt động, do người dùng cuối nhập vào
Dữ liệu hợp nhât. Dữ liệu OLAP đến từ nhiều nguồn khác nhau của hệ thống OLAP
Mục đích của dữ liệu
Để kiểm soát và chạy các nghiệp vụ kinh tế cơ bản, thiết yếu xảy ra hàng ngày. Phục vụ người dùng ở cấp hoạt động trong doanh nghiệp
Phục vụ mục đích lập kế hoạch, giải quyết vấn đề, hỗ trợ ra quyết định. Phục vụ cho các cấp bậc quản lý chiến lượng.
Phản ánh dữ liệu nào
Cho thấy một ảnh chụp nhanh của các quá trình kinh doanh liên tục
Số liệu cung cấp góc nhìn đa chiều các hoạt động kinh doanh trong doanh nghiệp.
Thêm và sửa dữ liệu
Thêm, sửa nhanh chóng và được tạo bởi người dùng cuối ở cấp hoạt động.
Chạy theo chu kỳ, theo lô lớn các giao dịch, như vào một giờ nhất định để tập hợp, tính toán và làm mới dữ liệu.
Truy vấn
Liên quan đến các truy vấn cơ bản, số lượng dòng dữ liệu trả về ít.
Thường truy vấn với các câu truy vấn tính toán phức tạp dựa trên khối lượng dữ liệu rất lớn.
Tốc độ xử lý
Thường rất nhanh trong một vài giây
Phụ thuộc vào khối lượng dữ liệu cần xử lý và một lần xử lý một lô query để tập hợp và tính toán dữ liệu có thể kéo dài hàng giờ đồng hồ. Tăng tốc độ xử lý bằng cách tạo index và các kỹ thuật design chuyên nghiệp
Không gian lưu trữ
Tương đối nhỏ nếu dữ liệu lịch sử được cắt giảm và lưu trữ thích hợp
Thường rất lớn, do sự tồn tại của dữ liệu tổng hợp mang tính lịch sử, cần nhiều index hơn so với OLTP
Thiết kế database
Chuẩn hóa ở mức cao, cần nhiều table
Thường không cần chuẩn hóa, ít table hơn. Thường theo 2 mô hình là Star hoặc Snowflake
Backup và phục hồi dữ liệu
Tín đồ của backup. Dư liệu hoạt động là cực kỳ quan trọng với hoạt động kinh doanh nên phải bảo trì backup cẩn thận, việc mất mát dữ liệu cũng đồng nghĩa với việc mất mát thời gian, tiền bạc và công sức nhập liệu cũng như liên quan đến trách nhiệm pháp lý.
Thay vì phải backup đều đặn, khi mất mát dữ liệu xảy ra, nhiều hệ thống OLAP thường chọn một phương pháp đơn giản là load lại dữ liệu từ các nguồn dữ liệu gốc ở các hệ thống OLTP như là một giải pháp phục hồi dữ liệu.

Không có nhận xét nào:

Đăng nhận xét