Etl là gì

      53

ETL là gì?

ETL là tên viết tắt của Extract, Transform và Load. Trong quy trình này, một cách thức ETL trích xuất dữ liệu từ các hệ thống nguồn RDBMS không giống nhau sau đó biến hóa dữ liệu như vận dụng các chuyển đổi dữ liệu ( tính toán, nối chuỗi v.v. ) và sau đó tải dữ liệu vào hệ thống Data Warehouse.ETL là rất nhiều luồng từ “nguồn” tới ”đích”. Trong quy trình ETL, engine biến đổi sẽ cách xử lý mọi chuyển đổi dữ liệu.

Bạn đang xem: Etl là gì

*

Vậy ELT là gì?

ELT là một phương thức khác nhằm tiếp cận công cụ vận động dữ liệu. Núm vì biến hóa dữ liệu trước khi viết, ELT được cho phép “hệ thống đích” thay đổi trước. Dữ liệu thứ nhất được xào luộc vào “đích” và tiếp đến được đổi khác tại đó.ELT thường được thực hiện với các database No-SQL như Hadoop, Data Appliance hoặc Cloud Installation.

*

Sự không giống nhau giữa ETL với ELT

ETL và ELT không giống nhau ở hầu hết điểm sau:

ETLELT
1.Quy trìnhDữ liệu được thay đổi từ hệ thống staging sau đó được transfer tới Data warehouse DBDữ liệu vẫn còn đó trong DB của Data warehouse
2.Code UsageĐược áp dụng cho:-Những đổi khác chuyên sâu về tính toán-Lượng data nhỏĐược áp dụng cho lượng data khôn cùng lớn
3.Biến đổi dữ liệuCác biến đổi được thực hiện trong ETL server/stagingCác biến đổi được thực hiện phía bên trong “hệ thống đích”
4.Thời gian loadDữ liệu trước tiên được load vào staging tiếp nối mới load vào “đích”. đề nghị nhiều thời gianDữ liệu được load vào “đích” chỉ 1 lần kế tiếp mới biến chuyển đổi. Cấp tốc hơn
5.Thời gian trở nên đổiQuá trình ETL buộc phải cần quy trình “Tranform” trả tất. Khi kích cỡ dữ liệu tăng lên, thời gian biến hóa cũng tăng theo.

Xem thêm: Pentest Là Gì ? Lý Do Chúng Ta Cần Kiểm Tra Thử Xâm Nhập Please Wait

.Trong quá trình ELT, vận tốc không khi nào phụ trực thuộc vào size của dữ liệu.
6.Thời gian bảo trìNhu cầu gia hạn là không nhỏ vì cần được chọn dữ liệu để load và transformNhu cầu duy trì là vô cùng thấp bởi vì dữ liệu luôn có sẵn
7.Độ phức tạp khi bắt đầuỞ quá trình đầu triển khai rất dễ dàngĐể thực hiện quá trình ELT, cần được có những kỹ năng và kiến thức rất sâu về các tools và khả năng chuyên môn
8.Hỗ trợ Data warehouse?Mô hình ETL được sử dụng cho tài liệu on-premise, quan hệ tình dục và gồm cấu trúcĐược áp dụng cho cơ sở hạ tầng cloud hoàn toàn có thể support các nguồn dữ liệu có kết cấu và phi cấu trúc
9.Hỗ trợ Data LakeKhông supportCho phép sử dụng Data Lake với dữ liệu phi cấu trúc
10.Độ phức tạpQuá trình ETL chỉ load những dữ liệu quan trọng, như sẽ được xác minh trước từ thời gian designQuá trình này bao hàm tất cả thừa trình cách tân và phát triển từ output-backward với load những dữ liệu liên quan
11.Chi phíChi tổn phí rất cao cho các doanh nghiệp vừa và nhỏChi phí nguồn vào thấp khi sử dụng các phần mềm online có tác dụng Services Platforms
12.LookupsTrong quy trình ETL, cả 2 bảng Facts cùng Dimensions cần phải có sẵn vào StagingTất cả tài liệu đều sẽ sở hữu được sẵn bởi Extract với Load được thực hiện chỉ trong 1 hành động
13. AggregationsĐộ tinh vi tăng lên với tài liệu thêm vào trong datasetSức mạnh mẽ của target platform có thể xử lí một lượng tài liệu đáng kể một cách nhanh chóng
14.Tính toánGhi đè lên trên cột đang xuất hiện hoặc cần cắm cờ và đẩy lịch sự “đích”Dễ dàng thêm cột đang được giám sát vào bảng hiện nay có.
15.MaturityETL đã được thực hiện trong hơn 2 thập kỷ. Nó tất cả bộ tài liệu tốt và thuận tiện để thực hànhKhái niệm kha khá mới và khá phức hợp để triển khai
16.HardwareHầu hết các tools đều sở hữu yêu mong về hardware riêng rẽ biệt, kha khá đắt tiềnChi phí bỏ phần cứng hệ thống điện toán đám mây không hẳn là sự việc to tát
17. Hỗ trợ dữ liệu phí cấu trúcChủ yếu cung ứng dữ liệu dục tình cấu trúcCó cung cấp sẵn cho dữ liệu phi cấu trúc

Tổng quan tiền lại:

ETL là viết tắt của Extract, Transform với Load trong khi ELT là viết tắt của Extract, Load, Transform.Trước tiên, ETL load data vào staging server sau đó mới new sang “đích” trong những lúc ELT load thẳng dữ liệu vào thẳng “đích”.Mô hình ETL được sử dụng cho tài liệu on-premises, dữ liệu có kết cấu và quan tiền hệ trong những khi ELT được sử dụng cho các nguồn dữ liệu có cấu trúc và phi cấu trúc trên khối hệ thống đám mây mở rộng.ETL đa số được áp dụng cho một lượng nhỏ dại dữ liệu trong những lúc ELT được sử dụng cho lượng tài liệu lớn.ETL không hỗ trợ hỗ trợ Lake Data trong lúc ELT hỗ trợ hỗ trợ Lake Data.ETL vô cùng dễ thực hiện trong lúc ELT yêu cầu các kỹ năng thích thích hợp để triển khai và duy trì.

Tham khảo : https://www.guru99.com/etl-vs-elt.html