NoSQL tiếp tục phát triển, nhưng cơ sở dữ liệu quan hệ (SQL) vẫn chiếm một dữ liệu lớn

Mặc dù MongoDB và Cassandra vẫn giữ ưu thế trội hơn, nhưng các doanh nghiệp vẫn duy trì RDBMS của họ và sẽ làm vậy trong một thời gian dài




NoSQL đã hứa hẹn sẽ tăng cường thị trường cơ sở dữ liệu vì vấn đề dữ liệu lớn (BigData) buộc chúng ta phải tìm cách khác để quản lý dữ liệu

Vâng, chắc chắn, NoSQL đang có tác động đến thị trường cơ sở dữ liệu trị giá 46 tỷ đô la - vẫn chỉ là 3% so với tổng của thị trường. Nhưng nó vẫn phát triển rất nhanh, thậm chí còn hơn cơ sở dữ liệu quan hệ 5.4% theo IDC . Cũng cùng cách so sánh ấy, theo sự cập nhật của Bảng sắp xếp mức độ phổ biến của cơ sở dữ liệu , cơ sở dữ liệu quan hệ vẫn chi phối dữ liệu lớn


Do đó, chúng ta có thể chờ xem NoSQL và cơ sở dữ liệu quan hệ chia sẻ chiến thắng nhau về dữ liệu lớn trong vài năm tới 

Sự phát triển của NoSQL 

NoSQL là một phản hồi đối với sự phát triển mạnh mẽ của dữ liệu phi cấu trúc trong doanh nghiệp và hứa hẹn sẽ là thách thức lớn nhất đối với quyền bá chủ của hệ thống quản lý cơ sở dữ liệu quan hệ (RDBMS) đã được thành lập từ lâu. Mặc dù Oracle hiện kiểm soát 40% thị trường cơ sở dữ liệu trả phí, nhà phân tích Curt Monash cảnh báo rằng NoSQL là một trong những mối đe dọa lớn nhất đối với nó:

Đây về cơ bản là ba điều có thể đe dọa nghiêm trọng đến vị trí thị trường của Oracle:

Điều đầu tiên là sự tăng trưởng trong các ứng dụng thuộc loại mà RDBMS của Oracle không phù hợp. Phần lớn 'Dữ liệu lớn' phù hợp với mô tả đó. Mặc dù vậy, NoSQL vẫn còn một chặng đường dài phía trước, theo như IDC đã nói:

Bất chấp cuộc chiến đầy cam go, cái nhìn bao quát của DB-Engines về mức độ phổ biến của cơ sở dữ liệu cho thấy khoảng cách tiếp tục được thu hẹp bởi các cơ sở dữ liệu NoSQL hàng đầu, bao gồm MongoDB, Apache Cassandra do Datastax tài trợ và Redis:

Sự tăng trưởng này đang diễn ra trong bối cảnh thị trường cơ sở dữ liệu quan hệ đang chững lại. Oracle, đứng đầu bảng xếp hạng doanh thu và phổ biến cơ sở dữ liệu, nhà phân tích Stephen O’Grady của Redmonk kiếm được ngày càng ít doanh thu từ việc bán giấy phép mới theo Stephen O’Grady:

Tuy nhiên, ở mặt khác, dẫn đầu thị trường cho thấy sự tăng trưởng rất lớn của MySQL, mã nguồn mở RDBMS Oracle mua lại khi mua Sun Microsystems (sự tăng trưởng của cơ sở dữ liệu mã nguồn mở đã đạt 31%, theo IDC). Mặc dù Oracle kiếm được ít tiền hơn từ việc bán cổ phiếu MySQL so với cơ sở dữ liệu cùng tên của mình, nhưng MySQL được cho là đang làm nhiều hơn để giữ cho nó phù hợp với khối lượng công việc hiện đại (và các nhà phát triển yêu thích chúng).

Cơ sở dữ liệu quan hệ vẫn bắt kịp tốc độ

Tuy nhiên, đối với tất cả sự đi lên của NoSQL, cơ sở dữ liệu quan hệ không hoàn toàn giảm. Có một số lý do tại sao lại như vậy. 

Đầu tiên là, nhiều khi các doanh nghiệp có thể muốn dùng NoSQL để chế ngự số lượng dữ liệu không có cấu trúc, hầu hết khối lượng công việc của họ vẫn mang tính chất giao dịch, đây là điểm tốt cho cơ sở dữ liệu quan hệ.

Một lý do khác là công cụ phân tích cho NoSQL vẫn còn sơ khai. Như nhà phân tích Lynn Robison của Gartner đã chỉ ra, các công cụ phân tích NoSQL không phải là các công cụ phân tích thân thiện với người dùng và “Sẽ mất nhiều năm để các công cụ phân tích hoàn thiện và trở nên dễ tiếp cận đối với những người không chuyên về khoa học dữ liệu”. 

Một lý do thứ ba là khó định lượng và khó khắc phục nhất: Văn hóa. Các doanh nghiệp đã dành hơn 30 năm qua để sống với cơ sở dữ liệu quan hệ. Thật khó để thay đổi điều đó trong một sớm một chiều. 

Cuối cùng, lý do thứ tư: Hóa ra cơ sở dữ liệu quan hệ đôi khi là giải pháp tốt nhất cho một vấn đề cụ thể. Chỉ cần hỏi giám đốc dữ liệu của Facebook, Ken Rudin:

"Nếu chúng tôi xem xét mức độ chi tiết của dữ liệu, chúng tôi giữ mức độ hạt thấp nhất trong hệ thống Hadoop của mình. Vì vậy, bất cứ khi nào bạn muốn xem xét thứ gì đó ở mức độ chi tiết thấp nhất, Hadoop đều được tối ưu hóa cho điều đó. Tuy nhiên, nếu chúng ta muốn xem xét dữ liệu đã chuyển đổi và dữ liệu tổng hợp, thì việc làm theo quan hệ sẽ dễ dàng hơn ".

Vì vậy, đối với việc hoạt động theo thời gian thực được thực hiện trong Hadoop có liên quan đến cơ sở dữ liệu NoSQL, nhưng đối với phân tích xu hướng dài hạn, đó là RDBMS.


Hai "người thay đổi cuộc chơi hoàn chỉnh"

Giáo sư Michael Franklin, một trong những chuyên gia cơ sở dữ liệu hàng đầu của ngành, đã ca ngợi NoSQL là “người thay đổi cuộc chơi hoàn chỉnh”,  phần lớn là do tính linh hoạt của lược đồ của nó. Tuy nhiên, sự linh hoạt đó cũng mở ra cánh cửa rộng mở cho cơ sở dữ liệu quan hệ, cơ sở dữ liệu này có thể thực hiện các truy vấn nhanh, mạnh mẽ đối với dữ liệu đã được đóng gói gọn gàng thành các hàng và cột. 

Nói cách khác, RDBMS và NoSQL đều là “những người thay đổi cuộc chơi hoàn chỉnh” và cùng nhau chúng có thể hỗ trợ chiến thắng các chiến lược dữ liệu lớn .



Tác giả: By Matt Asay 
Người dịch: Bùi Hữu Lộc

Nhận xét

Bài đăng phổ biến từ blog này

Chia sẻ về cuộc sống hiện tại (10/05/2022)

Đồ án đầu tiên

Kì thi kết thúc môn đầu tiên của mình ở Đại học