6

Ý tưởng ban đầu nghe có vẻ lạ. Tại sao bạn muốn có một cơ sở dữ liệu cung cấp dữ liệu không chính xác? Nhưng BlinkDB giao dịch chính xác cho tốc độ. Khi bạn truy vấn dữ liệu, bạn có thể chỉ định mức độ nhanh chóng và không có độ tin cậy mà bạn cần câu trả lời:  ví dụ trong vòng 2 giây hoặc mức độ chính xác mà bạn muốn câu trả lời là, ví dụ lỗi 1% với độ tin cậy 95%.

Vì vậy, nếu bạn có lượng dữ liệu rất lớn (10 - 100 giây Tera Bytes hoặc thậm chí là Peta Bytes) và bạn muốn có câu trả lời đủ nhanh thì BlinkDB là dành cho bạn. Một người áp dụng sớm là Facebook. Bạn có muốn  những người theo dõi của Justin Bieber đếm chính xác trong vài phút hoặc đúng 99% miễn là trang của bạn tải gần như ngay lập tức? Vì vậy, nếu bạn cần câu trả lời nhanh một cách hợp lý chính xác so với câu trả lời đúng chậm, BlinkDB đáng để kiểm tra.

Bạn có thể sử dụng BlinkDB để làm gì?

  • Trường hợp sử dụng rõ ràng sẽ là báo cáo thời gian thực? Nếu bạn cần đưa ra quyết định trong chớp mắt, ví dụ như  người giao dịch trong ngày và sai số 5-10% là có thể chấp nhận được, ví dụ: thay đổi trung bình của tất cả  giá hàng hóa trong 2 giây qua là gì.
  • Đặt chỗ theo thời gian thực hoặc so sánh giá trong đó người dùng muốn biết ưu đãi tốt nhất có thể nhưng chấp nhận một số lỗi nhỏ, ví dụ: máy quét mã vạch di động cung cấp so sánh giá sản phẩm trong 1 giây thay vì 10 sẽ thống trị App Store.
  • Bất kỳ khách truy cập, bạn bè, tweet, tổng kết quả tìm kiếm, vv truy cập trên một trang web lớn trên thế giới.
  • Bất kỳ  dữ liệu Power Law  hoặc  Long Tail  nào có một số trường hợp cực kỳ phổ biến, ví dụ như những người theo dõi Justin Bieber hoặc một loạt các trường hợp không thường xuyên, ví dụ như số lượng blog có dưới 1000 khách truy cập mỗi tháng.
  • Các giải pháp Machine Learning và các  công cụ đề xuất  đang sử dụng  Lọc cộng tác và các loại thuật toán khác để so sánh một mặt hàng hoặc người dùng với các nhóm lớn các mặt hàng và người dùng khác.
  • và nhiều trường hợp sử dụng khác

|