39 bài viết [dữ liệu lớn dữ liệu]
Dữ liệu Spark hiệu quả với Alluxio

Dữ liệu Spark hiệu quả với Alluxio

Trong bài viết này, chúng tôi điều tra cách sử dụng hiệu quả Spark DataFrames với Alluxio. Đọc để tinh chỉnh các kỹ năng Spark của bạn!
Hữu ích 9 Bình luận 0 Đã xem 4060 Đã viết lúc 1 năm trước
Tạo cảm giác xử lý luồng

Tạo cảm giác xử lý luồng

Một cuộc thảo luận về một số phương tiện có nghĩa là các nhà phát triển và nhà khoa học dữ liệu có thể xử lý các nhu cầu xử lý luồng và những gì mỗi giải pháp mang lại cho bảng.
Hữu ích 3 Bình luận 0 Đã xem 7673 Đã viết lúc 1 năm trước
Sẵn sàng cho dữ liệu nhanh: Kích hoạt các ứng dụng truyền dữ liệu theo thời gian thực

Sẵn sàng cho dữ liệu nhanh: Kích hoạt các ứng dụng truyền dữ liệu theo thời gian thực

Chúng tôi xem xét một tổ chức đang làm để cho phép các nhà phát triển và chuyên gia dữ liệu làm việc tốt hơn với dữ liệu nhanh. Đọc để tìm hiểu thêm!
Hữu ích 0 Bình luận 0 Đã xem 3780 Đã viết lúc 1 năm trước
Giới thiệu về Hồ dữ liệu Agile, Phần 2

Giới thiệu về Hồ dữ liệu Agile, Phần 2

Chúng tôi kết thúc loạt bài hai phần này bằng cách xem xét cách thêm sự nhanh nhẹn, bảo mật và quản trị dữ liệu vào các hồ dữ liệu của bạn. Đọc để biết thêm!
Hữu ích 4 Bình luận 0 Đã xem 6093 Đã viết lúc 1 năm trước
Dữ liệu sạch: Điều kiện tiên quyết để thành công trong kinh doanh

Dữ liệu sạch: Điều kiện tiên quyết để thành công trong kinh doanh

Trong phân tích dữ liệu lớn, tất cả dữ liệu là dữ liệu tốt, phải không? Không cần thiết. Đọc để thảo luận về lý do tại sao dữ liệu sạch và chuẩn hóa là rất quan trọng.
Hữu ích 3 Bình luận 0 Đã xem 1719 Đã viết lúc 1 năm trước
Cuộc sống là bẩn thỉu. Dữ liệu của bạn cũng vậy. Làm quen với nó.

Cuộc sống là bẩn thỉu. Dữ liệu của bạn cũng vậy. Làm quen với nó.

Mặc dù dữ liệu của bạn sẽ không bao giờ hoàn toàn sạch, nhưng nó có thể đủ sạch. Đọc tiếp để tìm hiểu một số phương pháp bạn có thể sử dụng để làm bẩn dữ liệu của mình.
Hữu ích 6 Bình luận 0 Đã xem 9417 Đã viết lúc 1 năm trước
Tóm tắt điều hành: Dữ liệu nhanh là gì và tại sao nó quan trọng? [Video]

Tóm tắt điều hành: Dữ liệu nhanh là gì và tại sao nó quan trọng? [Video]

Trong bài đăng này, chúng tôi đã vượt qua những ồn ào xung quanh Dữ liệu nhanh và khám phá cách khai thác thành công cơ hội mới này để đổi mới.
Hữu ích 6 Bình luận 0 Đã xem 3652 Đã viết lúc 1 năm trước
Tại sao dữ liệu nhanh là khó: 9 thách thức hàng đầu được xếp hạng bởi 2400 nhà phát triển

Tại sao dữ liệu nhanh là khó: 9 thách thức hàng đầu được xếp hạng bởi 2400 nhà phát triển

Khi các hệ sinh thái dữ liệu lớn phát triển lớn hơn và phức tạp hơn, chúng ta hãy xem những gì các nhà phát triển nghĩ là một trong những thách thức khó khăn nhất để giải quyết.
Hữu ích 5 Bình luận 0 Đã xem 9401 Đã viết lúc 2 năm trước
Mô hình phát trực tuyến thời gian thực: Cảnh báo kích hoạt

Mô hình phát trực tuyến thời gian thực: Cảnh báo kích hoạt

Chúng tôi tiếp tục xem xét các mẫu xử lý dữ liệu được sử dụng để xây dựng các ứng dụng xử lý luồng kích hoạt sự kiện, một vài trường hợp sử dụng và triển khai.
Hữu ích 10 Bình luận 0 Đã xem 6118 Đã viết lúc 2 năm trước
Truyền phát trực tiếp Twitter với Spark Streaming (Sử dụng Scala)

Truyền phát trực tiếp Twitter với Spark Streaming (Sử dụng Scala)

Trong bài đăng này, chúng tôi sẽ trình bày từng bước nhanh chóng về cách sử dụng các kỹ thuật phát trực tuyến Spark với một ứng dụng Twitter. Chúng ta hãy đi đến đó!
Hữu ích 5 Bình luận 0 Đã xem 6219 Đã viết lúc 2 năm trước
Cách biến tệp CSV bạn có thành dữ liệu xAPI bạn muốn [Video]

Cách biến tệp CSV bạn có thành dữ liệu xAPI bạn muốn [Video]

Đối với hầu hết chúng ta không phải là lập trình viên, việc đưa dữ liệu sang định dạng xAPI là một rào cản khi bắt đầu với xAPI. Tìm hiểu làm thế nào để vượt qua rào cản này.
Hữu ích 1 Bình luận 0 Đã xem 9072 Đã viết lúc 2 năm trước
Bill of Rights: Data Edition

Bill of Rights: Data Edition

Một chuyên gia dữ liệu lớn đưa ra giả thuyết về những cách mà người dùng có thể lấy lại quyền kiểm soát và thực sự thu lợi từ dữ liệu họ tạo ra.
Hữu ích 11 Bình luận 0 Đã xem 2588 Đã viết lúc 2 năm trước
Cấu trúc truyền phát là gì?

Cấu trúc truyền phát là gì?

Structured Streaming là API xử lý luồng nhanh, có thể mở rộng, có khả năng chịu lỗi, từ đầu đến cuối, chính xác một lần giúp người dùng xây dựng các ứng dụng phát trực tuyến.
Hữu ích 3 Bình luận 0 Đã xem 6181 Đã viết lúc 2 năm trước
Triển khai Lớp truy cập dữ liệu nhanh và phá vỡ bức tường (lửa) vĩ đại của ...

Triển khai Lớp truy cập dữ liệu nhanh và phá vỡ bức tường (lửa) vĩ đại của ...

Nếu bạn thêm sự phức tạp của các đỉnh dữ liệu và hạn chế truy cập dữ liệu ở các quốc gia cụ thể như Trung Quốc, việc đáp ứng các yêu cầu về hiệu suất thời gian thực trở nên khó khăn.
Hữu ích 7 Bình luận 0 Đã xem 4917 Đã viết lúc 2 năm trước
Hiểu hàng loạt, Microbatch và xử lý luồng

Hiểu hàng loạt, Microbatch và xử lý luồng

Xử lý hàng loạt dành cho các trường hợp có dữ liệu cập nhật nhất là không quan trọng. Xử lý luồng dành cho các trường hợp yêu cầu tương tác trực tiếp và đáp ứng thời gian thực.
Hữu ích 2 Bình luận 0 Đã xem 2004 Đã viết lúc 2 năm trước

mỗi trang