IT <code> - Tag dữ liệu lớn [Bài viết]

Cải thiện hiệu suất Apache HBase thông qua tuần tự hóa dữ liệu với Apache Avro
0
hữu ích
4.7k xem

Cải thiện hiệu suất Apache HBase thông qua tuần tự hóa dữ liệu với Apache Avro

Câu hỏi về việc sử dụng các bảng cao so với rộng trong Apache HBase là một mẫu thiết kế thường được thảo luận (xem tài liệu tham khảo tại đây và tại đây ). Tuy nhiên, có nhiều cân nhắc ở đây hơn là đưa ra lựa…
Cái nào đến trước, vấn đề hay bộ luật?
5
hữu ích
5.9k xem

Cái nào đến trước, vấn đề hay bộ luật?

Bạn không cần phải suy nghĩ quá nhiều để trả lời câu hỏi này. Theo thứ tự nhiều khả năng trả lời trước, ít có khả năng cuối cùng (tôi hy vọng), câu trả lời của bạn có thể là một trong: a) Không. Làm thế nào…
Cài đặt máy chủ JasperServer CE
4
hữu ích
10k xem

Cài đặt máy chủ JasperServer CE

Hôm nay tôi quyết định cài đặt máy chủ JasperServer CE. Chúng tôi cần tạo báo cáo hoạt động và tạo tài liệu PDF. Giải pháp này phù hợp với nhu cầu của chúng tôi và cài đặt là bước cuối cùng để tạo ra chúng.…
Cách xây dựng văn hóa dựa trên dữ liệu
1
hữu ích
1.7k xem

Cách xây dựng văn hóa dựa trên dữ liệu

Tầm quan trọng của dữ liệu đã có từ nhiều thế kỷ, bắt nguồn từ thời của nghiên cứu khoa học và thiên văn học. Ngay từ sớm, chúng ta đã thấy các nhà khoa học và nhà thiên văn học nổi tiếng như  Charles Darwin…
Cách xây dựng bảng điều khiển tự động với Google Apps Script và Google Sheets
7
hữu ích
9.1k xem

Cách xây dựng bảng điều khiển tự động với Google Apps Script và Google Sheets

Bảng điều khiển là một cách mạnh mẽ để truyền đạt dữ liệu đến nhóm của bạn. Một sử dụng cho bảng điều khiển là theo dõi tiến trình của các chỉ số hiệu suất chính (KPIs). Một KPI được theo dõi tại Lucid là thứ…
Apache NiFi, không phải từ đầu
0
hữu ích
16k xem

Apache NiFi, không phải từ đầu

Nếu bạn chưa từng nghe về nó, thì Apache NiFi là một bổ sung gần đây vào danh sách các công nghệ dữ liệu lớn mà Hortonworks đang giúp phát triển trong cộng đồng nguồn mở. Trong khi Hadoop là một dữ liệu ở…
Cách triển khai Nhà sản xuất Kafka
6
hữu ích
11k xem

Cách triển khai Nhà sản xuất Kafka

Bài viết này đề cập đến các cách để thực hiện một nhà sản xuất Kafka. Nhà sản xuất Kafka là một ứng dụng có thể hoạt động như một nguồn dữ liệu trong cụm Kafka. Một nhà sản xuất có thể xuất bản tin nhắn đến…
Lý thuyết trò chơi với Apache Spark, Phần 4
3
hữu ích
2.8k xem

Lý thuyết trò chơi với Apache Spark, Phần 4

Loạt cho đến nay Lý thuyết trò chơi với Apache Spark, Phần 1 Lý thuyết trò chơi với Apache Spark, Phần 2 Lý thuyết trò chơi với Apache Spark, Phần 3 Mang các mảnh lại với nhau: Ví dụ 1 Bây…
Khi học Python trở thành thực hành R
3
hữu ích
5.8k xem

Khi học Python trở thành thực hành R

15 năm trước, một  sinh viên của tôi nói với tôi rằng tôi nên bắt đầu học Python, rằng nó thực sự là một ngôn ngữ tuyệt vời. Học sinh bắt đầu học nó, nhưng tôi cứ trì hoãn. Vài năm trước, tôi cũng bắt đầu…
Điều chỉnh Hadoop và Cassandra: Cẩn thận với vNodes, Splits và Pages
1
hữu ích
8.1k xem

Điều chỉnh Hadoop và Cassandra: Cẩn thận với vNodes, Splits và Pages

Khi chạy các công việc Hadoop chống lại Cassandra, bạn sẽ muốn cẩn thận về một vài tham số. Cụ thể, đặc biệt chú ý đến vNodes, Chia tách và Kích thước trang. vNodes đã được giới thiệu trong Cassandra 1.2 .…
Cách thực hiện: Sử dụng Công cụ di chuyển cơ sở dữ liệu Oozie Apache mới
3
hữu ích
7.1k xem

Cách thực hiện: Sử dụng Công cụ di chuyển cơ sở dữ liệu Oozie Apache mới

Công cụ này làm cho việc di chuyển Oozie khỏi Apache Derby (hoặc bất kỳ cơ sở dữ liệu được hỗ trợ nào khác) dễ dàng, ngoài việc nâng cấp hợp lý. Máy chủ Apache Oozie là một ứng dụng web phi trạng thái theo…
Cách thực hiện Spark streaming phân tán với PySpark
1
hữu ích
8.1k xem

Cách thực hiện Spark streaming phân tán với PySpark

Tôi rất hào hứng chia sẻ trải nghiệm của mình với Spark Streaming, một công cụ mà tôi đang tự mình chơi. Trước khi chúng tôi bắt đầu, chúng ta hãy có một đỉnh cao lén lút ở mã cho phép bạn xem một số luồng dữ…
Cách thêm dữ liệu Power BI vào trang web
1
hữu ích
2.9k xem

Cách thêm dữ liệu Power BI vào trang web

Tuần trước tôi đã nói về  Power BI , nó là gì và một số dịch vụ khác nhau mà bạn có thể sử dụng với nó. Tuần này, hãy thêm một số dữ liệu đó vào một trang web đơn giản. Trong ví dụ này, tôi sẽ thêm dữ liệu…
Cách thay thế biểu đồ hình tròn bằng R
3
hữu ích
9.6k xem

Cách thay thế biểu đồ hình tròn bằng R

Hôm qua, một thành viên trong gia đình đã chuyển cho tôi một cuộc phỏng vấn trên Tạp chí Phố Wall với tiêu đề Những nhà khoa học dữ liệu làm gì cả ngày tại nơi làm việc . Tiêu đề hấp dẫn tôi ngay lập tức, một…
Giới thiệu về ZooKeeper
4
hữu ích
21k xem

Giới thiệu về ZooKeeper

Trong blog cuối cùng của chúng tôi, chúng tôi đã nói về cụm HDFS . Nó cần thiết để triển khai OpenTSDB trong chế độ phân cụm. Tiếp tục với loạt bài này, chúng ta sẽ nói về ZooKeeper sẽ được HBase &…

15 30 50 mỗi trang