IT <code> - Tag hadoop [Bài viết]

Hadoop 101: Giải thích về hệ sinh thái Hadoop
3
hữu ích
11k xem

Hadoop 101: Giải thích về hệ sinh thái Hadoop

Dữ liệu lớn đang cất cánh vào năm 2014. Nhiều công ty hơn bao giờ hết đang tìm cách sử dụng nó, cả để quản lý các thói quen kinh doanh hàng ngày và tìm giải pháp cho các vấn đề kinh doanh phức tạp. Nó nhanh…
Cách tạo Blob Storage và HDInsight Hadoop Cluster với Windows Azure
6
hữu ích
7.1k xem

Cách tạo Blob Storage và HDInsight Hadoop Cluster với Windows Azure

HDInsight là một nền tảng cung cấp một cơ sở để cung cấp các cụm Hadoop, Spark, Storm, HBase, Kafka và R Servers trên Windows Azure. Bây giờ, bạn sẽ tìm hiểu cách thiết lập cụm Hadoop trên Windows Azure.…
Bắt đầu với Spark 1.6 ngay lập tức
5
hữu ích
2.2k xem

Bắt đầu với Spark 1.6 ngay lập tức

Hãy bắt đầu với bước một , sau khi bạn cài đặt , hãy bắt đầu nhanh. Chơi xung quanh với vỏ Scala, thử một số bài tập , đảm bảo bạn sẽ thấy những gì đang diễn ra. Đọc các tài liệu nghiên cứu ban đầu để bạn có…
Xây dựng và cài đặt Hadoop trên Windows với Binaries gốc
7
hữu ích
10k xem

Xây dựng và cài đặt Hadoop trên Windows với Binaries gốc

Giới thiệu Tôi đã tìm kiếm trên Google và thấy rằng Hadoop cung cấp hỗ trợ Windows gốc từ phiên bản 2.2 trở lên, nhưng chúng tôi cần tự xây dựng nó, vì các bản phát hành Apache Hadoop chính thức không cung…
Hadoop Revisted, Phần III: Hướng dẫn MapReduce
5
hữu ích
5.5k xem

Hadoop Revisted, Phần III: Hướng dẫn MapReduce

Trong Phần I và Phần II của loạt bài này, chúng tôi đã đi qua 10 khái niệm chính về Hadoop và kiểm tra giao diện dòng lệnh cho hệ thống tệp Hadoop, cụ thể là  hadoop fs. Chúng tôi đã kiểm tra làm thế nào…
Đó không phải là về kích thước dữ liệu của bạn, nhưng vì tất cả chúng ta đều đang đếm
6
hữu ích
4.3k xem

Đó không phải là về kích thước dữ liệu của bạn, nhưng vì tất cả chúng ta đều đang đếm

Có lẽ bạn là người mới trong thế giới dữ liệu. Trong trường hợp: tl; dr kích thước dữ liệu không thành vấn đề nhưng chúng tôi vẫn thích so sánh. Nếu bạn vẫn đang cười thầm, thì có lẽ bạn đã nhận thấy số…
Hadoop so với Elaticsearch cho Phân tích Nâng cao
2
hữu ích
2.8k xem

Hadoop so với Elaticsearch cho Phân tích Nâng cao

Elaticsearch là một công cụ tuyệt vời để lập chỉ mục tài liệu và tìm kiếm toàn văn mạnh mẽ. Ngôn ngữ truy vấn cụ thể miền (DSL) dựa trên JSON của nó rất đơn giản và mạnh mẽ, làm cho nó trở thành tiêu chuẩn…
CDAP 3.5 - Bảo mật doanh nghiệp, Truyền phát và kéo thả và nhiều ...
7
hữu ích
4.7k xem

CDAP 3.5 - Bảo mật doanh nghiệp, Truyền phát và kéo thả và nhiều ...

Tôi rất vui mừng thông báo phát hành Nền tảng ứng dụng dữ liệu Cask (CDAP) phiên bản 3.5. Trọng tâm của CDAP 3.5 là bảo mật, với một số khả năng mới đáng kể được thêm vào nền tảng, bên cạnh những cải tiến lớn…
Thay đổi thu thập dữ liệu bằng Apache NiFi
1
hữu ích
5.7k xem

Thay đổi thu thập dữ liệu bằng Apache NiFi

Điều kiện tiên quyết Tải xuống hộp cát HDP Cơ sở dữ liệu MySQL (Nên có trong hộp cát) NiFi 0.6 trở lên (Tải xuống và cài đặt phiên bản mới của NIFI hoặc sử dụng Ambari để cài đặt NIFI trong hộp…
Điều chỉnh Hadoop và Cassandra: Cẩn thận với vNodes, Splits và Pages
1
hữu ích
8.1k xem

Điều chỉnh Hadoop và Cassandra: Cẩn thận với vNodes, Splits và Pages

Khi chạy các công việc Hadoop chống lại Cassandra, bạn sẽ muốn cẩn thận về một vài tham số. Cụ thể, đặc biệt chú ý đến vNodes, Chia tách và Kích thước trang. vNodes đã được giới thiệu trong Cassandra 1.2 .…
Giới thiệu về Ambari Views 2.4 Tính năng mới: Cụm từ xa ...
1
hữu ích
5.9k xem

Giới thiệu về Ambari Views 2.4 Tính năng mới: Cụm từ xa ...

Ambari Views Server là Máy chủ Ambari độc lập được sử dụng để lưu trữ Lượt xem và Máy chủ Ambari là Máy chủ Ambari hoạt động quản lý một cụm Hadoop Trước Ambari 2.4, khi Máy chủ Ambari Views được thiết lập,…
Các bài viết hàng đầu về Apache Hadoop: Ambari, Spark và hơn thế nữa
1
hữu ích
6.9k xem

Các bài viết hàng đầu về Apache Hadoop: Ambari, Spark và hơn thế nữa

Nó đã là một tuần thú vị khác trên HCC kết nối cộng đồng Hortonworks . Chúng tôi tiếp tục thấy hoạt động tuyệt vời và đề xuất các tài sản sau từ tuần trước. Bài viết hàng đầu từ HCC…
Di chuyển phân tích ra khỏi Trung tâm dữ liệu
5
hữu ích
9.1k xem

Di chuyển phân tích ra khỏi Trung tâm dữ liệu

Blog này tập trung vào việc di chuyển các phân tích phát trực tuyến bên ngoài giới hạn của trung tâm dữ liệu truyền thống. Di chuyển phân tích phát trực tuyến gần hơn đến nơi có thể thực hiện dữ liệu bắt…
Sqoop: Nhập dữ liệu từ MySQL sang Hive [Help 1]?
4
hữu ích
7.8k xem

Sqoop: Nhập dữ liệu từ MySQL sang Hive [Help 1]?

Điều kiện tiên quyết : Môi trường Hadoop với Sqoop và Hive được cài đặt và làm việc. Để tăng tốc công việc, tôi đang sử dụng Cloudera Quickstart VM  (yêu cầu 4GB RAM), mặc dù bạn cũng có thể làm việc với Nền…
10 lệnh Hadoop Shell hàng đầu để quản lý HDFS
3
hữu ích
9.8k xem

10 lệnh Hadoop Shell hàng đầu để quản lý HDFS

Vậy bạn đã biết Hadoop là gì? Tại sao nó được sử dụng? Những vấn đề bạn có thể giải quyết với nó? Và bạn muốn biết làm thế nào bạn có thể đối phó với các tệp trên HDFS? Đừng lo lắng, bạn đang ở đúng…

15 30 50 mỗi trang