4

Bạn đã nghe nói về Apache Zeppelin chưa? Nếu bạn không, bạn sẽ làm được. Trong hướng dẫn này, hãy tìm hiểu cách sử dụng các trình kết nối JDBC tiến trình với sổ ghi chép một cửa này để đáp ứng tất cả các nhu cầu BI của bạn.

Apache Zeppelin là một máy tính xách tay một cửa được thiết kế bởi cộng đồng nguồn mở Apache. Sổ ghi chép dựa trên web này có thể giúp bạn:

  • Nhập dữ liệu
  • Khám phá dữ liệu
  • Phân tích dữ liệu
  • Trực quan hóa và hợp tác dữ liệu

Điều khiến Zeppelin khác biệt so với các công cụ tương tự khác là Công cụ phiên dịch. Trình thông dịch cho phép bạn viết mã bằng bất kỳ ngôn ngữ nào để xử lý dữ liệu, sau đó có thể được cắm vào Zeppelin. Nó có hỗ trợ phiên dịch cho Apache Spark, R, Hive, Shell, Cassandra và nhiều hơn nữa. Với bản phát hành gần đây là 0.6.0, Apache Zeppelin bắt đầu hỗ trợ JDBC làm thông dịch viên. Điều này có nghĩa là bây giờ bạn có thể sử dụng trình điều khiển JDBC tiến trình để kết nối với bất kỳ nguồn dữ liệu quan hệ, SaaS / Cloud, Big Data và NoQuery nào.

Để giúp bạn bắt đầu, chúng tôi đã tạo một hướng dẫn dễ dàng về cách sử dụng Apache Zeppelin với trình điều khiển JDBC Cơ sở dữ liệu Oracle Data Progressirect. Lưu ý rằng bạn có thể sử dụng quy trình tương tự với bất kỳ trình điều khiển JDBC nào của chúng tôi.

Trước khi bạn bắt đầu

  1. Hãy chắc chắn rằng bạn đã cài đặt Java trên máy của bạn. Bạn có thể kiểm tra điều này bằng cách chạy lệnh java -version trên thiết bị đầu cuối của bạn.
  2. Cài đặt Apache Zeppelin bằng cách nhân bản kho lưu trữ GitHub này và làm theo các hướng dẫn trong tệp README của kho lưu trữ

Cài đặt trình điều khiển JDBC của DataDirect

  1. Tải xuống trình điều khiển JDBC DataDirect từ đây .
  2. Để cài đặt trình điều khiển, bạn phải thực thi gói .jar. Bạn có thể làm điều đó bằng cách chạy lệnh sau trong terminal:
    java -jar PROGRESS_DATADIRECT_JDBC_ORACLE_ALL.jar
  3. Điều này sẽ khởi chạy trình cài đặt java tương tác, mà bạn có thể sử dụng để cài đặt trình điều khiển JDBC của Oracle đến vị trí mong muốn của bạn dưới dạng cài đặt được cấp phép hoặc đánh giá

Cấu hình trình thông dịch JDBC của DataDirect trong Apache Zeppelin

  1. Nếu bạn chưa khởi động Apache Zeppelin, hãy khởi động nó bằng cách chạy lệnh khởi động zeppelin-daemon.sh trong terminal tại zeppelin_install_dir / bin
  2. Duyệt  http: // localhost: 8080 / để truy cập Zeppelin trên trình duyệt của bạn. Bạn sẽ thấy một màn hình chào mừng bên dưới nếu bạn đã kết nối thành công.
  3. Để định cấu hình trình thông dịch cho Oracle JDBC, nhấp vào tên người dùng của bạn từ thanh điều hướng và nhấp vào tùy chọn ' Trình thông dịch .' Điều này sẽ mở ra một trang mới hiển thị tất cả các thông dịch viên đã được cấu hình.
  4. Để tạo trình thông dịch mới, nhấp vào nút ' Tạo ' như trong ảnh chụp màn hình bên dưới:
  5. Đặt tên cho trình thông dịch của bạn như bạn muốn và đối với nhóm thông dịch viên chọn ' jdbc .' Bạn sẽ thấy một biểu mẫu mới với một số giá trị mặc định được điền vào. Tôi sẽ thay đổi chúng như dưới đây để kết nối với Oracle DB bằng trình điều khiển JDBC của DataDirect.  Thuộc tính :
    • Mặc định.url: 
      jdbc:datadirect:oracle://<hostname>:<port>;SID=<SID>
    • Mặc định.driver
      com.ddtek.jdbc.oracle.OracleDriver
    • người dùng mặc định:
      <username>
    • mật khẩu mặc định:
      <password> 
      Bạn có thể xóa tất cả các thuộc tính khác bằng cách nhấp vào nút 'X' trong các hành động.
    Phụ thuộc:
    • hiện vật :
      Data_Direct_Oracle_JDBC_install_dir/lib/oracle.jar 
    Lưu trình thông dịch với các cài đặt này và trình thông dịch của bạn sẽ được tạo. Sau đây là ảnh chụp màn hình về cách trình thông dịch được cấu hình trông sau khi lưu:

Trực quan hóa dữ liệu của bạn

  1. Tạo Notebook mới bằng cách nhấp vào menu thả xuống Notebook trên thanh điều hướng, sau đó nhấp vào ' Tạo ghi chú mới '. Đặt tên cho ghi chú mới của bạn và nhấp vào OK.
  2. Trước khi bắt đầu, bạn cần kiểm tra xem ràng buộc trình thông dịch có được thực hiện đúng cho ghi chú cụ thể này không. Để làm điều đó, bạn cần vào cài đặt ràng buộc của trình thông dịch bằng cách nhấp vào biểu tượng bánh răng nhỏ trên Notebook của bạn. Ảnh chụp màn hình sau đây cho thấy cách truy cập nó, trong trường hợp bạn không thể xác định vị trí của nó:
  3. Hãy chắc chắn rằng bạn chọn trình thông dịch mà chúng tôi đã tạo ở trên. Bỏ chọn mọi thứ khác mà bạn không cần và lưu ràng buộc.
  4. Theo mặc định, bạn sẽ thấy% spark, mà bạn nên thay đổi thành% jdbc, để sổ ghi chép sử dụng trình thông dịch JDBC mà chúng ta đã tạo ở các bước trên
  5. Trong dòng tiếp theo, bạn có thể chạy bất kỳ truy vấn nào để tìm nạp dữ liệu từ Oracle DB sang Apache Zeppelin theo nhu cầu của bạn. Trong hướng dẫn này, tôi có bộ dữ liệu mẫu gió Bắc trong Oracle DB của mình và tôi đã chạy truy vấn để tìm nạp tất cả dữ liệu từ bảng Đơn hàng như dưới đây:
  6. Bây giờ bạn đã lấy dữ liệu cần thiết, hãy thay đổi chế độ xem kết quả từ chế độ xem dữ liệu dạng bảng sang biểu đồ thanh, biểu đồ hình tròn hoặc biểu đồ đường để xem trực quan hóa dữ liệu của bạn. Dưới đây là một biểu đồ đường đơn giản, trực quan hóa dữ liệu cho một số đơn đặt hàng từ mỗi quốc gia.
|