Helpex - Trao đổi & giúp đỡ Đăng nhập

Truy cập SQL trực tiếp vào dữ liệu bảng điều khiển của bạn trong 6 bước đơn giản

Tôi có mối quan hệ yêu ghét với Mixpanel.

Phần yêu thích là khá rõ ràng: Mixpanel cho phép người dùng tạo kênh với tích hợp kỹ thuật tối thiểu và chức năng trực quan hóa và báo cáo của nó đã được cải thiện rất nhiều trong những năm qua. Quan tâm đến chiến dịch nào đang hoạt động tốt nhất về tỷ lệ chuyển đổi cho một kênh cụ thể? Nhấp, nhấp, BAM! Làm thế nào về việc xem xét tỷ lệ chuyển đổi theo xu hướng được chia nhỏ theo nhóm thuần tập hàng tuần? Nhấp, nhấp, BAM!

Đối với phần ghét, nó tinh tế hơn một chút, nhưng nó xuất hiện khi bạn đến đây: nhấp, nhấp, nhấp, Google, nhấp, cuộn, quay lại, Google một lần nữa, nhấp… trước khi bạn nhận ra rằng một câu hỏi bạn cần câu trả lời không thể dễ dàng trả lời với Mixpanel.

Bị chặn bởi tính không linh hoạt của Mixpanel, bạn bắt đầu yêu cầu các kỹ sư dữ liệu của mình cấp quyền truy cập thô vào dữ liệu Mixpanel. Tuy nhiên, các kỹ sư dữ liệu bận rộn và bất kỳ thay đổi nào họ thực hiện có thể mất vài ngày, thậm chí vài tuần. Vậy bạn làm gì? Bạn quyết định làm điều đó một mình…

Nghe có vẻ quen? Nếu bạn đã gật đầu cho đến nay, thì bạn đã đến đúng nơi. Tôi sẽ chỉ cho bạn cách truy cập từng sự kiện vào tất cả dữ liệu Mixpanel của bạn bằng giao diện SQL. Như một phần thưởng bổ sung, bạn có thể xuất tất cả dữ liệu này vào các hệ thống khác nhau như PostgreSQL, Redshift, S3, Tableau, v.v.

Mixpanel + Kiến trúc dữ liệu kho báu

Bước 1: Nhận bí mật và khóa API Mixpanel của bạn

Để truy cập khóa API của bạn, hãy đăng nhập vào tài khoản Mixpanel của bạn và nhấp vào tab Tài khoản để hiển thị cửa sổ bật lên phương thức. Nhấp vào tab Dự án để hiển thị khóa API và bí mật API của bạn:

Bước 2: Nhận khóa API dữ liệu kho báu của bạn

Đăng ký  dữ liệu kho báu miễn phí. Sau khi bạn đã đăng ký, hãy tải xuống công cụ dòng lệnh từ  đây .

Bạn có thể kiểm tra xem công cụ dòng lệnh đã được cài đặt hay chưa bằng cách chạy lệnh sau từ trình bao của bạn (Terminal.app nếu bạn đang sử dụng OSX):
td –version
0.12.0
Bây giờ, từ dòng lệnh, hãy đăng nhập vào Dữ liệu kho báu bằng cách chạy lệnh sau và nhập email và mật khẩu của bạn:

Bước 3: Viết seed.yml và tạo tệp cấu hình

Tạo tệp YAML (seed.yml) có dạng như sau:
in:
type: mixpanel
api_key: “YOUR_MIXPANEL_APIKEY”
api_secret: “YOUR_MIXPANEL_SECRET”
múi giờ: 'UTC'
from_date: “2015-10-28 ″
fetch_days: 1
out:
mode: append

Giải thích nhanh cho tệp YAML:

  • from_date: Điều này chỉ định ngày đầu tiên của các sự kiện Mixpanel mà bạn muốn nhập.
  • fetch_days: Điều này chỉ định số ngày dữ liệu bạn muốn nhập.
  • Chế độ này chỉ định cách bạn muốn chèn dữ liệu vào Dữ liệu kho báu. Ở đây, chúng tôi đang bổ sung dữ liệu gia tăng mới.

Vì vậy, trong tệp seed.yml ví dụ ở trên, chúng tôi đang nhập dữ liệu đầy đủ của một ngày vào ngày 28 tháng 10 năm 2015.

Sau khi có tệp seed.yml, bạn có thể chạy “td connector: đoán seed.yml -o load.yml”. Dữ liệu kho báu đủ thông minh để xem các sự kiện mẫu của bạn và tự động tạo tệp cấu hình đầy đủ:

Bước 4: Tải dữ liệu của bạn

Với tệp cấu hình đầy đủ (load.yml) trong tay, chúng tôi đã sẵn sàng nhập dữ liệu. Đầu tiên, tạo một cơ sở dữ liệu có tên là “mixpanel” với một bảng có tên là “my_project”. Vui lòng thay thế những tên này bằng tên bạn chọn (Các bước này cũng có thể được thực hiện bên trong bảng điều khiển của chúng tôi   ).

Sau đó, tải dữ liệu bằng “td connector: issue load.yml –database mixpanel –table my_project –wait”. Một lần nữa, bạn có thể sử dụng cơ sở dữ liệu và tên bảng của riêng mình. Nếu bạn đang lưu trữ nhiều sự kiện trong Mixpanel, bước này có thể mất một chút thời gian. Trong trường hợp đó, bạn có thể chạy nó mà không cần “–wait” và truy xuất trạng thái công việc của bạn với “td job: show <job_id>”

Sự thành công!

Bước 5: Truy cập theo sự kiện với SQL, tải xuống dưới dạng CSV

Cuối cùng, hãy kiểm tra xem dữ liệu của bạn có ở đó không. Bạn có thể chạy truy vấn sau để nhận 10 sự kiện đầu tiên:

Và, bây giờ bạn có quyền truy cập trực tiếp, thô vào dữ liệu trên máy tính xách tay của mình dưới dạng tệp CSV (chúng tôi cũng hỗ trợ tsv và json-per-line).

Bước 6: Tự động hóa quá trình xuất gia tăng của bạn

Tất cả những điều này thật tuyệt, nhưng trong trường hợp sử dụng thực tế, bạn cần phải tự động hóa quá trình xuất dữ liệu Mixpanel của mình theo từng bước. Treasure Data hỗ trợ điều này bằng cách tạo các lần thực thi theo lịch trình: Nó đủ thông minh để biết lần thực thi tiếp theo sẽ trông như thế nào dựa trên việc thực hiện hiện tại. Trong trường hợp của chúng tôi, lần thực thi tiếp theo sẽ chạy với “from_date: '2015-10-29' với" fetch_days: 1 "để tải các sự kiện Mixpanel từ ngày tiếp theo. Nếu bạn đã định cấu hình seed.yml với “fetch_days: 7” để có được kết xuất hàng tuần, thì lần chạy tiếp theo sẽ có “from-date: '2015-11-04'” với "fetch_days: 7".

Đối với ví dụ hiện tại của chúng tôi, chúng tôi muốn chạy điều này như một công việc hàng ngày với "td connector: create daily_mixpanel_dump" 0 0 * * * "mixpanel my_project load.yml". Theo tùy chọn, bạn có thể chỉ định múi giờ bằng "–time-zone" (theo mặc định là UTC).

Cái gì tiếp theo?

Xin chúc mừng. Bây giờ bạn có một đường dẫn dữ liệu cho phép bạn truy cập từng sự kiện dữ liệu Mixpanel của mình bằng cách sử dụng SQL. Điều thực sự thú vị về Dữ liệu kho báu là nó cho phép bạn kết nối kết quả truy vấn của mình với các hệ thống đầu ra khác nhau. Chúng tôi đã thấy rằng bạn có thể tải xuống kết quả truy vấn dưới dạng CSV / TSV, nhưng ngoài ra, chúng tôi có  hàng tá  tích hợp, bao gồm PostgreSQL / MySQL, Google Sheets, Tableau, Looker, v.v.

Mixpanel chắc chắn có vị trí trong lĩnh vực phân tích. Tôi tiếp tục sử dụng nó hàng ngày. Tuy nhiên, khả năng truy cập dữ liệu sự kiện thô của bạn mà không phải trả một khoản tiền nào là vô giá!

6 hữu ích 0 bình luận 5.0k xem chia sẻ

Có thể bạn quan tâm

loading