Công cụ thu thập dữ liệu cho phân tích sự kiện


Lê Tú Sương
1 năm trước
Hữu ích 5 Chia sẻ Viết bình luận 0
Đã xem 6927

Một trong những điều đầu tiên chúng tôi làm sau khi ra mắt trang web là kết nối với Google Analytics. Một chút nữa, chúng ta sẽ kết nối thêm các công cụ phân tích khác ngoài ra để tính toán phễu, lưu giữ, kiểm tra A / B và hơn thế nữa.

Những công cụ này rất tuyệt và chúng hoạt động tốt cho đến khi một công ty trở nên lớn hơn và các yêu cầu phân tích trở nên tinh vi hơn. Đã đến lúc thiết lập một cơ sở hạ tầng dữ liệu, có nghĩa là chọn một công cụ thu thập dữ liệu, công cụ ETL, kho dữ liệu và công cụ BI trên đó.

Trong thế giới khởi nghiệp, điều này thường xảy ra khi một công ty đã tăng Series A và có khoảng 25-50 nhân viên. Google Analytics và các công cụ phân tích trang web khác không còn đủ nữa. Chi phí của họ đang tăng lên, nhưng yêu cầu khôn ngoan, họ không cung cấp những gì bạn cần. Ngoài ra, tại thời điểm này, bạn có thể có rất nhiều dữ liệu ở những nơi khác, chẳng hạn như cơ sở dữ liệu sản xuất, tiếp thị và công cụ bán hàng và bạn muốn báo cáo của mình hợp nhất dữ liệu từ tất cả những nơi này.

Đối với phạm vi của bài đăng này, chúng tôi sẽ cung cấp cho bạn tổng quan về các công cụ thu thập dữ liệu tốt nhất dành riêng cho dữ liệu sự kiện.

Xây dựng của riêng bạn

Bạn có thể có thể xây dựng một bằng chứng đơn giản về khái niệm với các yêu cầu AJAX gửi các sự kiện đến máy chủ của bạn và sau đó viết nó vào cơ sở dữ liệu của bạn trong vài giờ. Nhưng đối với một giải pháp sẵn sàng sản xuất ở quy mô, nó có thể dễ dàng trở thành công việc toàn thời gian cho một số kỹ sư tại công ty của bạn.

Chúng tôi đã thấy các công ty có điều này và yêu thích nó, và các công ty khác đang phải bảo trì và hy vọng sẽ chuyển từ thiết lập nội bộ này sang các công cụ thu thập dữ liệu tại một số điểm.

Chúng tôi khuyên bạn hầu như không bao giờ tự làm điều đó trừ khi bạn có các yêu cầu rất cụ thể và / hoặc trường hợp sử dụng trong trường hợp không thể (hoặc không hiệu quả cao) để sử dụng các tùy chọn có sẵn trên thị trường.

  • Ưu điểm : Thật thú vị khi viết mã.

  • Nhược điểm : Có lẽ bạn cần tập trung vào kinh doanh cốt lõi của mình.

Phân khúc

Phân đoạn cho phép bạn định tuyến các sự kiện từ các nguồn khác nhau đến các điểm đến khác nhau. Các máy khách JavaScript hoặc mã máy chủ của bạn (chẳng hạn như Ruby hoặc Node.js) có thể được coi là một trong những nguồn và Redshift hoặc BigQuery là đích. Phân đoạn cũng có thể gửi dữ liệu từ một số dịch vụ, chẳng hạn như Stripe, đến kho phân tích của bạn, mặc dù nó không hỗ trợ bất kỳ cơ sở dữ liệu nào dưới dạng nguồn.

Phân đoạn khá phổ biến để tổ chức các sự kiện phát trực tuyến đến các dịch vụ, chẳng hạn như Google Analytics, Mixpanel, v.v. Chúng tôi thấy rằng nó đã trở thành một phần của ngăn xếp cho rất nhiều công ty từ rất sớm. Trong trường hợp khi bạn đã có Phân đoạn, đó có thể là một trong những cách dễ dàng nhất để nâng cấp lên SQL. SQL Bạn chỉ cần kích hoạt kho của mình dưới dạng nguồn dữ liệu và bạn sẽ ổn.

Giá cả phụ thuộc vào người dùng hoạt động hàng tháng. Phân đoạn gọi đó là Người dùng theo dõi hàng tháng (MTU). Nếu bạn có nhiều người dùng, thường là trường hợp khởi nghiệp B2C đang phát triển nhanh, Phân khúc có thể trở nên khá đắt đỏ: 100.000 MTU là ~ 1.000 đô la mỗi tháng.

Phân đoạn có thể là một lựa chọn tốt nếu bạn đã sử dụng nó để định tuyến các sự kiện đến các điểm đến khác nhau và bạn không mong đợi một lượng lớn người dùng hoạt động hàng tháng.

  • Ưu điểm : Dễ dàng bắt đầu nếu bạn đã sử dụng Phân đoạn; hệ sinh thái tốt với rất nhiều hướng dẫn và giải pháp sẵn sàng hoạt động.

  • Nhược điểm : Khóa nhà cung cấp; hóa đơn của bạn có thể phát điên

Đồ ủi tuyết

Snowplow là một nền tảng phân tích sự kiện, web và di động nguồn mở. Vì nó là nguồn mở, bạn không có nhà cung cấp khóa ở đây và không phải lo lắng về việc hóa đơn bị điên. Tuy nhiên, việc triển khai ban đầu có thể khá tốn kém và bạn có thể cần phải thuê một nhà tư vấn nếu nhóm của bạn không có đủ kinh nghiệm.

Có một số tùy chọn để làm cho nó dễ dàng hơn, chẳng hạn như lưu trữ trình thu thập Snowplow của bạn tại các nhà cung cấp bên thứ ba. Khi bạn mở rộng quy mô, bạn luôn có thể lưu trữ nó tại một số điểm.

Bên cạnh chi phí ban đầu, bạn cũng nên xem xét bảo trì trong tương lai vì bạn sẽ tự lưu trữ nó. Bản thân Snowplow đã được thử nghiệm chiến đấu và sẵn sàng sản xuất trên quy mô lớn. Đó là một câu hỏi về việc có đủ chuyên môn để thực hiện và duy trì nó sau này.

  • Ưu điểm : Không có nhà cung cấp khóa; hệ sinh thái tốt với các đối tác công nghệ và tư vấn.

  • Nhược điểm : Việc thực hiện ban đầu có thể khá tốn kém.

Căn cứ hỏa lực

Chỉ dành cho iOS / Android.

Firebase bắt đầu như một dịch vụ phụ trợ thời gian thực. Sau khi được Google mua lại vào năm 2014, Firebase đã phát triển thành một nền tảng lớn hơn cung cấp nhiều tính năng hơn bên cạnh phần phụ trợ thời gian thực, như báo cáo sự cố, thông báo đẩy và phân tích.

Với Firebase Analytics, bạn có thể thu thập dữ liệu sự kiện và gán thuộc tính cho người dùng. Nhưng lý do chúng tôi đề cập đến nó trong tổng quan về các công cụ thu thập dữ liệu của chúng tôi là vì nó có tích hợp BigQuery riêng, điều này giúp cho việc tải dữ liệu của bạn từ Firebase sang BigQuery trở nên rất thuận tiện.

Đây là một tùy chọn phù hợp nếu bạn đã sử dụng các tính năng Firebase khác, bạn có BigQuery và sẵn sàng có mối quan hệ lâu dài với Cơ sở hạ tầng của Google.

Bản thân Analytics là miễn phí, nhưng tích hợp BigQuery được trả tiền. Giá cả phải chăng, nhưng không đơn giản. Bạn có thể chơi xung quanh với máy tính giá của họ để có cảm giác tốt hơn.

  • Ưu điểm : Dễ dàng bắt đầu nếu bạn đã có Firebase; cân hoàn hảo; giá cả phải chăng.

  • Nhược điểm : Khóa trên các sản phẩm Google Cloud; Chỉ dành cho iOS / Android.

Đống

Heap là một nền tảng phân tích di động và web tương tự như Mixpanel hoặc Amplitude. Sự khác biệt chính với Heap là nó tự động theo dõi mọi thứ, do đó bạn không cần chỉ định các sự kiện bạn muốn gửi trong ứng dụng của mình. Bạn tạo các sự kiện mới trong giao diện Heap bằng cách đặt một số quy tắc; ví dụ: nhấp chuột vào một nút cụ thể trên một trang cụ thể có thể được coi là sự kiện Mua hàng trên mạng.

Ngoài ra, điều làm cho Heap khác biệt và tại sao nó có trong danh sách các công cụ thu thập dữ liệu là Heap cung cấp một tính năng SQL, về cơ bản là một thể hiện Redshift được quản lý. Kho "sở hữu" của Heaps, nhưng bạn có thể kết nối công cụ BI của mình bằng cách yêu cầu thông tin đăng nhập từ nhóm Heap.

Việc tạo ra sự kiện không mã hóa của Cameron có lẽ không phải là một phần thưởng lớn ở đây vì bạn muốn nhóm dữ liệu của mình kiểm soát dữ liệu thô của bạn và hiển thị các mô hình dữ liệu đã chuyển đổi cho người dùng cuối. Tuy nhiên, việc không đặt các đoạn mã của Heap trên ứng dụng của bạn để gửi các sự kiện có thể giúp cuộc sống dễ dàng hơn trong trường hợp di chuyển khỏi Heap.

  • Ưu điểm : Dễ dàng bắt đầu cho người dùng Heap.

  • Nhược điểm : Nhà cung cấp khóa cả về thu thập dữ liệu và lưu trữ dữ liệu.

Hữu ích 5 Chia sẻ Viết bình luận 0
Đã xem 6927