Mô hình học máy: Hoạt động triển khai


Lý Khánh Thy
10 tháng trước
Hữu ích 8 Chia sẻ Viết bình luận 0
Đã xem 10120

Creating a machine learning model and deploying it in production takes effort. We had previously discussed the various ways in which we can deploy models in production. However, model deployment is not the end; it is just the beginning. The real issues start from here. We don't have any control over the data in the actual environment. Changes might happen, and we need to be ready to detect and upgrade our model before it becomes obsolete. In this piece, we will discuss some ways to monitor model performance on an ongoing basis.

Một mô hình học máy được xây dựng trên một tập hợp dữ liệu đào tạo đầu vào với các thuộc tính khác nhau. Vì vậy, khía cạnh quan trọng nhất là kiểm tra xem liệu dữ liệu đầu vào mà mô hình được đào tạo có còn giữ tốt dữ liệu thực tế trong môi trường thế giới thực hay không. Thuật ngữ này chủ yếu được gọi là Khái niệm trôi dạt. Sự thay đổi dữ liệu có thể đột ngột hoặc có thể thay đổi dần dần theo thời gian. Vì vậy, điều cần thiết là xác định các mẫu thay đổi và sửa chữa mô hình trước.

Khi mô hình được triển khai trong môi trường sản xuất, chúng tôi cần làm theo các bước sau để giữ cho mô hình của chúng tôi khỏe mạnh và hữu ích cho người dùng cuối.

Ước tính

Trước khi triển khai mô hình Machine Learning trong sản xuất, hãy nghĩ ra các số liệu đánh giá hiệu suất cần được theo dõi theo thời gian cũng như xác định tần suất làm mới mô hình học máy. Không có chiến lược phổ quát chính thức để ước tính những thay đổi cần thiết. Ví dụ: trong một vấn đề về chuỗi thời gian, dữ liệu có thể thay đổi theo thời gian. Trong trường hợp của phương tiện truyền thông xã hội, dữ liệu là động và có thể thay đổi bất cứ lúc nào. Trong trường hợp của ngành hàng tiêu dùng, dữ liệu hướng tới khách hàng thay đổi theo thời gian, có thể là hàng tháng hoặc trong các hoạt động quảng cáo. Trong trường hợp kinh doanh doanh nghiệp, nó có thể là hàng quý hoặc khi kết quả tài chính được đưa ra. Vì thế,

Giám sát

Bước đệm sau khi triển khai mô hình học máy là theo dõi hiệu suất của nó. Sự thay đổi độ chính xác dự đoán có thể là một số liệu tóm tắt để theo dõi hiệu suất theo thời gian. Nếu có sự thay đổi trong dự đoán, thì đó có thể là dấu hiệu của sự suy giảm hiệu suất mô hình. Sự thay đổi trong dự đoán này cũng có thể được gọi là sự trôi dạt mục tiêu.

Chúng ta cũng nên theo dõi các mô hình cho các tính năng trôi. Nếu có sự thay đổi trong phân phối dữ liệu của các tính năng đầu vào, đó là dấu hiệu của sự trôi dạt tính năng sẽ ảnh hưởng đến hiệu suất mô hình. Có thể có trường hợp hàng ngàn tính năng được sử dụng. Nếu việc giám sát tất cả các tính năng nghe có vẻ khó khăn, chúng ta có thể giám sát một vài tính năng quan trọng mà sự thay đổi trong phân phối dữ liệu có thể làm sai lệch kết quả mô hình một cách khủng khiếp.

Chúng tôi cũng có thể theo dõi cho:

  • Tỷ lệ phần trăm giá trị bị thiếu đang tăng theo thời gian
  • Sự thay đổi về cấp độ trong các thuộc tính phân loại.

Tái cấu trúc

Nếu chúng ta quan sát hiệu suất mô hình bị suy giảm hoặc đạt thời gian dự kiến ​​làm mới mô hình, thì đó là thời gian một lần nữa để tái cấu trúc thiết kế mô hình. Làm mới mô hình và tạo một mô hình đào tạo lại là dễ dàng. Tuy nhiên, chúng ta có thể cần nghĩ đến các tính năng bổ sung có thể cải thiện hiệu suất của mô hình. Tương tự, trong khi sửa một mô hình xuống cấp, chúng ta nên phân tích nguyên nhân gốc rễ của vấn đề và tìm giải pháp thích hợp cho nó. Ví dụ: nếu sự suy giảm hiệu năng của mô hình là do sự trôi dạt của một tính năng, chúng ta cần phải đi sâu và phân tích tính năng này để cơ cấu lại nó để làm cho nó mạnh mẽ hơn và bền vững hơn theo thời gian.

Tái tạo

Bước cuối cùng là xây dựng lại mô hình với bộ tính năng và tham số mô hình mới hoặc được sửa đổi. Nó là thoải mái nhất trong tất cả. Yêu cầu duy nhất là tìm ra một mô hình tối ưu mang lại độ chính xác tốt nhất, giúp khái quát tốt cho một số dữ liệu bị trôi và không trở thành nút cổ chai đối với tài nguyên CNTT. Yêu cầu một dòng này đôi khi phải mất vài ngày hoặc vài tháng để đạt được.

Để kết luận, giám sát mô hình là một quá trình liên tục. Đặt ra một chiến lược chính xác cho quá trình này là rất quan trọng để giám sát các yếu tố đúng. Tái cấu trúc và xây dựng lại một mô hình để đánh bại mô hình vô địch trước đó là rất quan trọng cho sự thành công của chương trình máy học hoặc khoa học dữ liệu.

Một dự án máy học không phải là một hoạt động thực hiện một lần. Cung cấp kết quả mạnh mẽ mỗi ngày thúc đẩy doanh nghiệp tiến lên phía trước là những gì xác định lợi ích của học máy và khoa học dữ liệu.

Hữu ích 8 Chia sẻ Viết bình luận 0
Đã xem 10120