Mô hình hồi quy tuyến tính đơn giản: Cách sử dụng gói R Deducer


Đặng Giáng Ngọc
2 năm trước
Hữu ích 1 Chia sẻ Viết bình luận 0
Đã xem 9958

Các mô hình tuyến tính - được gọi là hồi quy tuyến tính - là một trong những khung phân tích linh hoạt và phổ biến nhất để xác định mối quan hệ giữa hai hoặc nhiều biến. Mô hình tuyến tính được sử dụng rộng rãi được thể hiện bằng cách vẽ đường phù hợp nhất thông qua một loạt các điểm dữ liệu được biểu thị trên một biểu đồ phân tán.

Đối với bất kỳ nhà phân tích kinh doanh vừa chớm nở, đây là điểm khởi đầu tốt để hiểu cách thức mô hình hoạt động ở cốt lõi của thiết kế.

Chọn các biến trong GUI Deducer:

  • Biến kết quả : Y, hoặc biến phụ thuộc, nên được đưa vào danh sách này
  • Là số : Các biến độc lập nên được coi là hiệp phương sai nên được đặt trong phần này. Deducer tự động chuyển đổi một yếu tố thành một biến số, vì vậy hãy đảm bảo rằng thứ tự của cấp độ yếu tố là chính xác
  • Là yếu tố : Các biến độc lập phân loại (ngôn ngữ, dân tộc, v.v.).
  • Trọng lượng : Tùy chọn này cho phép người dùng áp dụng trọng số lấy mẫu cho mô hình hồi quy.
  • Tập hợp con : Giúp xác định nếu phân tích cần phải được thực hiện trong một tập hợp con của toàn bộ tập dữ liệu.

Lưu ý : Chỉ cho phép một kết quả. Nó cũng có thể được chuyển đổi bằng cách nhấp đúp vào nó. Ví dụ, trọng số biến đổi nhật ký cho phân tích có thể được thay đổi thành log (trọng số).

Mô hình Tab

Người dùng có thể thêm các thuật ngữ vào mô hình bằng cách chọn một hoặc nhiều biến từ danh sách biến.

  • 2 chiều : Thêm tất cả các tương tác hai chiều và thấp hơn giữa các biến được chọn.

  • 3 chiều : Thêm tất cả các tương tác ba chiều và thấp hơn giữa các biến được chọn.

    • +  -  Thêm hiệu ứng chính cho tất cả các biến đã chọn

    • :  -  Thêm tương tác giữa các mô hình được chọn

    • * -  Thêm tương tác ở giữa các điều khoản đã chọn, cũng như mọi tương tác bậc thấp hơn với chúng

    • - -  Xóa thời hạn

  • Trong :  Thêm các điều khoản lồng nhau

  • Poly :  Thêm các thuật ngữ đa thức trực giao cho mô hình

Khám phá mô hình

Sau khi tạo mô hình, sử dụng tab này, các tính năng của mô hình có thể được khám phá. Bảng xem trước hiển thị bản xem trước của những gì sẽ được hiển thị trong bảng điều khiển khi mô hình được chạy. Ở phần trên bên trái của hộp thoại, có các biểu tượng đại diện cho các giả định đang được mô hình tạo ra.

Bảng điều khiển tương tác ở trên cung cấp các tùy chọn sau để thực hiện một số phân tích chi tiết:

  • Tùy chọn : Điều này kiểm soát các thử nghiệm chính và tóm tắt chẩn đoán của mô hình.
    • Bảng ANOVA
    • Bảng tóm tắt
    • Phương sai không bằng nhau
    • Chẩn đoán, tức là VIF (yếu tố lạm phát phương sai), tóm tắt ảnh hưởng
  • Post hoc : Giúp so sánh mức độ của các yếu tố.
    • Post hoc : Các yếu tố cần được tính toán
    • Loại : Loại so sánh, tức là Tukey thực hiện tất cả các so sánh theo cặp
    • Ước tính CI : Có nên tính khoảng tin cậy?
    • Sửa lỗi : Sửa giá trị p và CI, nếu hệ số có> 2 cấp
  • Kiểm tra : Kiểm tra giả thuyết khách hàng dựa trên các tham số mô hình.
  • Cốt truyện: Trực quan hóa các hiệu ứng cận biên của mô hình.
    • Khoảng cách theo chiều : Âm mưu CI theo chiều
    • Nhãn trục Y : Nhãn cho sơ đồ trục y
    • Nhiều dòng trên mỗi bảng : Nếu hiệu ứng là hiệu ứng tương tác, tùy chọn này quyết định liệu tương tác có nên được vẽ trên nhiều dòng trong cùng một bảng hoặc dưới dạng bảng riêng biệt
    • Thảm : Các đường nhỏ trên trục x biểu thị phân phối dữ liệu
    • # of level : Số cấp độ mà hiệu ứng sẽ được tính
  • Phương tiện (phương tiện biên) : Giống như các ô hiệu ứng, phương tiện biên là phương tiện ước tính dựa trên biến kết quả của mô hình qua các mức thuật ngữ được đưa ra cho các thuật ngữ khác là tĩnh hoặc ở mức điển hình.
  • Xuất : Xuất mô hình tuyến tính cho phép người dùng xuất một số biến có liên quan đến mô hình.

Tab chẩn đoán

Bảng này chứa sáu lô đánh giá ngoại lệ, ảnh hưởng và bình đẳng của phương sai.

Hai lô trên cho thấy sự phân phối của phần dư và lý tưởng nhất, chúng nên bình thường.

Phần dư so với trang bị : Hiển thị phần dư của mô hình được vẽ dựa trên các giá trị dự đoán. Nếu đường màu đỏ không phẳng, thì mô hình có thể có độ phi tuyến tính đáng kể.

Vị trí tỷ lệ : Vẽ các giá trị dự đoán so với căn bậc hai của phần dư được tiêu chuẩn hóa; còn được gọi là lây lan so với cấp độ.

Khoảng cách nấu : Mô hình tuyến tính rất nhạy cảm với các ngoại lệ có thể ảnh hưởng quá mức đến kết quả của mô hình. Do đó, khoảng cách Cooks giúp các nhà phân tích xác định các quan sát với các giá trị Cooks lớn hơn 1.

Residuals vs. Leverage : Một âm mưu khác để kiểm tra các ngoại lệ và ảnh hưởng.

Lô hạn : Còn được gọi là lô dư thành phần hoặc một phần.

Đối với các mô hình không có tương tác, các ô dư thành phần được đưa ra. Chúng có thể được sử dụng để kiểm tra tính tuyến tính của mối quan hệ giữa yếu tố dự đoán và biến kết quả.

  • Đối với các biến số, một biểu đồ phân tán được tạo ra.
  • Đối với các yếu tố, một âm mưu hộp được tạo ra.

Đã thêm các ô biến

Cũng giống như các ô, các ô biến được thêm vào được sử dụng để kiểm tra tính tuyến tính của hiệp phương sai. Chúng rất được khuyến khích khi không có lô hạn.

Tóm lại, Deducer là một trong những GUI có nhiều chức năng nhất với sức hấp dẫn lớn. Sự dễ sử dụng mà Deducer cung cấp cho người dùng của nó là không ai sánh kịp. Deducer tiếp tục làm mọi người ngạc nhiên khi chấp nhận các định dạng tệp cho phần mềm thống kê hàng đầu, như:

  • Minitab
  • SPSS
  • SÀI GÒN
  • Cơ sở
  • Excel

Là một GUI dựa trên Java, nó cạnh tranh với các đối thủ của nó như SAS và SPSS mà không ảnh hưởng đến chất lượng đầu ra. Đặc biệt đối với các doanh nghiệp và cá nhân có ngân sách eo hẹp, Deducer có thể được triển khai mà không tốn hàng trăm nghìn đô la.

Hữu ích 1 Chia sẻ Viết bình luận 0
Đã xem 9958