IT <code> - Tag site reliability engineering [Bài viết]

Chọn công cụ SRE phù hợp
17
hữu ích
6.3k xem

Chọn công cụ SRE phù hợp

Việc thực hiện các thực hành và văn hóa SRE có thể là một thách thức. May mắn thay, có nhiều công cụ cho từng khía cạnh của SRE: giám sát, SLO và lập ngân sách lỗi, quản lý sự cố, hồi cứu sự cố, cảnh báo, kỹ thuật hỗn loạn, v.v.…
Làm thế nào để xây dựng một nhóm SRE với một tư duy phát triển
16
hữu ích
3.0k xem

Làm thế nào để xây dựng một nhóm SRE với một tư duy phát triển

Giới thiệu Lợi ích lớn nhất của SRE không phải lúc nào cũng là các quy trình hoặc công cụ, mà là sự thay đổi văn hóa. Xây dựng một nền văn hóa vô tội vạ có thể thay đổi sâu sắc cách tổ chức của bạn hoạt động. Nhóm SRE của bạn…
Dưới đây là các dự đoán hàng đầu cho SRE vào năm 2021
7
hữu ích
10k xem

Dưới đây là các dự đoán hàng đầu cho SRE vào năm 2021

Còn ai khác vui mừng rằng năm 2020 sắp kết thúc? Chúng tôi đã có một trong những năm khó khăn nhất trong lịch sử gần đây. Với mọi thứ đang diễn ra, thật khó để nghĩ xa hơn một vài ngày sắp tới, ít hơn nhiều khi bước sang năm mới.…
Đây là cách sử dụng các phương pháp hay nhất của ITIL, DevOps và SRE
7
hữu ích
2.9k xem

Đây là cách sử dụng các phương pháp hay nhất của ITIL, DevOps và SRE

Khi ai đó hỏi tổ chức của bạn thuộc loại “cửa hàng” nào, bạn có thể trả lời rằng đó là ITIL, DevOps hay SRE không? Một số người có thể, nhưng nếu bạn là một doanh nghiệp lớn, câu trả lời có thể là sự kết hợp của các mô hình hoạt…
Khủng hoảng tài chính có thể dạy chúng ta điều gì về Sre
18
hữu ích
9.2k xem

Khủng hoảng tài chính có thể dạy chúng ta điều gì về Sre

Trong bối cảnh của đại dịch, nền kinh tế toàn cầu đang bị ảnh hưởng. Mặc dù sự suy thoái này là cực đoan, nó không phải là không thể khắc phục được. Trên thực tế, sau khi trải qua những cuộc khủng hoảng kinh tế như Đại suy thoái…
Một ngày trong cuộc đời của một SRE
19
hữu ích
9.4k xem

Một ngày trong cuộc đời của một SRE

Gần đây tôi đã có cơ hội phỏng vấn Paul Greig , một SRE (kỹ sư độ tin cậy của trang web), người trước đây đã làm việc tại cả Atlassian và với các nhóm khác nhau "trong thế giới của các quỹ đầu cơ." Anh ấy sẽ phát biểu tại…
4 dấu hiệu cho thấy độ tin cậy của phần mềm nên là ưu tiên hàng đầu của bạn
7
hữu ích
6.2k xem

4 dấu hiệu cho thấy độ tin cậy của phần mềm nên là ưu tiên hàng đầu của bạn

Bạn biết những công ty thoát ra khỏi gói. Bạn mua sản phẩm của họ với phí vận chuyển cao, bạn đi trên xe của họ. Bạn đã thấy chúng phá vỡ toàn bộ ngành công nghiệp. Có vẻ như những gã khổng lồ như Amazon và Uber luôn tồn tại như…
Phương pháp khai thác các mẫu sử dụng ứng dụng
13
hữu ích
1.5k xem

Phương pháp khai thác các mẫu sử dụng ứng dụng

Giới thiệu Khái niệm giao dịch ứng dụng (còn được gọi là giao dịch kinh doanh hoặc giao dịch người dùng cuối) là trọng tâm của Quản lý hiệu suất ứng dụng. Nó là một chuỗi các hoạt động của người dùng và hệ thống được người dùng…
Áp dụng SLO tại Twitter
8
hữu ích
3.8k xem

Áp dụng SLO tại Twitter

Trước đây, chúng ta đã thấy SRE tại Twitter đã chuyển đổi hoạt động kỹ thuật của mình như thế nào để thúc đẩy sự sẵn sàng sản xuất trên quy mô lớn. Khái niệm về các mục tiêu cấp độ dịch vụ (SLO) và ngân sách lỗi là chìa khóa cho…
Dưới đây là những khác biệt quan trọng giữa SLI, SLO và SLA
17
hữu ích
7.2k xem

Dưới đây là những khác biệt quan trọng giữa SLI, SLO và SLA

Khi bắt tay vào hành trình SRE, việc giải mã tất cả các từ viết tắt có vẻ khó khăn. SLO so với SLA là gì? Sự khác biệt giữa SLI và SLO là gì? Trong bài đăng trên blog này, chúng tôi sẽ đề cập đến SLI, SLO và SLA có nghĩa là gì và…
Những hiểu biết sâu sắc về Kỹ thuật hỗn loạn và SRE với Yury Niño Roa
9
hữu ích
7.2k xem

Những hiểu biết sâu sắc về Kỹ thuật hỗn loạn và SRE với Yury Niño Roa

Blameless gần đây đã rất vui khi được phỏng vấn  Yury Niño Roa , Kỹ sư độ tin cậy của trang web, Kiến trúc sư giải pháp và Người ủng hộ kỹ thuật hỗn loạn tại  ADL Digital Labs . Cô ấy đã làm việc trong các vai trò khác…
Hướng dẫn triển khai SRE trong NOCs
15
hữu ích
5.6k xem

Hướng dẫn triển khai SRE trong NOCs

Các Trung tâm Điều hành Mạng , hoặc NOC, đóng vai trò là trung tâm giám sát và ứng phó sự cố. NOC thường là một vị trí thực tế trong một tổ chức. Các nhà điều hành NOC ngồi tại một bàn trung tâm với màn hình hiển thị dữ liệu dịch…
5 Lời khuyên để Kiểm soát Mệt mỏi Báo động
1
hữu ích
4.6k xem

5 Lời khuyên để Kiểm soát Mệt mỏi Báo động

Cảnh báo Mệt mỏi là gì, và Tại sao Tôi Nên Quan tâm? Mệt mỏi cảnh báo hay còn gọi là mệt mỏi do máy nhắn tin, là điều gì đó có thể làm giảm đáng kể khả năng ứng phó với sự cố của cả đội dày dạn nhất. Đây là hậu quả của việc nhận…
Hướng dẫn của kỹ sư để chuẩn bị cho ngày thứ sáu đen năm 2020
9
hữu ích
14k xem

Hướng dẫn của kỹ sư để chuẩn bị cho ngày thứ sáu đen năm 2020

Bạn có đi chơi cho Thứ Sáu Đen? Thứ Sáu Đen — tất cả chúng ta đều biết nó trông như thế nào. Hàng trăm người đổ xô đến các cửa hàng sau Lễ Tạ ơn, chen lấn để có được những ưu đãi tốt nhất. Nhưng với COVID-19, sự sắp xếp…
Cách chọn công cụ giám sát cho DevOps và SRE
5
hữu ích
11k xem

Cách chọn công cụ giám sát cho DevOps và SRE

Khi phát triển độ tin cậy hoặc triển khai các phương pháp DevOps linh hoạt, trọng tâm của việc ra quyết định của bạn là dữ liệu. Nếu không theo dõi cẩn thận các chỉ số chính như thời gian hoạt động, tải mạng và sử dụng tài nguyên,…

15 30 50 mỗi trang