IT <code> - Tag site reliability [Bài viết]

SRE2AUX: Bộ điều khiển máy bay trở thành SRE đầu tiên như thế nào
9
hữu ích
3.9k xem

SRE2AUX: Bộ điều khiển máy bay trở thành SRE đầu tiên như thế nào

Thời kỳ đầu, có những người điều khiển chuyến bay. Đây là một giống chó kỳ lạ. Trong những ngày đầu của  Chương trình Không gian có người lái của Hoa Kỳ , hầu hết các hộ gia đình Hoa Kỳ, không phân biệt tầng lớp hay chủng…
Vì vậy, bạn muốn một công cụ SRE. Bạn xây dựng, mua hay mã nguồn mở?
19
hữu ích
6.1k xem

Vì vậy, bạn muốn một công cụ SRE. Bạn xây dựng, mua hay mã nguồn mở?

Khi nhu cầu về độ tin cậy của tổ chức bạn tăng lên, bạn có thể cân nhắc đầu tư vào các công cụ SRE. Công cụ có thể làm cho nhiều quy trình hiệu quả hơn, nhất quán và có thể lặp lại. Khi bạn quyết định đầu tư vào công cụ, một trong…
Hướng dẫn của kỹ sư để chuẩn bị cho ngày thứ sáu đen năm 2020
9
hữu ích
14k xem

Hướng dẫn của kỹ sư để chuẩn bị cho ngày thứ sáu đen năm 2020

Bạn có đi chơi cho Thứ Sáu Đen? Thứ Sáu Đen — tất cả chúng ta đều biết nó trông như thế nào. Hàng trăm người đổ xô đến các cửa hàng sau Lễ Tạ ơn, chen lấn để có được những ưu đãi tốt nhất. Nhưng với COVID-19, sự sắp xếp…
Nhận Mua từ Cấp C cho Ngân sách Lỗi và SLO
10
hữu ích
3.8k xem

Nhận Mua từ Cấp C cho Ngân sách Lỗi và SLO

Giờ đây, bạn đã triển khai postmortems , tự động và có cấu trúc tốt. Bạn đang tạo báo cáo và dữ liệu tự động dựa trên tất cả các sự cố của mình. Hai cấp quản lý đã đồng ý với các nỗ lực mua vào SRE của bạn. Đó là một thành tựu to…
Tầm quan trọng của kỹ thuật độ tin cậy
16
hữu ích
6.0k xem

Tầm quan trọng của kỹ thuật độ tin cậy

Nếu bạn đã dành bất kỳ thời gian nào trong giới công nghệ gần đây, có ba chữ cái bạn chắc chắn đã nghe: SRE. Kỹ thuật độ tin cậy của trang web là phong trào xác định trong công nghệ ngày nay. Những gã khổng lồ như Google và Amazon…
Cách phân loại sự cố
7
hữu ích
6.1k xem

Cách phân loại sự cố

Phân loại Sự cố là gì? Phân loại sự cố là một cách tổ chức sự cố được tiêu chuẩn hóa với các danh mục đã được thiết lập. Sự cố có thể bao gồm sự cố do lỗi trong mã, lỗi phần cứng, thâm hụt tài nguyên - bất cứ điều gì làm gián…
Hướng dẫn triển khai SRE trong NOCs
15
hữu ích
5.6k xem

Hướng dẫn triển khai SRE trong NOCs

Các Trung tâm Điều hành Mạng , hoặc NOC, đóng vai trò là trung tâm giám sát và ứng phó sự cố. NOC thường là một vị trí thực tế trong một tổ chức. Các nhà điều hành NOC ngồi tại một bàn trung tâm với màn hình hiển thị dữ liệu dịch…
Làm thế nào để có một sự chuyển đổi qua đám mây mà bạn có thể tự hào
18
hữu ích
2.7k xem

Làm thế nào để có một sự chuyển đổi qua đám mây mà bạn có thể tự hào

Trong thời đại tin cậy, nhiều dịch vụ đang chuyển từ các máy chủ nội bộ sang đám mây. Mô hình đám mây cho phép dịch vụ của bạn tận dụng lợi ích của các nhà cung cấp dịch vụ lưu trữ lớn như AWS, Microsoft Azure hoặc Google Cloud.…
Chọn công cụ SRE phù hợp
17
hữu ích
6.3k xem

Chọn công cụ SRE phù hợp

Việc thực hiện các thực hành và văn hóa SRE có thể là một thách thức. May mắn thay, có nhiều công cụ cho từng khía cạnh của SRE: giám sát, SLO và lập ngân sách lỗi, quản lý sự cố, hồi cứu sự cố, cảnh báo, kỹ thuật hỗn loạn, v.v.…
Kỹ sư, ngừng tích trữ các chỉ số của bạn
3
hữu ích
7.6k xem

Kỹ sư, ngừng tích trữ các chỉ số của bạn

Các chỉ số là tấm vé vàng để biết điều gì đang xảy ra với hệ thống của bạn… hay mọi người đều nghĩ. Nhưng có thể có quá nhiều điều tốt. Các chỉ số của bạn có thực sự làm bạn ủng hộ không Họ có cho phép bạn biết khách hàng thực sự…
Đây là cách sử dụng các phương pháp hay nhất của ITIL, DevOps và SRE
7
hữu ích
2.9k xem

Đây là cách sử dụng các phương pháp hay nhất của ITIL, DevOps và SRE

Khi ai đó hỏi tổ chức của bạn thuộc loại “cửa hàng” nào, bạn có thể trả lời rằng đó là ITIL, DevOps hay SRE không? Một số người có thể, nhưng nếu bạn là một doanh nghiệp lớn, câu trả lời có thể là sự kết hợp của các mô hình hoạt…
Các cách ít được biết đến để sử dụng ngân sách lỗi của bạn tốt hơn
3
hữu ích
6.5k xem

Các cách ít được biết đến để sử dụng ngân sách lỗi của bạn tốt hơn

Một trong những công cụ SRE cơ bản và linh hoạt nhất là SLO , hoặc mục tiêu mức dịch vụ. SLO là ngưỡng được đặt cho các chỉ số độ tin cậy chính. Khi sự cố đẩy chỉ số vượt quá ngưỡng, phản hồi sẽ khởi chạy để ngăn chặn thiệt hại…
Hành trình đáng tin cậy của Twitter
1
hữu ích
6.5k xem

Hành trình đáng tin cậy của Twitter

Nhóm SRE của Twitter là một trong những nhóm tiên tiến nhất trong ngành, quản lý các dịch vụ nắm bắt nhịp đập của thế giới mỗi ngày và xuyên suốt những khoảnh khắc kết nối tất cả chúng ta. Chúng tôi đã có vinh dự được phỏng vấn…
4 dấu hiệu cho thấy độ tin cậy của phần mềm nên là ưu tiên hàng đầu của bạn
7
hữu ích
6.2k xem

4 dấu hiệu cho thấy độ tin cậy của phần mềm nên là ưu tiên hàng đầu của bạn

Bạn biết những công ty thoát ra khỏi gói. Bạn mua sản phẩm của họ với phí vận chuyển cao, bạn đi trên xe của họ. Bạn đã thấy chúng phá vỡ toàn bộ ngành công nghiệp. Có vẻ như những gã khổng lồ như Amazon và Uber luôn tồn tại như…
Cách xây dựng nhóm SRE của bạn
7
hữu ích
5.6k xem

Cách xây dựng nhóm SRE của bạn

Khi bạn thực hiện các thực hành và văn hóa SRE tại tổ chức của mình, bạn sẽ nhận ra rằng mọi người đều có một phần để chơi. Từ các kỹ sư thiết lập SLO đến ban quản lý đề cao đức tính vô tội vạ cho đến các nhóm tiếp thị thực hiện…

15 30 50 mỗi trang