3

Ít nhất, đó là ước tính của tôi. Twitter không hỏi người dùng về giới tính của họ, vì vậy tôi đã viết một chương trình đoán dựa trên tên của họ. Trong số những người theo dõi tôi, tỷ lệ này thậm chí còn tệ hơn: 83% là nam giới.

Cách khắc phục tỷ lệ đầu tiên không phải là bí ẩn: Tôi nên chú ý và tìm kiếm thêm các chuyên gia phụ nữ tweet về sở thích của tôi và theo dõi họ.

Mặt khác, tỷ lệ thứ hai, tôi chỉ có thể ảnh hưởng, nhưng tôi cũng có ý định cải thiện nó. Mạng của tôi trên Twitter phải đại diện cho tương lai đa dạng của ngành công nghiệp phần mềm, chứ không phải hiện tại không công bằng.

Làm thế nào tôi đo được nó?

Tôi đặt ra để ước tính tỷ lệ giới tính của những người tôi theo dõi "bạn bè" của tôi trong biệt ngữ Twitter và thấy điều đó thật khó khăn. Phân tích Twitter dễ dàng cho tôi thấy điều ngược lại, ước tính tỷ lệ giới tính của những người theo dõi tôi:

Nhưng Twitter không cho tôi biết tỷ lệ bạn bè của tôi. Cái được đo cải thiện , vì vậy tôi đã tìm kiếm một dịch vụ sẽ đo số này cho tôi và tìm thấy FollowerWonk .

FollowerWonk đoán bạn bè của tôi là 71% đàn ông. Đây có phải là một dự đoán tốt? Để xác thực, tôi so sánh ước tính của FollowerWonk về những người theo dõi tôi với ước tính của Twitter:

Phân tích Twitter
  đàn ông đàn bà
Người theo dõi 83% 17%
Người theo dõiWonk
  đàn ông đàn bà
Người theo dõi 81% 19%
Bạn bè tôi theo dõi 72% 28%

Những người theo dõi của tôi xuất hiện 81 phần trăm nam ở đây, gần với số phân tích Twitter. Càng xa càng tốt. Nếu FollowerWonk và Twitter đồng ý về tỷ lệ giới tính của những người theo dõi tôi, điều đó cho thấy ước tính của FollowerWonk về những người tôi theo dõi (mà Twitter không phân tích) là khá tốt. Với nó, tôi có thể tạo thói quen đo tỷ lệ của mình và cải thiện nó.

Tuy nhiên, ở mức 30 đô la một tháng, việc kiểm tra tỷ lệ của tôi với FollowerWonk là một thói quen đắt giá. Dù sao tôi cũng không cần tất cả các tính năng của nó. Tôi chỉ có thể giải quyết vấn đề tỷ lệ giới tính một cách kinh tế?

Vì số lượng của FollowerWonk có vẻ hợp lý, tôi đã cố gắng tái tạo chúng. Sử dụng Python và trình bao bọc API Twitter của Philadelphians , tôi bắt đầu tải xuống hồ sơ của tất cả bạn bè và người theo dõi. Tôi ngay lập tức thấy rằng giới hạn tốc độ của Twitter là tồi tệ, vì vậy tôi chỉ lấy mẫu ngẫu nhiên một tập hợp con của người dùng.

Thông tin tương quan giới tính tốt nhất trong hồ sơ Twitter là trường "tên": Ví dụ: trường tên của @ gvanrossum là "Guido van Rossum" và tên đầu tiên "Guido" gợi ý rằng @gvanrossum là nam. Tôi quyết định sử dụng tên đầu tiên để ước tính tỷ lệ của tôi.

Tôi đã viết một kịch bản chuyển các phần của mỗi tên vào thư viện SexMachine để đoán giới tính. SexMachine có những nhược điểm có thể dự đoán được, như nhầm "Trung tâm thiền định Brooklyn" với một người phụ nữ tên là "Brooklyn", nhưng ước tính của nó cũng tốt như của FollowerWonk và Twitter:

  đàn ông đàn bà không xác định
Bạn bè tôi theo dõi 168 66 173
  72% 28%  
Người theo dõi 459 108 433
  81% 19%  

(Dựa trên tất cả 407 bạn bè và mẫu 1000 người theo dõi.)

Biết số của bạn

Ai được đại diện trong mạng của bạn trên Twitter? Bạn đang nói và nghe cùng một nhóm phân phối không công bằng, những người đã nói về phần mềm trong vài thập kỷ qua, hoặc mạng của bạn trông giống như ngành công nghiệp phần mềm của tương lai? Hãy biết số của chúng tôi và cải thiện chúng.

|