IT <code> - Tag dataframe [Câu hỏi]

738
hữu ích
22trả lời
1.5m xem

Thêm cột mới vào DataFrame hiện có trong gấu trúc Python?

Tôi có DataFrame được lập chỉ mục sau với các cột và hàng không được đặt tên liên tục: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5…
116
hữu ích
2trả lời
188k xem

Làm thế nào để lưu một data.frame trong R?

Tôi đã tạo một data.frame trong R không lớn lắm, nhưng phải mất khá nhiều thời gian để xây dựng. Tôi có thể lưu nó dưới dạng một tệp mà tôi có thể mở lại trong R không?
705
hữu ích
15trả lời
1.4m xem

Chọn nhiều cột trong khung dữ liệu gấu trúc?

Tôi có dữ liệu trong các cột khác nhau nhưng tôi không biết cách trích xuất nó để lưu nó vào một biến khác. index a b c 1 2 3 4 2 3 4 5 Làm thế nào để chọn 'a', 'b'và lưu nó vào df1? Tôi đã…
126
hữu ích
5trả lời
134k xem

Gấu trúc Thay thế NaN bằng chuỗi trống / trống?

Tôi có một Dataframe như hình dưới đây: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Tôi muốn xóa các giá trị NaN bằng một chuỗi rỗng để nó trông giống như vậy: 1 2 3 0…
86
hữu ích
5trả lời
201k xem

Pandas: tổng các hàng DataFrame cho các cột đã cho?

Tôi có DataFrame sau: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 Tôi…
528
hữu ích
7trả lời
980k xem

Thay đổi kiểu dữ liệu của các cột trong Pandas?

Tôi muốn chuyển đổi một bảng, được biểu diễn dưới dạng một danh sách các danh sách, thành một DataFrame Pandas. Như một ví dụ cực kỳ đơn giản: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df =…
563
hữu ích
25trả lời
527k xem

Làm cách nào để thay đổi thứ tự các cột DataFrame?

Tôi có DataFrame( df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) Tôi thêm nhiều cột bằng cách gán: df['mean'] = df.mean(1) Làm cách nào tôi có thể di chuyển cột meanra phía…
411
hữu ích
10trả lời
424k xem

Làm thế nào để đối phó với SettingsWithCopyWarning trong Pandas?

Lý lịch Tôi vừa nâng cấp Pandas của tôi từ 0.11 lên 0.13.0rc1. Bây giờ, ứng dụng đang xuất hiện nhiều cảnh báo mới. Một trong số họ thích điều này: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying…
125
hữu ích
8trả lời
96k xem

Làm cách nào để hiển thị nội dung cột đầy đủ trong Spark Dataframe?

Tôi đang sử dụng spark-csv để tải dữ liệu vào DataFrame. Tôi muốn thực hiện một truy vấn đơn giản và hiển thị nội dung: val df = sqlContext.read.format("com.databricks.spark.csv").option("header",…
74
hữu ích
3trả lời
67k xem

Ghép nối một danh sách các dataframes gấu trúc với nhau?

Tôi có một danh sách các tệp dữ liệu Pandas mà tôi muốn kết hợp thành một khung dữ liệu Pandas. Tôi đang sử dụng Python 2.7.10 và Pandas 0.16.2 Tôi đã tạo danh sách các datafram từ: import pandas as pd dfs = [] sqlall…
74
hữu ích
4trả lời
19k xem

Sự mơ hồ trong định nghĩa Pandas Dataframe / Numpy Array?

Tôi đã rất bối rối về cách xác định các trục python và liệu chúng có tham chiếu đến các hàng hoặc cột của DataFrame không. Hãy xem xét mã dưới đây: >>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]],…
132
hữu ích
15trả lời
64k xem

Tách (nổ) nhập chuỗi chuỗi dữ liệu gấu trúc để phân tách các hàng?

Tôi có một pandas dataframecột trong đó một chuỗi các chuỗi văn bản chứa các giá trị được phân tách bằng dấu phẩy. Tôi muốn tách từng trường CSV và tạo một hàng mới cho mỗi mục nhập (giả sử rằng CSV sạch và chỉ cần được chia…
282
hữu ích
19trả lời
318k xem

Cách đếm các giá trị NaN trong một cột trong DataFrame của gấu trúc?

Tôi có dữ liệu, trong đó tôi muốn tìm số lượng NaN, để nếu nó nhỏ hơn ngưỡng nào đó, tôi sẽ bỏ cột này. Tôi đã xem, nhưng không thể tìm thấy bất kỳ chức năng nào cho việc này. có value_counts, nhưng nó sẽ chậm đối với tôi, bởi…
588
hữu ích
11trả lời
1.0m xem

Làm cách nào để có được số lượng hàng của khung dữ liệu Pandas?

Tôi đang cố gắng để có được số lượng hàng của dataframe df với Pandas và đây là mã của tôi. Cách 1: total_rows = df.count print total_rows +1 Cách 2: total_rows = df['First_columnn_label'].count print total_rows…
112
hữu ích
5trả lời
59k xem

Định hình lại khung dữ liệu ba cột thành ma trận (định dạng thời gian dài của Đức thành định dạng rộng)?

Tôi có một data.framecái trông như thế này. x a 1 x b 2 x c 3 y a 3 y b 3 y c 2 Tôi muốn điều này ở dạng ma trận để tôi có thể đưa nó vào sơ đồ nhiệt để tạo ra một cốt truyện. Kết quả sẽ trông giống như:…

15 30 50 mỗi trang