pandas là gói Python cung cấp cấu trúc dữ liệu nhanh, linh hoạt và biểu cảm được thiết kế để làm việc với dữ liệu "quan hệ" hoặc "được gắn nhãn" một cách dễ dàng và trực quan. Nó nhằm mục đích trở thành khối xây dựng cấp cao cơ bản để thực hiện phân tích dữ liệu trong thế giới thực, thực tế bằng Python. Ngoài ra, nó có mục tiêu rộng lớn hơn là trở thành công cụ thao tác/phân tích dữ liệu nguồn mở mạnh mẽ và linh hoạt nhất hiện có trong bất kỳ ngôn ngữ nào. Nó đã và đang trên đường hướng tới mục tiêu này
Những đặc điểm chính
Đây chỉ là một vài trong số những điều mà gấu trúc làm tốt
- Dễ dàng xử lý dữ liệu bị thiếu [được biểu thị bằng
# conda conda install pandas
1,# conda conda install pandas
2 hoặc# conda conda install pandas
3] ở dạng dấu phẩy động cũng như dữ liệu không phải dấu phẩy động - khả năng thay đổi kích thước. các cột có thể được chèn và xóa khỏi DataFrame và các đối tượng chiều cao hơn
- Căn chỉnh dữ liệu tự động và rõ ràng. các đối tượng có thể được căn chỉnh rõ ràng theo một tập hợp các nhãn hoặc người dùng có thể chỉ cần bỏ qua các nhãn và để
# conda conda install pandas
4,# or PyPI pip install pandas
0, v.v. tự động căn chỉnh dữ liệu cho bạn trong tính toán - Nhóm mạnh mẽ, linh hoạt theo chức năng để thực hiện các thao tác tách-áp dụng-kết hợp trên các tập dữ liệu, cho cả tổng hợp và chuyển đổi dữ liệu
- Giúp dễ dàng chuyển đổi dữ liệu rời rạc, được lập chỉ mục khác nhau trong các cấu trúc dữ liệu Python và NumPy khác thành các đối tượng DataFrame
- Cắt lát dựa trên nhãn thông minh, lập chỉ mục ưa thích và tập hợp con của các tập dữ liệu lớn
- Hợp nhất và tham gia tập dữ liệu trực quan
- Định hình lại linh hoạt và xoay vòng các tập dữ liệu
- Ghi nhãn theo thứ bậc của các trục [có thể có nhiều nhãn trên mỗi lần đánh dấu]
- Các công cụ IO mạnh mẽ để tải dữ liệu từ tệp phẳng [CSV và được phân tách], tệp Excel, cơ sở dữ liệu và lưu/tải dữ liệu từ định dạng HDF5 cực nhanh
- Chức năng dành riêng cho chuỗi thời gian. tạo phạm vi ngày và chuyển đổi tần suất, thống kê cửa sổ di chuyển, dịch chuyển ngày và độ trễ
Lấy nó ở đâu
Mã nguồn hiện được lưu trữ trên GitHub tại. https. //github. com/gấu trúc-dev/gấu trúc
Trình cài đặt nhị phân cho phiên bản phát hành mới nhất hiện có tại Python Package Index [PyPI] và trên Conda
# conda conda install pandas
# or PyPI pip install pandas
phụ thuộc
Xem hướng dẫn cài đặt đầy đủ để biết các phiên bản được hỗ trợ tối thiểu của các phụ thuộc bắt buộc, khuyến nghị và tùy chọn
Cài đặt từ các nguồn
Để cài đặt gấu trúc từ nguồn, bạn cần Cython ngoài các phụ thuộc bình thường ở trên. Cython có thể được cài đặt từ PyPI
pip install cython
Trong thư mục
# or PyPI pip install pandas1 [chính là nơi bạn tìm thấy tệp này sau khi sao chép git repo], hãy thực thi
python setup.py install
hoặc để cài đặt trong chế độ phát triển
python -m pip install -e . --no-build-isolation --no-use-pep517
Nếu bạn có
# or PyPI pip install pandas2, bạn cũng có thể sử dụng
# or PyPI pip install pandas3 để chạy lệnh tương tự
Hay cách khác
python setup.py develop
Xem hướng dẫn đầy đủ để cài đặt từ nguồn
Giấy phép
BSD 3
Tài liệu
Tài liệu chính thức được lưu trữ trên PyData. tổ chức. https. //gấu trúc. pydata. org/pandas-docs/ổn định
Tiểu sử
Công việc về
# or PyPI pip install pandas1 bắt đầu tại AQR [một quỹ phòng hộ định lượng] vào năm 2008 và đã được phát triển tích cực kể từ đó
Tìm sự giúp đỡ
Đối với các câu hỏi về cách sử dụng, nơi tốt nhất để truy cập là StackOverflow. Hơn nữa, các câu hỏi và thảo luận chung cũng có thể diễn ra trong danh sách gửi thư pydata
Thảo luận và Phát triển
Hầu hết các cuộc thảo luận về phát triển diễn ra trên GitHub trong repo này. Hơn nữa, danh sách gửi thư pandas-dev cũng có thể được sử dụng cho các cuộc thảo luận chuyên ngành hoặc các vấn đề thiết kế và kênh Gitter có sẵn cho các câu hỏi liên quan đến phát triển nhanh
Đóng góp cho gấu trúc
Mọi đóng góp, báo cáo lỗi, sửa lỗi, cải tiến tài liệu, cải tiến và ý tưởng đều được hoan nghênh
Bạn có thể tìm thấy tổng quan chi tiết về cách đóng góp trong hướng dẫn đóng góp
Nếu bạn chỉ muốn bắt đầu làm việc với cơ sở mã pandas, hãy điều hướng đến tab "các vấn đề" của GitHub và bắt đầu xem qua các vấn đề thú vị. Có một số vấn đề được liệt kê trong Tài liệu và vấn đề đầu tiên tốt mà bạn có thể bắt đầu
Bạn cũng có thể phân loại các sự cố có thể bao gồm việc sao chép báo cáo lỗi hoặc yêu cầu thông tin quan trọng như số phiên bản hoặc hướng dẫn sao chép. Nếu bạn muốn bắt đầu xử lý sự cố, một cách dễ dàng để bắt đầu là đăng ký pandas trên CodeTriage
Hoặc có thể thông qua việc sử dụng gấu trúc, bạn có ý tưởng của riêng mình hoặc đang tìm kiếm thứ gì đó trong tài liệu và nghĩ rằng 'điều này có thể được cải thiện'. Bạn có thể làm một cái gì đó về nó
Vui lòng đặt câu hỏi trong danh sách gửi thư hoặc trên Gitter
Với tư cách là người đóng góp và người duy trì dự án này, bạn phải tuân thủ quy tắc ứng xử của gấu trúc. Thông tin thêm có thể được tìm thấy tại. Quy tắc ứng xử của cộng tác viên