Nhập gấu trúc Python

pandas là gói Python cung cấp cấu trúc dữ liệu nhanh, linh hoạt và biểu cảm được thiết kế để làm việc với dữ liệu "quan hệ" hoặc "được gắn nhãn" một cách dễ dàng và trực quan. Nó nhằm mục đích trở thành khối xây dựng cấp cao cơ bản để thực hiện phân tích dữ liệu trong thế giới thực, thực tế bằng Python. Ngoài ra, nó có mục tiêu rộng lớn hơn là trở thành công cụ thao tác/phân tích dữ liệu nguồn mở mạnh mẽ và linh hoạt nhất hiện có trong bất kỳ ngôn ngữ nào. Nó đã và đang trên đường hướng tới mục tiêu này

Những đặc điểm chính

Đây chỉ là một vài trong số những điều mà gấu trúc làm tốt

  • Dễ dàng xử lý dữ liệu bị thiếu [được biểu thị bằng
    # conda
    conda install pandas
    
    1,
    # conda
    conda install pandas
    
    2 hoặc
    # conda
    conda install pandas
    
    3] ở dạng dấu phẩy động cũng như dữ liệu không phải dấu phẩy động
  • khả năng thay đổi kích thước. các cột có thể được chèn và xóa khỏi DataFrame và các đối tượng chiều cao hơn
  • Căn chỉnh dữ liệu tự động và rõ ràng. các đối tượng có thể được căn chỉnh rõ ràng theo một tập hợp các nhãn hoặc người dùng có thể chỉ cần bỏ qua các nhãn và để
    # conda
    conda install pandas
    
    4,
    # or PyPI
    pip install pandas
    
    0, v.v. tự động căn chỉnh dữ liệu cho bạn trong tính toán
  • Nhóm mạnh mẽ, linh hoạt theo chức năng để thực hiện các thao tác tách-áp dụng-kết hợp trên các tập dữ liệu, cho cả tổng hợp và chuyển đổi dữ liệu
  • Giúp dễ dàng chuyển đổi dữ liệu rời rạc, được lập chỉ mục khác nhau trong các cấu trúc dữ liệu Python và NumPy khác thành các đối tượng DataFrame
  • Cắt lát dựa trên nhãn thông minh, lập chỉ mục ưa thích và tập hợp con của các tập dữ liệu lớn
  • Hợp nhất và tham gia tập dữ liệu trực quan
  • Định hình lại linh hoạt và xoay vòng các tập dữ liệu
  • Ghi nhãn theo thứ bậc của các trục [có thể có nhiều nhãn trên mỗi lần đánh dấu]
  • Các công cụ IO mạnh mẽ để tải dữ liệu từ tệp phẳng [CSV và được phân tách], tệp Excel, cơ sở dữ liệu và lưu/tải dữ liệu từ định dạng HDF5 cực nhanh
  • Chức năng dành riêng cho chuỗi thời gian. tạo phạm vi ngày và chuyển đổi tần suất, thống kê cửa sổ di chuyển, dịch chuyển ngày và độ trễ

Lấy nó ở đâu

Mã nguồn hiện được lưu trữ trên GitHub tại. https. //github. com/gấu trúc-dev/gấu trúc

Trình cài đặt nhị phân cho phiên bản phát hành mới nhất hiện có tại Python Package Index [PyPI] và trên Conda

# conda
conda install pandas
# or PyPI
pip install pandas

phụ thuộc

Xem hướng dẫn cài đặt đầy đủ để biết các phiên bản được hỗ trợ tối thiểu của các phụ thuộc bắt buộc, khuyến nghị và tùy chọn

Cài đặt từ các nguồn

Để cài đặt gấu trúc từ nguồn, bạn cần Cython ngoài các phụ thuộc bình thường ở trên. Cython có thể được cài đặt từ PyPI

pip install cython

Trong thư mục

# or PyPI
pip install pandas
1 [chính là nơi bạn tìm thấy tệp này sau khi sao chép git repo], hãy thực thi

python setup.py install

hoặc để cài đặt trong chế độ phát triển

python -m pip install -e . --no-build-isolation --no-use-pep517

Nếu bạn có

# or PyPI
pip install pandas
2, bạn cũng có thể sử dụng
# or PyPI
pip install pandas
3 để chạy lệnh tương tự

Hay cách khác

python setup.py develop

Xem hướng dẫn đầy đủ để cài đặt từ nguồn

Giấy phép

BSD 3

Tài liệu

Tài liệu chính thức được lưu trữ trên PyData. tổ chức. https. //gấu trúc. pydata. org/pandas-docs/ổn định

Tiểu sử

Công việc về

# or PyPI
pip install pandas
1 bắt đầu tại AQR [một quỹ phòng hộ định lượng] vào năm 2008 và đã được phát triển tích cực kể từ đó

Tìm sự giúp đỡ

Đối với các câu hỏi về cách sử dụng, nơi tốt nhất để truy cập là StackOverflow. Hơn nữa, các câu hỏi và thảo luận chung cũng có thể diễn ra trong danh sách gửi thư pydata

Thảo luận và Phát triển

Hầu hết các cuộc thảo luận về phát triển diễn ra trên GitHub trong repo này. Hơn nữa, danh sách gửi thư pandas-dev cũng có thể được sử dụng cho các cuộc thảo luận chuyên ngành hoặc các vấn đề thiết kế và kênh Gitter có sẵn cho các câu hỏi liên quan đến phát triển nhanh

Đóng góp cho gấu trúc

Mọi đóng góp, báo cáo lỗi, sửa lỗi, cải tiến tài liệu, cải tiến và ý tưởng đều được hoan nghênh

Bạn có thể tìm thấy tổng quan chi tiết về cách đóng góp trong hướng dẫn đóng góp

Nếu bạn chỉ muốn bắt đầu làm việc với cơ sở mã pandas, hãy điều hướng đến tab "các vấn đề" của GitHub và bắt đầu xem qua các vấn đề thú vị. Có một số vấn đề được liệt kê trong Tài liệu và vấn đề đầu tiên tốt mà bạn có thể bắt đầu

Bạn cũng có thể phân loại các sự cố có thể bao gồm việc sao chép báo cáo lỗi hoặc yêu cầu thông tin quan trọng như số phiên bản hoặc hướng dẫn sao chép. Nếu bạn muốn bắt đầu xử lý sự cố, một cách dễ dàng để bắt đầu là đăng ký pandas trên CodeTriage

Hoặc có thể thông qua việc sử dụng gấu trúc, bạn có ý tưởng của riêng mình hoặc đang tìm kiếm thứ gì đó trong tài liệu và nghĩ rằng 'điều này có thể được cải thiện'. Bạn có thể làm một cái gì đó về nó

Vui lòng đặt câu hỏi trong danh sách gửi thư hoặc trên Gitter

Với tư cách là người đóng góp và người duy trì dự án này, bạn phải tuân thủ quy tắc ứng xử của gấu trúc. Thông tin thêm có thể được tìm thấy tại. Quy tắc ứng xử của cộng tác viên

Chủ Đề