Làm cách nào để sắp xếp dữ liệu trong một bảng trong R?

Hướng dẫn này mô tả cách sắp xếp lại (i. e. , sắp xếp) hàng, trong bảng dữ liệu của bạn, theo giá trị của một hoặc nhiều cột (i. e. , biến)

Bạn sẽ học cách dễ dàng

  • Sắp xếp các hàng của khung dữ liệu theo thứ tự tăng dần (từ thấp đến cao) bằng hàm R sắp xếp() [gói dplyr]
  • Sắp xếp các hàng theo thứ tự giảm dần (từ cao xuống thấp) sử dụng sort() kết hợp với hàm desc() [gói dplyr]

Làm cách nào để sắp xếp dữ liệu trong một bảng trong R?



nội dung

gói yêu cầu

Tải các gói

library(tidyverse)
2, bao gồm
my_data <- as_tibble(iris)
my_data
0

library(tidyverse)

tập dữ liệu demo

Chúng tôi sẽ sử dụng bộ dữ liệu mống mắt tích hợp R, mà chúng tôi bắt đầu bằng cách chuyển đổi thành khung dữ liệu tibble (tbl_df) để phân tích dữ liệu dễ dàng hơn

my_data <- as_tibble(iris)
my_data
## # A tibble: 150 x 5
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
##                                   
## 1          5.1         3.5          1.4         0.2 setosa 
## 2          4.9         3            1.4         0.2 setosa 
## 3          4.7         3.2          1.3         0.2 setosa 
## 4          4.6         3.1          1.5         0.2 setosa 
## 5          5           3.6          1.4         0.2 setosa 
## 6          5.4         3.9          1.7         0.4 setosa 
## # .. with 144 more rows

Sắp xếp hàng

Hàm dplyr

my_data <- as_tibble(iris)
my_data
1 có thể được sử dụng để sắp xếp lại (hoặc sắp xếp) các hàng theo một hoặc nhiều biến

  • Sắp xếp lại các hàng theo Sepal. Chiều dài theo thứ tự tăng dần
my_data %>% arrange(Sepal.Length)
## # A tibble: 150 x 5
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
##                                   
## 1          4.3         3            1.1         0.1 setosa 
## 2          4.4         2.9          1.4         0.2 setosa 
## 3          4.4         3            1.3         0.2 setosa 
## 4          4.4         3.2          1.3         0.2 setosa 
## 5          4.5         2.3          1.3         0.3 setosa 
## 6          4.6         3.1          1.5         0.2 setosa 
## # .. with 144 more rows
  • Sắp xếp lại các hàng theo Sepal. Chiều dài theo thứ tự giảm dần. Sử dụng hàm desc()
my_data %>% arrange(desc(Sepal.Length))
## # A tibble: 150 x 5
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species  
##                                     
## 1          7.9         3.8          6.4         2   virginica
## 2          7.7         3.8          6.7         2.2 virginica
## 3          7.7         2.6          6.9         2.3 virginica
## 4          7.7         2.8          6.7         2   virginica
## 5          7.7         3            6.1         2.3 virginica
## 6          7.6         3            6.6         2.1 virginica
## # .. with 144 more rows

Thay vì sử dụng hàm desc(), bạn có thể thêm dấu trừ vào trước biến sắp xếp để biểu thị thứ tự giảm dần, như sau

arrange(my_data, -Sepal.Length)
  • Sắp xếp lại các hàng theo nhiều biến. lá đài. Chiều dài và Sepal. chiều rộng
library(tidyverse)
0

Nếu dữ liệu chứa các giá trị bị thiếu, chúng sẽ luôn xuất hiện ở cuối

Tóm lược

Trong bài viết này, chúng tôi mô tả cách sắp xếp các hàng của khung dữ liệu bằng hàm

my_data <- as_tibble(iris)
my_data
1 [gói dplyr]



Đề xuất cho bạn

Phần này chứa các tài nguyên khoa học dữ liệu và phát triển bản thân tốt nhất để giúp bạn trên con đường của mình

Coursera - Các khóa học và chuyên môn trực tuyến

Khoa học dữ liệu

  • Món ăn. Học máy. Nắm vững các nguyên tắc cơ bản của Stanford
  • chuyên ngành. Khoa học dữ liệu của Đại học Johns Hopkins
  • chuyên ngành. Python cho mọi người của Đại học Michigan
  • khóa học. Xây dựng kỹ năng cho công việc hàng đầu trong bất kỳ ngành nào của Coursera
  • chuyên ngành. Nắm vững các nguyên tắc cơ bản về học máy của Đại học Washington
  • chuyên ngành. Thống kê với R của Đại học Duke
  • chuyên ngành. Phát triển phần mềm trong R của Đại học Johns Hopkins
  • chuyên ngành. Khoa học dữ liệu bộ gen của Đại học Johns Hopkins

Các khóa học phổ biến ra mắt vào năm 2020

  • Tự động hóa CNTT của Google với Python của Google
  • AI cho Y học bằng cách học sâu. ai
  • Dịch tễ học trong Thực hành Y tế Công cộng của Đại học Johns Hopkins
  • Nguyên tắc cơ bản về AWS của Amazon Web Services

Các khóa học thịnh hành

  • Khoa học về Hạnh phúc của Đại học Yale
  • Google IT Support Professional của Google
  • Python cho mọi người của Đại học Michigan
  • Chứng chỉ Chuyên gia Khoa học Dữ liệu IBM của IBM
  • Nền tảng kinh doanh của Đại học Pennsylvania
  • Giới thiệu về Tâm lý học của Đại học Yale
  • Kỹ năng Excel cho doanh nghiệp của Đại học Macquarie
  • Sơ cứu tâm lý của Đại học Johns Hopkins
  • Thiết kế đồ họa bởi Cal Arts

FBA Amazon

Máy bán hàng tuyệt vời

  • Đào tạo miễn phí - Cách xây dựng doanh nghiệp Amazon FBA 7 con số mà bạn có thể điều hành 100% tại nhà và xây dựng cuộc sống mơ ước của mình. bởi ASM

Sách - Khoa học dữ liệu

sách của chúng tôi

  • Hướng dẫn thực hành về phân tích cụm trong R by A. Kassambara (Datanovia)
  • Hướng dẫn thực hành về các phương thức thành phần chính trong R của A. Kassambara (Datanovia)
  • Cơ bản về máy học. Hướng dẫn thực hành trong R by A. Kassambara (Datanovia)
  • R Graphics Essentials for Great Data Visualization của A. Kassambara (Datanovia)
  • GGPlot2 Essentials để trực quan hóa dữ liệu tuyệt vời trong R by A. Kassambara (Datanovia)
  • Phân tích và trực quan hóa mạng trong R by A. Kassambara (Datanovia)
  • Thống kê thực tế trong R để so sánh các nhóm. Biến số theo A. Kassambara (Datanovia)
  • Yếu tố cần thiết về độ tin cậy giữa các xếp hạng. Hướng dẫn thực hành trong R by A. Kassambara (Datanovia)

Người khác

  • R cho Khoa học dữ liệu. Dữ liệu Nhập, Ngăn nắp, Chuyển đổi, Trực quan hóa và Mô hình của Hadley Wickham & Garrett Grolemund
  • Học máy thực hành với Scikit-Learn, Keras và TensorFlow. Khái niệm, Công cụ và Kỹ thuật để Xây dựng Hệ thống Thông minh của Aurelien Géron
  • Thống kê thực tế cho các nhà khoa học dữ liệu. 50 khái niệm cơ bản của Peter Bruce & Andrew Bruce
  • Lập trình thực hành với R. Viết các hàm và mô phỏng của riêng bạn bởi Garrett Grolemund và Hadley Wickham
  • Giới thiệu về học thống kê. với Ứng dụng trong R của Gareth James và cộng sự
  • Học sâu với R của François Chollet & J. J. Allaire
  • Học sâu với Python của François Chollet

Xác định và xóa dữ liệu trùng lặp trong R (Bài học trước)

(Bài học tiếp theo) Đổi tên cột khung dữ liệu trong R

Quay lại Thao tác dữ liệu trong R

Miễn bình luận

Đưa ra nhận xét

Bạn muốn gửi một vấn đề với R? . Cách bao gồm các ví dụ tập lệnh R có thể tái tạo trong Datanovia Nhận xét