Nhập Excel vào RStudio

Một cách để tải các tệp Excel trực tiếp vào R là sử dụng gói XLConnect. Đối với ví dụ này, bạn sẽ cần “happy. tập tin xlsx”. Kiểm tra xem tệp có trong thư mục dự án của bạn không. Nếu không, bạn có thể tải xuống tại đây

Cài đặt gói và thử sử dụng hàm readWorksheetFromFile() để tải dữ liệu và gán nó cho một đối tượng có tên là df

# Run this only once, to download and install the package:
install.packages("XLConnect")
# Load the package:
library(XLConnect)
# Read the 'Happy to help' Excel file into 'df':
df <- readWorksheetFromFile("happy.xlsx",
                            sheet = 1)

R không hoạt động với một bảng tính (SPSS hoặc Excel). Thay vào đó, nó có thể giữ nhiều đối tượng trong bộ nhớ. Đối tượng df là một data.frame; . Để xem mô tả về đối tượng, hãy xem tab Môi trường ở trên cùng bên phải của Rstudio và nhấp vào mũi tên bên cạnh df

Nhập Excel vào RStudio

Như bạn có thể thấy, ở khung trên cùng bên phải Môi trường, tệp của bạn hiện được liệt kê dưới dạng tập dữ liệu trong môi trường RStudio của bạn

Bạn có thể tạo một bản sao nhanh chóng của tập dữ liệu này bằng cách gán đối tượng df cho một đối tượng mới. Bằng cách này, bạn có thể chỉnh sửa một cái và giữ nguyên cái kia. Gán đối tượng df cho một đối tượng mới có tên là happy

happy <- df

Bạn cũng có thể xem nội dung của df bằng cách nhấp vào đối tượng trong bảng Môi trường hoặc chạy lệnh

happy <- df
0

Vì vậy, không có tệp nào có tên Prod. xls trong thư mục làm việc của bạn. Bạn xem thư mục nào là thư mục làm việc hiện tại bằng lệnh

getwd()

Bạn có thể xem các tập tin trong thư mục đó với

dir()

Nếu tệp bạn muốn nằm trong thư mục làm việc hiện tại, có thể bạn đã đánh máy sai tên. Nó có thể là sản phẩm. xlsx? . Ví dụ: để tải một tệp có tên Prod. xlsx trên máy tính để bàn của tôi, tôi sẽ chạy

readxl::read_excel("C:/Users/fjcc/Desktop/Prod.xlsx")

Đó là đường dẫn Windows. Trên Linux hoặc MacOS, nó sẽ trông khá khác

Thực tế là việc chạy readxl::read_excel() không đưa ra lỗi "không thể tìm thấy chức năng" nhưng chạy đơn giản read_excel() lại đưa ra lỗi cho thấy rằng bạn đã không tải gói readxl thành công với library(readxl). Có thông báo lỗi nào khi bạn chạy nó không?

Trước đây, chúng tôi đã mô tả các yếu tố cần thiết của lập trình R và một số phương pháp hay nhất để chuẩn bị dữ liệu của bạn. Chúng tôi cũng cung cấp các hướng dẫn bắt đầu nhanh để đọc và ghi các tệp txt và csv bằng các hàm cơ sở R cũng như sử dụng gói R hiện đại nhất có tên là readr, nhanh hơn (X10) so với các hàm cơ sở R


Trong bài viết này, bạn sẽ tìm hiểu cách đọc dữ liệu từ định dạng tệp Excel xls hoặc xlsx sang R. Điều này có thể được thực hiện hoặc bằng cách

  • sao chép dữ liệu từ excel
  • sử dụng gói readxl
  • hoặc sử dụng gói xlsx


Nhập Excel vào RStudio

nhiệm vụ sơ bộ

  1. Khởi chạy RStudio như được mô tả tại đây. Chạy RStudio và thiết lập thư mục làm việc của bạn

  2. Chuẩn bị dữ liệu của bạn như được mô tả ở đây. Các phương pháp hay nhất để chuẩn bị dữ liệu của bạn

Sao chép dữ liệu từ Excel và nhập vào R

Trên hệ thống Windows

  1. Mở tệp Excel chứa dữ liệu của bạn. chọn và sao chép dữ liệu (ctrl + c)

  2. Nhập mã R bên dưới để nhập dữ liệu đã sao chép từ khay nhớ tạm vào R và lưu trữ dữ liệu trong khung dữ liệu (my_data)

my_data <- read.table(file = "clipboard", 
                      sep = "\t", header=TRUE)

Trên hệ thống Mac OSX

  1. Chọn và sao chép dữ liệu (Cmd + c)

  2. Sử dụng hàm pipe(pbpaste) để nhập dữ liệu bạn đã sao chép (với Cmd + c)

my_data <- read.table(pipe("pbpaste"), sep="\t", header = TRUE)

Nhập tệp Excel vào R bằng gói readxl

Gói readxl do Hadley Wickham phát triển có thể được sử dụng để dễ dàng nhập các tệp Excel (xls. xlsx) vào R mà không có bất kỳ phụ thuộc bên ngoài nào

Cài đặt và tải gói readxl

  • Cài đặt
________số 8_______
  • Trọng tải
library("readxl")

Sử dụng gói readxl

Gói readxl đi kèm với chức năng read_excel() để đọc các tệp xls và xlsx

  1. Đọc cả tệp xls và xlsx
# Loading
library("readxl")
# xls files
my_data <- read_excel("my_file.xls")
# xlsx files
my_data <- read_excel("my_file.xlsx")

Đoạn mã R ở trên, giả định rằng tệp “my_file. xls” và “my_file. xlsx” nằm trong thư mục làm việc hiện tại của bạn. Để biết thư mục làm việc hiện tại của bạn, hãy nhập hàm getwd() trong bảng điều khiển R

  • Cũng có thể chọn tệp một cách tương tác bằng cách sử dụng tệp chức năng. select(), mà tôi khuyên dùng nếu bạn là người mới bắt đầu lập trình R
my_data <- read_excel(file.choose())

Nếu bạn sử dụng mã R ở trên trong RStudio, bạn sẽ được yêu cầu chọn tệp

  1. Chỉ định trang tính với một số hoặc tên
# Specify sheet by its name
my_data <- read_excel("my_file.xlsx", sheet = "data")
  
# Specify sheet by its index
my_data <- read_excel("my_file.xlsx", sheet = 2)
  1. Trường hợp thiếu giá trị. NA (không có sẵn). Nếu NA được đại diện bởi một cái gì đó (ví dụ. “—”) ngoài các ô trống, hãy đặt đối số na
my_data <- read_excel("my_file.xlsx", na = "---")

Nhập tệp Excel bằng gói xlsx

Gói xlsx, một giải pháp dựa trên java, là một trong những gói R mạnh mẽ để đọc, ghi và định dạng tệp Excel

Cài đặt và tải gói xlsx

  • Cài đặt
install.packages("xlsx")
  • Trọng tải
library("xlsx")

Sử dụng gói xlsx

Có hai hàm chính trong gói xlsx để đọc cả tệp xls và xlsx Excel. đọc. xlsx() và đọc. xlsx2() [nhanh hơn trên các tệp lớn so với đọc. hàm xlsx]

Bạn có thể nhập Excel vào RStudio không?

Nhập tệp Excel vào R bằng gói readxl . Để sử dụng thư viện readxl, trước tiên bạn cần cài đặt nó bằng cách sử dụng cài đặt. gói ('readxl'). Use read_excel() function from readxl package to read or import an excel file (xlsx or xls) as R DataFrame. In order to use readxl library, you need to first install it by using install. packages('readxl') .

Làm cách nào để nhập CSV vào RStudio?

Trong RStudio, nhấp vào tab Không gian làm việc rồi nhấp vào “Nhập tập dữ liệu” -> “Từ tệp văn bản” . Một trình duyệt tập tin sẽ mở ra, xác định vị trí. csv và nhấp vào Mở.