Định dạng tệp CSV trong Python là gì?
CSV (Giá trị được phân tách bằng dấu phẩy) là định dạng tệp cơ bản cho dữ liệu dạng bảng. Hầu hết các chương trình tạo tệp CSV. Chúng cho phép bạn xử lý dữ liệu từ bảng tính và cơ sở dữ liệu. Ví dụ: dữ liệu dạng bảng có thể được xuất sang tệp CSV và được nhập vào bảng tính để phân tích, vẽ biểu đồ hoặc xuất bản kết quả khai thác dữ liệu Show
Các tệp này có hỗ trợ rộng rãi từ một số ngôn ngữ lập trình. Các tệp CSV có thể được truy cập và thao tác trực tiếp bằng ngôn ngữ nhập tệp văn bản và thao tác chuỗi điều kiện tiên quyết
Mục lụcViết tệp CSVPython cung cấp mô-đun CSV tích hợp. Mô-đun này chứa hai lớp viết CSV
sử dụng csv. lớp nhà văn 8 ghi dữ liệu vào tệp CSV. Theo mặc định, dữ liệu người dùng được chuyển đổi thành một chuỗi được phân cách. Đối tượng tệp CSV sẽ không được nhận dạng nếu các trường được trích dẫn không bao gồm 9Để ghi vào tệp CSV, hãy sử dụng lớp nhà văn. Lớp nhà văn là một lớp con của lớp 0. Lớp 0 cung cấp một bộ tham số có thể được sử dụng để tùy chỉnh tệp CSV
Để minh họa việc sử dụng lớp 2, hãy tạo một tệp CSV mẫu, 5, như hình bên dưới 0Đoạn mã trên sẽ xuất ra tệp sau-
Để minh họa việc sử dụng lớp 3, hãy tạo một tệp CSV mẫu, 5 như hình bên dưới
Đầu ra của chương trình giống như trong ví dụ 2 ở trênsử dụng csv. lớp DictWriterLớp này xây dựng một đối tượng viết từ cột đến từ điển. Lớp này hỗ trợ hai phương thức viết CSV. họ đang
Đọc tệp CSVMô-đun CSV hoặc thư viện gấu trúc có thể đọc tệp CSV. Để có thể đọc tệp CSV, người dùng có thể sử dụng một trong các phương pháp bên dưới sử dụng csv. người đọc()Đầu tiên, tệp CSV được mở bằng hàm 82 ở chế độ 83 (chỉ định chế độ đọc khi mở tệp), sau đó đọc bằng phương pháp 84 của mô-đun CSV
Sử dụng CSV. lớp DictReader()Tệp CSV được mở bằng cách sử dụng 82, sau đó đọc bằng cách sử dụng lớp 87 của mô-đun CSV, lớp này hoạt động giống như trình đọc nhưng chuyển đổi dữ liệu CSV thành từ điển. Dòng đầu tiên của tệp chứa các khóa từ điểnSử dụng gấu trúc. phương thức read_csv()Sử dụng các phương pháp thư viện gấu trúc để đọc tệp CSV rất đơn giản. Xem xét tệp CSV 88. Đây là file dùng để minh họa một trong các phương pháp 8Đầu ra 7Từ đoạn mã trên, 89 được sử dụng để nhập mô-đun pandas, 70 được sử dụng để đọc tệp 88 và 72 được sử dụng để xuất tệp csv đã đọcĐọc từ một hàng cụ thểỞ đây chúng tôi sẽ tạo một tệp CSV có nhiều hàng và cột để minh họa cách đọc từ một hàng cụ thể Tạo tệp CSV bằng cách nhập dữ liệu bên dưới vào notepad của bạn và lưu dưới dạng 73. Tệp sẽ được sử dụng để hiển thị cách thao tác với tệp CSV 3Để đọc một hàng cụ thể trong tệp CSV, chúng tôi sử dụng hàm 74 từ thư viện của Panda. Ví dụ dưới đây minh họa cách đọc từ một hàng cụ thể 5Đoạn mã trên sẽ xuất ra thông tin sau 6Đọc một cột chính xácPhương thức 75 của thư viện gấu trúc có thể đọc thêm các cột được chỉ định. Điều này được thực hiện bằng cách sử dụng chức năng lập chỉ mục đa trục của 76. Đầu tiên, hãy xem xét một chương trình ví dụ. Ví dụ này sẽ hiển thị các cột 77 và 78 cho tất cả các hàng
2Đầu ra 3Thao tác tệp CSVVì bạn không thể chỉnh sửa tệp CSV trong khi đọc từ tệp đó nên bạn phải tạo một tệp mới và ghi vào tệp đó
Từ tệp 73 ở trên, dữ liệu được viết bằng chữ hoa. Để trình bày cách chỉnh sửa và lưu tệp CSV, chúng tôi sẽ thay đổi chữ hoa trong tệp của chúng tôi thành chữ thường 0Đoạn mã trên tạo một tệp CSV mới với tất cả các chữ cái trong đó được đổi thành chữ thường Làm việc với các tệp CSV lớn trong PythonKhi xử lý dữ liệu CSV, thường đọc dữ liệu đó bằng pandas trước khi trộn và phân tích dữ liệu đó. Tuy nhiên, việc đọc các tệp lớn trực tiếp vào gấu trúc có thể khó (hoặc không thể) trên máy tiêu dùng do hạn chế về bộ nhớ Mặc dù việc tải dữ liệu từ tệp CSV vào cơ sở dữ liệu rất đơn giản, nhưng có thể xảy ra trường hợp bạn không có quyền truy cập hoặc không muốn thiết lập máy chủ cơ sở dữ liệu. Tuy nhiên, nếu bạn cần xem dữ liệu trong các tệp lớn này trong một thời gian ngắn, thì đây là một phương pháp để thực hiện việc đó bằng Python và gấu trúc Đây là một phương pháp để xử lý lớn. tệp csv. Bộ dữ liệu chúng tôi sẽ sử dụng là bộ dữ liệu giới tính_voice_dataset Sử dụng gấu trúc. read_csvCác tệp lớn có thể được xử lý bằng cách đọc chúng thành các phần có kích thước có thể quản lý được, xử lý chúng trước khi đọc phần tiếp theo. Tùy chọn kích thước khối xác định số lượng dòng. Phương thức này trả về một iterator. Để xử lý, một phần của tệp được đọc tại một thời điểm Để đọc tập dữ liệu không có khối, hãy sử dụng mã bên dưới 1Chuyển đổi nhiều tệp JSON thành tệp CSVMột tệp JSON chứa các đối tượng và cấu trúc dữ liệu cơ bản trong Ký hiệu đối tượng JavaScript (JSON). Trường hợp sử dụng phổ biến nhất là gửi dữ liệu giữa ứng dụng internet và máy chủ Tệp CSV được tạo bằng cách nối, hợp nhất hoặc nối một số tệp JSON (ít nhất một cột phải giống nhau trong mỗi tệp) và lưu kết quả dưới dạng khung dữ liệu được làm phẳng. Mẫu sau đây sẽ giúp bạn hiểu toàn bộ quy trình của nhiệm vụ chương trình ví dụ Chúng tôi sẽ nhập hai tệp JSON và xuất CSV. Các tệp JSON được sử dụng là 32 2 33 3Thực hiện theo các bước dưới đây để có thể chuyển đổi
Kết quả được hiển thị trong mã 4Đầu ra Tạo khung dữ liệu bằng tệp CSVGiống như tệp excel, tệp CSV bao gồm các giá trị được phân tách bằng dấu phẩy. Pandas là mô-đun khoa học dữ liệu cốt lõi của Python. Khi đánh giá dữ liệu, chúng tôi thường xử lý các tập dữ liệu lớn ở định dạng CSV. Tạo khung dữ liệu gấu trúc từ tệp CSV thật dễ dàng Tải xuống tệp CSV ví dụ tại đây Một khung dữ liệu có thể được tạo bởi
Hãy xem một ví dụ sử dụng phương thức 35 5Phần kết luậnCảm ơn bạn đã đọc đến cuối. Hướng dẫn này dạy chúng tôi cách làm việc với các tệp CSV bằng Python. Chúng tôi đã học cách viết và đọc tệp CSV, làm việc với tệp CSV lớn, chuyển đổi nhiều tệp JSON thành tệp CSV và cuối cùng, tạo khung dữ liệu bằng tệp CSV Định dạng CSV trong Python là gì?Tệp CSV (tệp Giá trị được phân tách bằng dấu phẩy) là một loại tệp văn bản thuần sử dụng cấu trúc cụ thể để sắp xếp dữ liệu dạng bảng . Bởi vì nó là một tệp văn bản thuần túy, nên nó chỉ có thể chứa dữ liệu văn bản thực—nói cách khác, các ký tự ASCII hoặc Unicode có thể in được. Cấu trúc của tệp CSV được đặt theo tên của nó.
Định dạng tệp CSV là gì?Tệp CSV (các giá trị được phân tách bằng dấu phẩy) là tệp văn bản có định dạng cụ thể cho phép lưu dữ liệu ở định dạng có cấu trúc bảng.
Làm cách nào để tạo tệp CSV bằng Python?Ví dụ - . nhập csv với open('Python. csv', 'w') dưới dạng csvfile tên trường = ['first_name', 'last_name', 'Rank'] nhà văn = csv. DictWriter(csvfile, tên trường=tên trường) nhà văn. đầu ghi() nhà văn. writerow({'Xếp hạng'. 'B', 'first_name'. 'Parker', 'last_name'. 'Brian'}) nhà văn. writerow({'Xếp hạng'. 'A', 'first_name'. 'Thợ rèn', Python đọc tệp CSV như thế nào?Đọc tệp CSV bằng Python . Sử dụng Thư viện CSV. nhập csv với open(". /wq. csv", 'r') dưới dạng tệp. csvreader = csv. trình đọc (tệp) cho hàng trong csvreader. print(row) Ở đây chúng tôi đang nhập thư viện csv để sử dụng. . Sử dụng thư viện Pandas. nhập gấu trúc dưới dạng dữ liệu pd = pd. read_csv("bwq. csv") dữ liệu |