Định dạng tệp CSV trong Python là gì?

CSV [Giá trị được phân tách bằng dấu phẩy] là định dạng tệp cơ bản cho dữ liệu dạng bảng. Hầu hết các chương trình tạo tệp CSV. Chúng cho phép bạn xử lý dữ liệu từ bảng tính và cơ sở dữ liệu. Ví dụ: dữ liệu dạng bảng có thể được xuất sang tệp CSV và được nhập vào bảng tính để phân tích, vẽ biểu đồ hoặc xuất bản kết quả khai thác dữ liệu

Các tệp này có hỗ trợ rộng rãi từ một số ngôn ngữ lập trình. Các tệp CSV có thể được truy cập và thao tác trực tiếp bằng ngôn ngữ nhập tệp văn bản và thao tác chuỗi

điều kiện tiên quyết

  • Đã cài đặt Python IDE
  • Có một số thông tin cơ bản về ngôn ngữ lập trình python

Mục lục

Viết tệp CSV

Python cung cấp mô-đun CSV tích hợp. Mô-đun này chứa hai lớp viết CSV

  • Sử dụng lớp
    2021, Student details
    1, carteblanche kin, computer science
    2, Marion koech, data science
    
    6
  • Sử dụng lớp
    2021, Student details
    1, carteblanche kin, computer science
    2, Marion koech, data science
    
    7

sử dụng csv. lớp nhà văn

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
8 ghi dữ liệu vào tệp CSV. Theo mặc định, dữ liệu người dùng được chuyển đổi thành một chuỗi được phân cách. Đối tượng tệp CSV sẽ không được nhận dạng nếu các trường được trích dẫn không bao gồm
2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
9

Để ghi vào tệp CSV, hãy sử dụng lớp nhà văn. Lớp nhà văn là một lớp con của lớp

import csv
csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
               [2, "Marion koech", "data science"]]
with open['protagonist.csv', 'w'] as file:
    writer = csv.writer[file]
    writer.writerows[csv_rowlist]
0. Lớp
import csv
csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
               [2, "Marion koech", "data science"]]
with open['protagonist.csv', 'w'] as file:
    writer = csv.writer[file]
    writer.writerows[csv_rowlist]
0 cung cấp một bộ tham số có thể được sử dụng để tùy chỉnh tệp CSV

  • import csv
    csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
                   [2, "Marion koech", "data science"]]
    with open['protagonist.csv', 'w'] as file:
        writer = csv.writer[file]
        writer.writerows[csv_rowlist]
    
    2. Kỹ thuật này viết một hàng. Kỹ thuật này có thể tạo ra một hàng trường
  • import csv
    csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
                   [2, "Marion koech", "data science"]]
    with open['protagonist.csv', 'w'] as file:
        writer = csv.writer[file]
        writer.writerows[csv_rowlist]
    
    3. Kỹ thuật này viết nhiều hàng cùng một lúc. Cái này dành cho danh sách hàng

Để minh họa việc sử dụng lớp

import csv
csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
               [2, "Marion koech", "data science"]]
with open['protagonist.csv', 'w'] as file:
    writer = csv.writer[file]
    writer.writerows[csv_rowlist]
2, hãy tạo một tệp CSV mẫu,
import csv
csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
               [2, "Marion koech", "data science"]]
with open['protagonist.csv', 'w'] as file:
    writer = csv.writer[file]
    writer.writerows[csv_rowlist]
5, như hình bên dưới

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
0

Đoạn mã trên sẽ xuất ra tệp sau-

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science

Để minh họa việc sử dụng lớp

import csv
csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
               [2, "Marion koech", "data science"]]
with open['protagonist.csv', 'w'] as file:
    writer = csv.writer[file]
    writer.writerows[csv_rowlist]
3, hãy tạo một tệp CSV mẫu,
import csv
csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
               [2, "Marion koech", "data science"]]
with open['protagonist.csv', 'w'] as file:
    writer = csv.writer[file]
    writer.writerows[csv_rowlist]
5 như hình bên dưới

import csv
csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
               [2, "Marion koech", "data science"]]
with open['protagonist.csv', 'w'] as file:
    writer = csv.writer[file]
    writer.writerows[csv_rowlist]

Đầu ra của chương trình giống như trong ví dụ

import csv
csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
               [2, "Marion koech", "data science"]]
with open['protagonist.csv', 'w'] as file:
    writer = csv.writer[file]
    writer.writerows[csv_rowlist]
2 ở trên

sử dụng csv. lớp DictWriter

Lớp này xây dựng một đối tượng viết từ cột đến từ điển. Lớp này hỗ trợ hai phương thức viết CSV. họ đang

  • import csv
    csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
                   [2, "Marion koech", "data science"]]
    with open['protagonist.csv', 'w'] as file:
        writer = csv.writer[file]
        writer.writerows[csv_rowlist]
    
    9. Tệp CSV đơn giản có tên trường bạn chọn xuất bản hàng đầu tiên

  • import csv
    csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
                   [2, "Marion koech", "data science"]]
    with open['protagonist.csv', 'w'] as file:
        writer = csv.writer[file]
        writer.writerows[csv_rowlist]
    
    3. Hàm
    2021, Student details
    1, carteblanche kin, computer science
    2, Marion koech, data science
    
    81 ghi tất cả các hàng chỉ với các giá trị

Đọc tệp CSV

Mô-đun CSV hoặc thư viện gấu trúc có thể đọc tệp CSV. Để có thể đọc tệp CSV, người dùng có thể sử dụng một trong các phương pháp bên dưới

sử dụng csv. người đọc[]

Đầu tiên, tệp CSV được mở bằng hàm

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
82 ở chế độ
2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
83 [chỉ định chế độ đọc khi mở tệp], sau đó đọc bằng phương pháp
2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
84 của mô-đun CSV

Từ khóa

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
85 đơn giản hóa việc xử lý ngoại lệ và kết thúc tệp CSV ngay lập tức

Sử dụng CSV. lớp DictReader[]

Tệp CSV được mở bằng cách sử dụng

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
82, sau đó đọc bằng cách sử dụng lớp
2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
87 của mô-đun CSV, lớp này hoạt động giống như trình đọc nhưng chuyển đổi dữ liệu CSV thành từ điển. Dòng đầu tiên của tệp chứa các khóa từ điển

Sử dụng gấu trúc. phương thức read_csv[]

Sử dụng các phương pháp thư viện gấu trúc để đọc tệp CSV rất đơn giản. Xem xét tệp CSV

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
88. Đây là file dùng để minh họa một trong các phương pháp

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
8

Đầu ra

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
7

Từ đoạn mã trên,

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
89 được sử dụng để nhập mô-đun pandas,
2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
70 được sử dụng để đọc tệp
2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
88 và
2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
72 được sử dụng để xuất tệp csv đã đọc

Đọc từ một hàng cụ thể

Ở đây chúng tôi sẽ tạo một tệp CSV có nhiều hàng và cột để minh họa cách đọc từ một hàng cụ thể

Tạo tệp CSV bằng cách nhập dữ liệu bên dưới vào notepad của bạn và lưu dưới dạng

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
73. Tệp sẽ được sử dụng để hiển thị cách thao tác với tệp CSV

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
3

Để đọc một hàng cụ thể trong tệp CSV, chúng tôi sử dụng hàm

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
74 từ thư viện của Panda. Ví dụ dưới đây minh họa cách đọc từ một hàng cụ thể

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
5

Đoạn mã trên sẽ xuất ra thông tin sau

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
6

Đọc một cột chính xác

Phương thức

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
75 của thư viện gấu trúc có thể đọc thêm các cột được chỉ định. Điều này được thực hiện bằng cách sử dụng chức năng lập chỉ mục đa trục của
2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
76. Đầu tiên, hãy xem xét một chương trình ví dụ. Ví dụ này sẽ hiển thị các cột
2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
77 và
2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
78 cho tất cả các hàng

Chúng tôi sẽ sử dụng tệp

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
73 từ ví dụ trước

import csv
csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
               [2, "Marion koech", "data science"]]
with open['protagonist.csv', 'w'] as file:
    writer = csv.writer[file]
    writer.writerows[csv_rowlist]
2

Đầu ra

import csv
csv_rowlist = [["2021", "Student details"], [1, "carteblanche kin", "computer science"],
               [2, "Marion koech", "data science"]]
with open['protagonist.csv', 'w'] as file:
    writer = csv.writer[file]
    writer.writerows[csv_rowlist]
3

Thao tác tệp CSV

Vì bạn không thể chỉnh sửa tệp CSV trong khi đọc từ tệp đó nên bạn phải tạo một tệp mới và ghi vào tệp đó

Chúng tôi sẽ sử dụng tệp

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
73 từ ví dụ trước

Từ tệp

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
73 ở trên, dữ liệu được viết bằng chữ hoa. Để trình bày cách chỉnh sửa và lưu tệp CSV, chúng tôi sẽ thay đổi chữ hoa trong tệp của chúng tôi thành chữ thường

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
0

Đoạn mã trên tạo một tệp CSV mới với tất cả các chữ cái trong đó được đổi thành chữ thường

Làm việc với các tệp CSV lớn trong Python

Khi xử lý dữ liệu CSV, thường đọc dữ liệu đó bằng pandas trước khi trộn và phân tích dữ liệu đó. Tuy nhiên, việc đọc các tệp lớn trực tiếp vào gấu trúc có thể khó [hoặc không thể] trên máy tiêu dùng do hạn chế về bộ nhớ

Mặc dù việc tải dữ liệu từ tệp CSV vào cơ sở dữ liệu rất đơn giản, nhưng có thể xảy ra trường hợp bạn không có quyền truy cập hoặc không muốn thiết lập máy chủ cơ sở dữ liệu. Tuy nhiên, nếu bạn cần xem dữ liệu trong các tệp lớn này trong một thời gian ngắn, thì đây là một phương pháp để thực hiện việc đó bằng Python và gấu trúc

Đây là một phương pháp để xử lý lớn. tệp csv. Bộ dữ liệu chúng tôi sẽ sử dụng là bộ dữ liệu giới tính_voice_dataset

Sử dụng gấu trúc. read_csv

Các tệp lớn có thể được xử lý bằng cách đọc chúng thành các phần có kích thước có thể quản lý được, xử lý chúng trước khi đọc phần tiếp theo. Tùy chọn kích thước khối xác định số lượng dòng. Phương thức này trả về một iterator. Để xử lý, một phần của tệp được đọc tại một thời điểm

Để đọc tập dữ liệu không có khối, hãy sử dụng mã bên dưới

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
1

Chuyển đổi nhiều tệp JSON thành tệp CSV

Một tệp JSON chứa các đối tượng và cấu trúc dữ liệu cơ bản trong Ký hiệu đối tượng JavaScript [JSON]. Trường hợp sử dụng phổ biến nhất là gửi dữ liệu giữa ứng dụng internet và máy chủ

Tệp CSV được tạo bằng cách nối, hợp nhất hoặc nối một số tệp JSON [ít nhất một cột phải giống nhau trong mỗi tệp] và lưu kết quả dưới dạng khung dữ liệu được làm phẳng. Mẫu sau đây sẽ giúp bạn hiểu toàn bộ quy trình của nhiệm vụ

chương trình ví dụ

Chúng tôi sẽ nhập hai tệp JSON và xuất CSV. Các tệp JSON được sử dụng là

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
32

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
2

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
33

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
3

Thực hiện theo các bước dưới đây để có thể chuyển đổi

  • Tải tệp JSON bằng khung dữ liệu gấu trúc
  • Hợp nhất các khung dữ liệu
  • Tạo tệp CSV từ dữ liệu được nối

Kết quả được hiển thị trong mã

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
4

Đầu ra

Tạo khung dữ liệu bằng tệp CSV

Giống như tệp excel, tệp CSV bao gồm các giá trị được phân tách bằng dấu phẩy. Pandas là mô-đun khoa học dữ liệu cốt lõi của Python. Khi đánh giá dữ liệu, chúng tôi thường xử lý các tập dữ liệu lớn ở định dạng CSV. Tạo khung dữ liệu gấu trúc từ tệp CSV thật dễ dàng

Tải xuống tệp CSV ví dụ tại đây

Một khung dữ liệu có thể được tạo bởi

  • phương pháp
    2021, Student details
    1, carteblanche kin, computer science
    2, Marion koech, data science
    
    34
  • phương pháp
    2021, Student details
    1, carteblanche kin, computer science
    2, Marion koech, data science
    
    35
  • mô-đun
    2021, Student details
    1, carteblanche kin, computer science
    2, Marion koech, data science
    
    36

Hãy xem một ví dụ sử dụng phương thức

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
35

2021, Student details
1, carteblanche kin, computer science
2, Marion koech, data science
5

Phần kết luận

Cảm ơn bạn đã đọc đến cuối. Hướng dẫn này dạy chúng tôi cách làm việc với các tệp CSV bằng Python. Chúng tôi đã học cách viết và đọc tệp CSV, làm việc với tệp CSV lớn, chuyển đổi nhiều tệp JSON thành tệp CSV và cuối cùng, tạo khung dữ liệu bằng tệp CSV

Định dạng CSV trong Python là gì?

Tệp CSV [tệp Giá trị được phân tách bằng dấu phẩy] là một loại tệp văn bản thuần sử dụng cấu trúc cụ thể để sắp xếp dữ liệu dạng bảng . Bởi vì nó là một tệp văn bản thuần túy, nên nó chỉ có thể chứa dữ liệu văn bản thực—nói cách khác, các ký tự ASCII hoặc Unicode có thể in được. Cấu trúc của tệp CSV được đặt theo tên của nó.

Định dạng tệp CSV là gì?

Tệp CSV [các giá trị được phân tách bằng dấu phẩy] là tệp văn bản có định dạng cụ thể cho phép lưu dữ liệu ở định dạng có cấu trúc bảng.

Làm cách nào để tạo tệp CSV bằng Python?

Ví dụ - .
nhập csv
với open['Python. csv', 'w'] dưới dạng csvfile
tên trường = ['first_name', 'last_name', 'Rank']
nhà văn = csv. DictWriter[csvfile, tên trường=tên trường]
nhà văn. đầu ghi[]
nhà văn. writerow[{'Xếp hạng'. 'B', 'first_name'. 'Parker', 'last_name'. 'Brian'}]
nhà văn. writerow[{'Xếp hạng'. 'A', 'first_name'. 'Thợ rèn',

Python đọc tệp CSV như thế nào?

Đọc tệp CSV bằng Python .
Sử dụng Thư viện CSV. nhập csv với open[". /wq. csv", 'r'] dưới dạng tệp. csvreader = csv. trình đọc [tệp] cho hàng trong csvreader. print[row] Ở đây chúng tôi đang nhập thư viện csv để sử dụng. .
Sử dụng thư viện Pandas. nhập gấu trúc dưới dạng dữ liệu pd = pd. read_csv["bwq. csv"] dữ liệu

Chủ Đề