programming python

Trăn nhân vật eof

Văn bản – một cái tên không còn xa lạ gì trong lập trình viên. Text mang nghĩa là bản văn, một tập hợp của nhiều câu, mỗi câu lại bao gồm nhiều từ, mỗi từ bao gồm nhiều ký tự. Tùy theo từng ngôn ngữ mà các ký tự có thể hiển thị khác nhau. Việc xử lý các dữ liệu dạng văn bản này luôn có trong hầu hết các ngôn ngữ lập trình, và nổi lên nhất là trong các ngôn ngữ thông dịch như Perl, Python, Ruby…

Tuy nhiên, trong một hệ thống Linux, để đơn giản hóa quá trình xử lý văn bản dữ liệu, các nhà phát triển đã tạo ra các công cụ cơ bản để xử lý văn bản dữ liệu trên tiêu chí một chương trình chỉ làm một công việc. . Và trên hết là các chương trình này đều không yêu cầu kỹ năng thiết lập chương trình nhưng vẫn có thể dễ dàng sử dụng được. Sau đây mình xin phép được trình bày về một số chương trình[lệnh] giúp cho việc xử lý dữ liệu văn bản được thuận tiện hơn trong hệ thống Linux

Lệnh “con mèo”

Là một trong những lệnh cơ bản nhất của hệ thống Linux. Lệnh này có thể được sử dụng để tạo, chèn, hiển thị và ghép nội dung của tệp

To create file used as after

$ mèo > đơn giản. txt thay thế cho mèo > để dữ liệu tự động được thêm vào tệp cuối

$ con mèo >> đơn giản. txt simple2. txt

Lệnh “wc”

wc có nghĩa là đếm từ, lệnh này đơn giản chỉ sử dụng để thống kê lượng dữ liệu có trong tệp
Cú pháp đơn giản nhất là wc filename VD

wc đơn giản. txt

3 15 70 đơn giản. txt

Giá trị thứ nhất là số dòng [line], giá trị thứ 2 là số từ [word], giá trị thứ 3 là số ký tự [character] và cuối cùng là tên tệp

Lệnh “grep”

Use to show the lines has an content section any VD đó

$ grep "dòng" đơn giản. txt

Đây là dòng đầu tiên line

Đây là đường thứ hai line

Đây là đường thứ ba line

Hoặc có thể sử dụng tùy chọn -c để đếm số lần xuất hiện thay vì trong VD hết

$ grep -c "dòng" simple.txt

Một số tùy chọn khác -i không phân biệt hoa thường -l chỉ hiển thị tên tệp chứa nội dung cần tìm -n kèm theo số thứ tự của dòng xuất hiện

Lệnh “đầu” và lệnh “đuôi”

Hai lệnh head và tail có cách sử dụng tương tự nhau, đều là lấy ra một phần văn bản của tệp. Chỉ khác là lệnh head lấy phần văn bản ở đầu tệp, còn tail lấy phần cuối của văn bản. VD. wc0 sẽ lấy ra 4 dòng đầu tiên của tên tệp wc1 sẽ lấy ra 8 dòng cuối của tên tệp
Ngoài ra, có thể sử dụng -c instead for -n để lấy dữ liệu tính theo ký tự thay vì tính theo dòng

Lệnh “sắp xếp”

Use to sort of lines data text in file VD

$ sắp xếp đơn giản. txt

Đây là dòng đầu tiên line

Đây là đường thứ hai line

Đây là đường thứ ba line

Ngoài ra, có thể sử dụng thêm các tùy chọn sau khi wc2 bỏ qua các giá trị lặp lại wc3 sắp xếp theo thứ tự giảm dần [mặc định sẽ tăng dần] wc4 không phân biệt hoa thường

Lời kết

Trên đây chỉ là một số lệnh cơ bản nhất được sử dụng để thao tác với văn bản dữ liệu trên Linux. Vẫn còn rất nhiều lệnh hữu ích khác như wc5, wc6, wc7… nhưng khả năng của mình có hạn nên mình sẽ tìm hiểu và bổ sung các lệnh này trong các bài viết tiếp theo. Xin cảm ơn mọi người đã theo dõi bài viết

Bài Viết Liên Quan

Toplist mới

Bài mới nhất

Chủ Đề