Hướng dẫn hàm duplicate trong python
Các dữ liệu trùng trong Excel có thể gây ra rất nhiều rắc rối. Cho dù bạn nhập dữ liệu từ cơ sở dữ liệu, lấy từ đồng nghiệp hay tự đối chiếu, dữ liệu trùng lặp luôn có thể len lỏi vào. Và nếu dữ liệu bạn đang làm việc là rất lớn, thì việc tìm và loại bỏ những dữ liệu trùng lặp này trong Excel thực sự khó . Trong hướng dẫn này, tôi sẽ chỉ cho bạn cách tìm và xóa các dữ liệu trùng trong Excel. 1. Tìm và đánh dấu các dữ liệu trùng trong ExcelCác dữ liệu trùng trong Excel có thể có nhiều dạng, trong một cột hoặc nhiều cột. Cũng có thể có sự trùng lặp của toàn bộ hàng. Tìm và đánh dấu các dữ liệu trùng trong cột trong Excel Định dạng có điều kiện giúp dễ dàng đánh dấu các dữ liệu trùng trong Excel. Sau đây là các bước thực hiện:
Mẹo Nhanh: Hãy nhớ kiểm tra các khoảng trống ở đầu hoặc cuối. Ví dụ: “ John” và “John ” được coi là khác nhau vì cái sau có thêm một ký tự khoảng trắng trong đó. Một mẹo hay là sử dụng hàm TRIM để làm sạch dữ liệu của bạn. Tìm và đánh dấu các hàng trùng lặp trong Excel Tìm dữ liệu trùng lặp và tìm các dòng dữ liệu trùng lặp là 2 việc khác nhau. Hãy xem: Tìm các hàng trùng lặp phức tạp hơn một chút so với việc tìm các ô trùng lặp Sau đây là các bước thực hiện:
Bằng cách này, chúng tôi đã tạo một chuỗi duy nhất cho mỗi hàng. Nếu có các hàng trùng lặp trong tập dữ liệu này, thì các chuỗi này sẽ giống hệt nhau. Bây giờ chúng ta có các chuỗi kết hợp cho mỗi hàng, bạn có thể sử dụng định dạng có điều kiện để đánh dấu các chuỗi trùng lặp. Một chuỗi được đánh dấu ngụ ý rằng hàng có một dữ liệu trùng. Sau đây là các bước để đánh dấu các chuỗi trùng lặp:
Điều này sẽ làm nổi bật các giá trị trùng lặp trong cột E. Trong cách tiếp cận trên, chúng tôi chỉ đánh dấu các chuỗi mà chúng tôi đã tạo. Nhưng điều gì sẽ xảy ra nếu bạn muốn đánh dấu tất cả các hàng trùng lặp (thay vì đánh dấu các ô trong một cột duy nhất)? Sau đây là các bước để đánh dấu các hàng trùng lặp:
Công thức này sẽ đánh dấu tất cả các hàng có trùng lặp. 2. Loại bỏ các dữ liệu trùng trong ExcelTrong phần trên, chúng ta đã học cách tìm và đánh dấu các dữ liệu trùng trong excel. Trong phần này, tôi sẽ chỉ cho bạn cách loại bỏ những dữ liệu trùng này. Loại bỏ các dữ liệu trùng khỏi một cột trong Excel Nếu bạn có dữ liệu trong một cột và bạn muốn xóa tất cả các dữ liệu trùng lặp, hãy làm theo các bước sau:
Điều này sẽ xóa tất cả các giá trị trùng lặp khỏi cột và bạn sẽ chỉ có các giá trị duy nhất. THẬN TRỌNG: Điều này làm thay đổi tập dữ liệu của bạn bằng cách xóa các dữ liệu trùng. Đảm bảo rằng bạn có bản sao lưu của tập dữ liệu gốc. Nếu bạn muốn trích xuất các giá trị duy nhất tại một số vị trí khác, hãy sao chép tập dữ liệu này vào vị trí đó và sau đó sử dụng các bước nêu trên. Ngoài ra, bạn cũng có thể sử dụng Advanced Filter để trích xuất các giá trị duy nhất đến một số vị trí khác. Loại bỏ các dữ liệu trùng khỏi nhiều cột trong Excel Giả sử bạn có dữ liệu như hình dưới đây: Trong dữ liệu ở trên, hàng # 2 và # 16 có cùng dữ liệu chính xác cho Sales Rep, Region, and Amount, nhưng nhưng ngày khác nhau (giống trường hợp của hàng # 10 và # 13). Đây có thể là một lỗi nhập trong đó cùng một mục đã được ghi hai lần với các ngày khác nhau. |