Làm cách nào để đếm tần suất trong từ?

Chẳng hạn, bạn có một danh sách dữ liệu trùng lặp, bây giờ bạn muốn đếm tần suất xuất hiện của từng giá trị trong danh sách cột này như ảnh chụp màn hình bên dưới, làm cách nào để đếm nhanh?

Đếm tần suất của một giá trị văn bản với các công thức

Trong Excel, tôi có thể giới thiệu một số công thức để giải quyết công việc này

1. Chọn một ô trống, ví dụ, D1, và nhập công thức này =SUM[IF[$A$1. $A$10=C1,1,0]] vào đó và nhấn đồng thời các phím Shift + Ctrl + Enter và kéo bộ điều khiển tự động điền lên các ô cần công thức này. Xem ảnh chụp màn hình.

Mẹo. Trong công thức mảng này, A1. A10 là danh sách dữ liệu bạn muốn đếm và C1 là giá trị bạn muốn đếm tần suất, bạn có thể thay đổi chúng khi cần

Ghi chú. Bạn cũng có thể sử dụng công thức này =COUNTIF[A1. A10,"AAA-1"] để đếm tần suất của một giá trị cụ thể. A1. A10 là dãy dữ liệu, còn AAA-1 là giá trị muốn đếm, bạn có thể thay đổi tùy ý và với công thức này, bạn chỉ cần nhấn phím Enter là ra kết quả.

Đếm tần số của một văn bản hoặc số hoặc ký tự với Kutools cho Excel

Nếu bạn muốn đếm tần suất của một giá trị trong một phạm vi hoặc một ô, bạn có thể thử sử dụng Kutools cho hàm Đếm số lượng của một từ của Excel

Kutools cho Excel, với hơn 300 chức năng tiện dụng, giúp công việc của bạn dễ dàng hơn.

Tải xuống miễn phí
miễn phí đầy đủ tính năng sau 30 ngày

Sau khi cài đặt miễn phí Kutools cho Excel, vui lòng thực hiện như bên dưới.

1. Chọn một ô mà bạn sẽ xuất kết quả đã đếm và nhấp vào Kutools > Trình trợ giúp công thức > Trình trợ giúp công thức. Xem ảnh chụp màn hình

2. Trong hộp thoại Trình trợ giúp công thức, chọn hộp kiểm Bộ lọc, sau đó nhập "count" vào hộp văn bản để liệt kê tất cả các công thức về cách đếm trong phần Chọn công thức, sau đó . Xem ảnh chụp màn hình.

3. Nhấp vào Ok, sau đó tần suất của giá trị đã được đếm hết

Mẹo

1. Với chức năng Đếm số lần một từ xuất hiện của Kutools cho Excel, bạn có thể đếm tần suất xuất hiện của một từ trong một ô

Tự làm Đếm tần số từ

[Hướng]
1. Dán văn bản đích vào hộp sau
2. Nhấp vào GỬI
3. Bạn sẽ nhận được một bảng đếm tần suất hiển thị tới từ thứ 1000 theo thứ tự giảm dần [phân biệt chữ hoa chữ thường]

> Nếu bạn cần một danh sách từ toàn diện hơn [có tùy chọn xuất sang Excel], hãy truy cập trang web Trình kiểm tra cấp độ từ

-----------------------
[c] 2003 Someya Yasumasa [Bản thử nghiệm. JavaScript]

Trang Mẹo về Microsoft Word & Trợ giúp về Microsoft Word này cung cấp phần bổ trợ mẫu Word "Mức sử dụng & tần suất của từ" để hỗ trợ việc tính toán và báo cáo mức sử dụng cũng như tần suất của từ trong tài liệu. Phần bổ trợ cung cấp giao diện người dùng thông qua biểu mẫu người dùng cho tất cả các tùy chọn xử lý và đầu ra. Phần bổ trợ có thể báo cáo

  • Tất cả các từ trong phạm vi văn bản chính, chú thích cuối trang, chú thích cuối trang và hộp văn bản trong tài liệu
  • tất cả các từ ngoại trừ các từ bị loại trừ do người dùng xác định hoặc
  • chỉ những từ do người dùng định nghĩa

Ghi chú. Phần bổ trợ [theo thiết kế] không đếm các từ có trong đầu trang, chân trang và khung văn bản của các hình được neo trong đầu trang hoặc chân trang

Phần bổ trợ này đã được sửa lỗi, thiết kế lại và nâng cấp đáng kể với việc phát hành phiên bản 2. 0. Các nâng cấp bao gồm

  • Tùy chọn để xử lý và bao gồm các từ trong cước chú, chú thích cuối và hộp văn bản
  • Tùy chọn bỏ qua trường hợp lập chỉ mục và đếm [i. e. , những từ như APPLE, Apple và apple được coi là cùng một từ và sẽ lập chỉ mục là "apple" với số lượng là 3]
  • Tùy chọn để xử lý và bao gồm các từ được sử dụng trong đánh số đoạn danh sách [e. g. , Phần 1. 1, Phụ lục I, v.v. ]
  • Khả năng xác định và lập chỉ mục các chữ viết tắt dưới dạng chữ viết tắt [e. g. , Ông. , Bà. vân vân. ]
  • Tùy chọn xuất kết quả sang tệp tài liệu Index AutoMark phù hợp
  • Xử lý các điều khiển nội dung và các trường biểu mẫu [bao gồm các hộp kiểm]
  • Khả năng tương thích với phiên bản 64-bit của Office

Giao diện người dùng bổ trợ [UI] với các tùy chọn mặc định sử dụng lần đầu được hiển thị nếu các hình minh họa sau

Các tùy chọn và cài đặt trong phần bổ trợ này là "dính. "  Điều này có nghĩa là bất kỳ thay đổi nào bạn thực hiện đối với tùy chọn mặc định đều được lưu dưới dạng cài đặt và tùy chọn mặc định "mới" khi bạn sử dụng lại phần bổ trợ

Sử dụng tab "Viết tắt" trên điều khiển nhiều trang, bạn có thể xem lại, xóa/sửa đổi các từ viết tắt mặc định được xác định trong phần bổ trợ hoặc thêm các từ viết tắt được xác định tùy chỉnh của riêng bạn. Với tính năng này, các từ viết tắt được xác định xuất hiện "cùng với" khoảng thời gian cuối của chúng trong báo cáo đầu ra. Bạn có thể đặt lại các từ viết tắt đã xác định thành các từ viết tắt mặc định của phần bổ trợ ban đầu hoặc các từ viết tắt được lưu lần cuối của bạn bằng cách sử dụng điều khiển nút lệnh "Đặt lại [các] danh sách"

Ba tùy chọn đầu ra được minh họa bên dưới


Đã thêm vào tài liệu đang hoạt động


tài liệu mới

Lập chỉ mục tài liệu AutoMark

Ghi chú. Tài liệu Index AutoMark có thể được chỉnh sửa sau đó lưu lại và sử dụng để tự động đánh chỉ mục cho các từ khi bạn cần tạo mục lục trong Word. Thấy. Cách tạo bảng chỉ mục như một chuyên gia với Microsoft Word

Ghi chú của nhà phát triển, mẹo và tuyên bố chung về khả năng có thể sai

Hình thức ban đầu của phần bổ trợ là một trong những dự án hoàn chỉnh đầu tiên tôi xuất bản trên trang web này. Word MVP Doug Robbins đã chia sẻ với tôi một số mã để đếm từ trong tài liệu và tôi chỉ cần thêm biểu mẫu người dùng để cung cấp giao diện người dùng

Qua nhiều năm và với phản hồi từ người dùng, tôi nhận ra rằng công việc của Doug và của tôi hơi thiếu trong các tài liệu phức tạp chứa nhiều thứ hơn là văn bản đơn giản

Tôi đã dành rất nhiều thời gian để cố gắng khắc phục các sự cố riêng lẻ cho người dùng, chỉ để phát hiện ra rằng sửa một thứ thường sẽ làm hỏng hai hoặc ba thứ khác

đếm từ

Khi làm việc với phiên bản 2. 0, tôi bắt đầu đùa giỡn với ý tưởng cố gắng bắt chước cách tính năng "Đếm từ" tích hợp sẵn của Word hoạt động trong quy trình của tôi. "Đếm từ" hoạt động như thế nào? . Tuy nhiên, nói chung, "Số từ" đếm bất kỳ văn bản nào được phân tách bằng bất kỳ "khoảng trắng" nào dưới dạng một từ riêng lẻ

Khoảng trắng cho mục đích đếm là bất cứ thứ gì trong văn bản nhằm ngăn cách các từ. Chúng bao gồm khoảng trắng, tab, đoạn văn, phần và có [mặc dù không thực sự màu trắng] Dấu gạch ngang En và Em

Đó là một khái niệm tương đối đơn giản. Ví dụ: văn bản [bao gồm cả dấu ngoặc kép]. "Jack và Jill đi lên đồi. " bao gồm bảy chuỗi văn bản được phân tách bằng sáu "khoảng trắng. "  Đối với văn bản này, Số từ trả về "Số từ. 7"

Thách thức đối với người mới làm quen với VBA là các thuật ngữ "Từ" và "Số đếm" vì chúng liên quan đến chế độ đối tượng Word. Để minh họa, hãy mở một tài liệu trống mới, sau đó thêm và chạy quy trình sau trong mô-đun dự án tài liệu

Sub DemoWordCount[]
'Code to demo how the Word object model "Words" and "Words.Count" properties _
'are radically different than Words "Word Count" feature.
Dim lngCount As Long, lngIndex As Long
  ActiveDocument.Range.Text = ""
  ActiveDocument.Range.Text = """Jack and Jill went up the hill."""
  lngCount = ActiveDocument.Words.Count
  MsgBox "Words: " & lngCount
  For lngIndex = 1 To lngCount
  If Asc[ActiveDocument.Words[lngIndex]] = 13 Then
    MsgBox "Word " & lngIndex & " that you can't even see," _
         & "is the end of document paragraph mark."
  Else
    MsgBox ActiveDocument.Words[lngIndex]
  End If
  Next lngIndex
lbl_Exit:
  Exit Sub
End Sub

Bạn nên chú ý rằng văn bản tài liệu kết quả tạo thành bảy từ giống nhau, nhưng số lượng VBA và khái niệm về một "từ" hoàn toàn khác. Những khác biệt này chỉ được kết hợp theo một mức độ lớn trong các tài liệu phức tạp hơn

Tính năng "Đếm từ" của Word có nhiệm vụ dễ dàng là đếm từ và trình bày đơn giản là một số. Là nhà phát triển bổ trợ, nhiệm vụ của tôi là xác định và liệt kê những từ được tính đó là gì. Để làm như vậy, tôi phải đưa ra một số lựa chọn liên quan đến cái gì được tính và cái gì không được tính và hiển thị dưới dạng từ hoặc bộ phận của từ

Hai vấn đề thú vị và phức tạp là sự hiện diện của thời gian ". " và các ký hiệu nhóm/trích dẫn [e. g. ,  ""[]{}[]] trong luồng văn bản

Dấu chấm/Từ viết tắt

Dấu chấm thường kết thúc câu. Trong ví dụ đơn giản với Jack và Jill, từ "đồi" phải được bổ trợ lập chỉ mục và liệt kê là "đồi" không có dấu chấm. Tuy nhiên, thời gian cũng chấm dứt chữ viết tắt. Nếu văn bản của chúng tôi được thay đổi thành "M. Jack và Mlle. Jill đi lên đồi. " sau đó là các chữ viết tắt "M. " và "Mlle. " nên và được bổ trợ lập chỉ mục và liệt kê với dấu chấm

Những sự khác biệt này có thể có trong phần bổ trợ mặc dù việc sử dụng các từ viết tắt và tên viết tắt được xác định. Bằng cách xác định "M. " và "Mlle. " theo cách này, thời gian kết thúc của họ được coi là một phần của từ trước

Tôi đã bao gồm một số từ viết tắt phổ biến làm mặc định trong phần bổ trợ. Là người dùng, bạn có thể thêm các từ viết tắt tùy chỉnh của riêng mình. Hãy nhớ rằng phần bổ trợ chỉ có thể cố gắng suy ra cách thích hợp để hiển thị một từ gặp phải. Nó không thể nghĩ. Ví dụ: nếu bạn quyết định xác định "pub. " dưới dạng viết tắt thì phần bổ trợ sẽ khá phù hợp để lập chỉ mục và hiển thị" quán rượu. " như trong "quán rượu IRS. 345" là "quán rượu. " với khoảng thời gian. Tuy nhiên, nếu cùng một tài liệu có nội dung "Joe đã nộp thuế và đến quán rượu. ", phần bổ trợ sẽ và cũng có nội dung tính phiên bản thứ hai của "pub. "  Nếu một anh chàng hay cô gái thông minh nào đó có đề xuất để cải thiện quy trình này, tôi sẵn sàng lắng nghe

Nhóm biểu tượng

Trừ khi chúng đứng một mình và được phân tách khỏi văn bản khác bằng khoảng trắng, các ký hiệu nhóm sẽ không được lập chỉ mục hoặc hiển thị. Trong "Chỉ một [1] lần ping, vui lòng. ," "1" được lập chỉ mục và hiển thị mà không có dấu ngoặc đơn mở/đóng. Có một trường hợp ngoại lệ đặc biệt. Trong trường hợp hậu tố được đặt trước dấu ngoặc đơn mở và đóng e. g. , "Cung cấp [những] người cho vay tất cả các tài liệu trường hợp. ", từ "lender[s]" được lập chỉ mục và hiển thị với dấu ngoặc đơn

Văn bản và trường ẩn

Nói chung, để có độ chính xác và khớp tốt hơn với "Đếm từ", bạn nên đảm bảo rằng "Hiển thị tất cả các dấu định dạng" và đặc biệt là "văn bản ẩn" nếu tắt. Ngoài ra, bạn nên đảm bảo rằng các trường đang hiển thị kết quả chứ không phải mã của chúng

  • Bạn có thể hiển thị/ẩn dấu định dạng bằng cách sử dụng CTRL+SHIFT+*, điều khiển Hiển thị/Ẩn dải băng/biểu tượng menu hoặc trong cài đặt tùy chọn Word
  • Bạn có thể chuyển đổi các trường giữa văn bản mã và kết quả bằng CTRL+a rồi ALT+F9

Nếu để hiển thị, phần bổ trợ sẽ lập chỉ mục và hiển thị bất kỳ văn bản mã trường hoặc ẩn nào trong tài liệu như minh họa bên dưới. Một số người dùng có thể thấy lợi ích trong hành vi này, vì vậy tôi để người dùng quyết định hiển thị hay không hiển thị loại văn bản này

Thay đổi tài liệu

Đối với tất cả các mục đích thực tế, phần bổ trợ giữ nguyên văn bản của tài liệu gốc của bạn. Hai trường hợp ngoại lệ là khi bạn chọn tùy chọn nối kết quả vào tài liệu gốc và khi tài liệu chứa khoảng trắng không liên quan giữa phần cuối của văn bản và phần cuối của tài liệu như minh họa bên dưới

Là một phần của quá trình xử lý, phần bổ trợ sẽ xóa mọi khoảng trắng không liên quan được tìm thấy ở cuối phạm vi xử lý

Ghi chú. Nếu những thay đổi được mô tả ở trên không phù hợp với nhu cầu của bạn, vui lòng tạo một bản sao từ tài liệu gốc của bạn. Sau đó, bạn có thể xử lý bản sao với những thay đổi được thực hiện đối với tài liệu gốc của bạn

Tốc độ

Có rất nhiều điều xảy ra đằng sau hậu trường khi sử dụng bổ trợ. Xử lý các tài liệu dài có thể mất nhiều thời gian. Xử lý các tài liệu rất dài có thể mất rất nhiều thời gian. Ví dụ: xử lý hợp đồng pháp lý dài 50 trang với PC tốc độ cao, tương đối hiệu quả của tôi mất khoảng 20 giây

Vì vậy, bạn không mất hy vọng và nghĩ rằng mọi thứ đã bị đình trệ hoặc thất bại, tôi đã gửi kèm một báo cáo tiến độ cập nhật trong quá trình xử lý


xử lý từ


Sắp xếp các từ đã xử lý

Quá trình không hoàn hảo

Tôi đã dành hàng chục giờ nếu không muốn nói là hơn một trăm giờ, xung quanh là những mẩu tóc và da đầu đẫm máu nhằm nỗ lực làm cho phần bổ trợ trở nên mạnh mẽ và hoạt động tốt nhất có thể

Tôi khá hài lòng với kết quả, nhưng tôi biết rằng nó không hoàn hảo. Một số người dùng chắc chắn sẽ tạo và cố gắng xử lý văn bản làm nổi bật lỗi hoặc tình trạng chưa được xử lý. Kinh nghiệm của tôi khi làm công việc phát triển là nếu thất bại thì thất bại thảm hại. Tôi khuyên bạn nên so sánh kết quả với "Số từ" của Word và nếu hai số đếm giống hệt nhau thì bạn có thể cảm thấy tự tin hợp lý với kết quả. Hãy nhớ rằng Word Count luôn tính danh sách văn bản đoạn văn [mà tôi nghĩ là ngu ngốc] và phần bổ trợ thì không trừ khi bạn chỉ định

Nếu bạn tìm thấy lỗi hoặc có đề xuất cải tiến, vui lòng cho tôi biết bằng cách sử dụng liên kết phản hồi trên trang web này

Bây giờ bổ trợ

Phiên bản 2. 4 được tạo bằng Word 2010. Nó hoàn toàn hoạt động với Word 2007/2010/2013. Bạn có thể bắt đầu báo cáo sử dụng từ bằng cách nhấp vào điều khiển "Xử lý/Báo cáo" trong nhóm "Sử dụng từ" của tab Bổ trợ ribbon

Một. định dạng chấm của phiên bản 2. 4. được bao gồm trong gói tải xuống dành cho người dùng Word 2003. Với phiên bản này, người dùng có thể bắt đầu báo cáo sử dụng từ bằng cách nhấp vào điều khiển "Báo cáo xử lý" trong menu tùy chỉnh "Sử dụng từ. "

Chủ Đề