Đọc tệp HTML trong C# và thay thế chuỗi

Tôi muốn tạo một ứng dụng có thể đọc tệp html. Sau đó, tôi muốn tìm kiếm các chuỗi mong muốn và lấy dữ liệu thành các phần tử chỉnh sửa văn bản bằng C#. Bạn có thể vui lòng trợ giúp với bất kỳ ví dụ hoặc hướng dẫn nào không?

Trân trọng

Những gì tôi đã thử

Máy khách WebClient = WebClient mới[];
Chuỗi htmlCode = máy khách. DownloadString["D. /Công việc 2017/Trang web. html"];

Thêm giải pháp của bạn ở đây

 B   I   U   S  small BIG code var     &  link [^] encode untab case indent outdent

Xem trước 0

thành viên hiện có

hoặc tham gia với chúng tôi

Tải xuống, Bình chọn, Nhận xét, Xuất bản

Email của bạn

Email này đang được sử dụng. Bạn có cần mật khẩu của bạn?

Mật khẩu tùy chọn

Khi trả lời một câu hỏi xin vui lòng

  1. Đọc kỹ câu hỏi
  2. Hiểu rằng tiếng Anh không phải là ngôn ngữ đầu tiên của mọi người, vì vậy hãy khoan dung với lỗi chính tả và ngữ pháp
  3. Nếu một câu hỏi được diễn đạt kém thì hãy yêu cầu làm rõ, bỏ qua nó hoặc chỉnh sửa câu hỏi và khắc phục sự cố. Xúc phạm không được chào đón
  4. Đừng bảo ai đó đọc hướng dẫn. Rất có thể họ có và không nhận được. Đưa ra câu trả lời hoặc chuyển sang câu hỏi tiếp theo
Hãy làm việc để giúp các nhà phát triển, không làm họ cảm thấy ngu ngốc


Nội dung này, cùng với bất kỳ tệp và mã nguồn liên quan nào, được cấp phép theo Giấy phép Mở Dự án Code [CPOL]

Nếu bạn là một lập trình viên C# đang tìm kiếm một cách hiệu quả để làm việc với các tệp HTML, thì bài viết này là dành cho bạn. Chúng tôi sẽ giải thích những điều cơ bản về cách C# hoạt động với các tệp HTML, từ việc tạo chúng từ đầu đến đọc và chỉnh sửa các tài liệu hiện có. Trong bài viết này, chúng ta sẽ tìm hiểu cách tạo, đọc và chỉnh sửa tệp HTML trong C#

HTML [Hyper Text Markup Language] là ngôn ngữ được sử dụng để tạo các trang web và trang web. Mặt khác, C# là ngôn ngữ lập trình hướng đối tượng được sử dụng để xây dựng các ứng dụng. Tệp HTML chứa các thẻ đánh dấu được sử dụng để định dạng cấu trúc của trang web để hiển thị trong trình duyệt. Chúng ta có thể dễ dàng thao tác các tệp HTML theo chương trình trong. ứng dụng NET. Trong bài viết này, chúng ta sẽ khám phá cách sử dụng C# để đọc, viết và chỉnh sửa tệp HTML. Chúng tôi sẽ xem xét các cách để phân tích cú pháp mã HTML cho các thành phần cụ thể và tạo các thành phần mới từ đầu hoặc chỉnh sửa các thành phần hiện có. Hãy bắt đầu nào

Các chủ đề sau đây sẽ được đề cập trong bài viết này

API C# để tạo, đọc và chỉnh sửa tệp HTML

Để tạo, đọc và chỉnh sửa các tệp HTML, chúng tôi sẽ sử dụng Aspose. HTML cho. NET API. Đây là API xử lý HTML nâng cao cho phép tạo, sửa đổi và trích xuất dữ liệu từ tài liệu HTML. Nó cũng cho phép chuyển đổi và hiển thị các tài liệu HTML mà không cần bất kỳ phần mềm bên ngoài nào

Lớp HTMLDocument của API đại diện cho một tài liệu HTML hoặc trang HTML mà chúng ta thấy trong trình duyệt. Phương thức CreateElement[] của lớp này tạo phần tử HTML được chỉ định bởi tagName. Phương thức CreateTextNode[string] tạo một nút Văn bản với chuỗi đã chỉ định. Phương thức AppendChild[] của giao diện Node thêm một nút vào cuối danh sách con của nút cha được chỉ định. Phương pháp lưu tệp đầu ra. Bạn cũng có thể đọc thêm về trong tài liệu

Vui lòng tải xuống DLL của API hoặc cài đặt nó bằng NuGet

PM> Install-Package Aspose.Html

Tạo một tệp HTML trong C#

Chúng ta có thể dễ dàng tạo một tệp HTML bằng cách làm theo các bước dưới đây

  1. Đầu tiên, tạo một thể hiện của lớp HTMLDocument
  2. Tiếp theo, gọi phương thức CreateElement[] để tạo các thành phần như tiêu đề, đoạn văn, văn bản, v.v.
  3. Sau đó, gọi phương thức CreateTextNode[] để thêm nút văn bản
  4. Tiếp theo, nối nút đã tạo vào phần tử bằng phương thức AppendChild[]
  5. Sau đó, đính kèm các thành phần vào nội dung tài liệu bằng HTMLDocument. Cơ thể người. phương thức AppendChild[]
  6. Lặp lại các bước trên để thêm các phần tử khác
  7. Cuối cùng, lưu tài liệu HTML bằng phương thức Save[]. Nó lấy đường dẫn tệp đầu ra làm đối số

Mẫu mã sau đây cho biết cách tạo tệp HTML bằng C#

Tạo tệp HTML trong C#

Đọc tệp HTML trong C#

Trong phần trước, chúng ta đã tạo một tệp HTML. Bây giờ, chúng tôi sẽ tải tệp và đọc nội dung của nó bằng cách làm theo các bước dưới đây

  1. Tải tệp HTML hiện có bằng lớp HTMLDocument
  2. Đọc và hiển thị nội dung của HTMLDocument. Yếu tố tài liệu. HTML bên ngoài

Mẫu mã sau đây cho biết cách đọc tệp HTML bằng C#

This is Sample Heading!

This is first paragraph.

  1. First list item.
  2. Second list item.

Chỉnh sửa tệp HTML trong C#

Chúng tôi cũng có thể cập nhật nội dung của tệp HTML. Chúng tôi có thể thêm nhiều nút/phần tử hơn bằng cách làm theo các bước được đề cập ở trên. Tuy nhiên, chúng tôi có thể sửa đổi các ghi chú/yếu tố hiện có bằng cách làm theo các bước dưới đây

  1. Tải tệp HTML hiện có bằng lớp HTMLDocument
  2. Tiếp theo, gọi phương thức CreateTextNode[] để thêm nút văn bản
  3. Tiếp theo, lấy phần tử đoạn đầu tiên bằng phương thức GetElementsByTagName[]. Nó lấy “p” làm đối số
  4. Sau đó, gọi phương thức AppendChild[] để nối thêm nút văn bản
  5. Lặp lại các bước trên để sửa đổi nhiều yếu tố hơn
  6. Cuối cùng, lưu tài liệu HTML bằng phương thức Save[]. Nó lấy đường dẫn tệp đầu ra làm đối số

Mẫu mã sau đây cho biết cách sửa đổi tệp HTML bằng C#

Chỉnh sửa tệp HTML trong C#

Mẫu mã sau đây cho thấy một ví dụ phức tạp hơn trong đó chúng tôi đang thêm các phần tử mới và sửa đổi các phần tử hiện có

Thêm và chỉnh sửa các phần tử trong tệp HTML bằng C#

Thêm nội dung HTML thô trong C#

Chúng tôi có thể thêm hoặc chỉnh sửa các phần tử bằng cách thêm thủ công mã HTML làm nội dung bằng cách sử dụng thuộc tính InnerHTML của một phần tử. Chúng tôi có thể thêm HTML thô bằng cách làm theo các bước dưới đây

  1. Đầu tiên, tạo một thể hiện của lớp HTMLDocument
  2. Tiếp theo, đặt nội dung của Nội dung. Phần tử InternalHTML dưới dạng chuỗi HTML thô
  3. Cuối cùng, lưu tài liệu HTML bằng phương thức Save[]. Nó lấy đường dẫn tệp đầu ra làm đối số

Mẫu mã sau đây cho biết cách thêm nội dung HTML thô vào tệp bằng C#

Thêm HTML thô vào tệp HTML bằng C#

Nhận giấy phép miễn phí

Bạn có thể nhận giấy phép tạm thời miễn phí để dùng thử Aspose. HTML cho. NET không có giới hạn đánh giá

Phần kết luận

Trong bài viết này, chúng ta đã học cách

  • tạo tài liệu HTML theo chương trình;
  • tải tài liệu HTML hiện có từ đường dẫn đĩa cục bộ;
  • đọc HTML từ tệp đã tải;
  • thêm nội dung mới vào tệp HTML hiện có;
  • sửa đổi nội dung hiện có trong C#

Bên cạnh việc tạo, đọc và chỉnh sửa tệp HTML trong C#, bạn có thể tìm hiểu thêm về Aspose. HTML cho. NET API sử dụng tài liệu. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn hỗ trợ miễn phí của chúng tôi

Làm cách nào để đọc tệp HTML trong C?

file = fopen[“myfile. html”, “r”]; .
trong khi [fgets[my_string_var, NUM_CHARS, tệp]] {
/* my_string_var sẽ có nội dung của dòng hiện tại */

Chúng ta có thể sử dụng HTML bằng ngôn ngữ C không?

Trình biên dịch C được thiết kế để có thể trích xuất và biên dịch mã C được nhúng trong tệp HTML . Khả năng này có nghĩa là mã C có thể được viết để hiển thị trong trình duyệt sử dụng khả năng hiển thị và định dạng đầy đủ của HTML.

Làm cách nào để đọc nội dung HTML trong C#?

Máy khách WebClient = WebClient mới[]; . DownloadString["url"];

Làm cách nào để đọc tệp HTML trong ứng dụng C# Windows?

Tải tệp từ tài nguyên .
Mở Solution Explorer từ menu View của Menu Bar
Nhấp chuột phải vào tên tệp C# trong Solution Explorer. .
Nhấp vào tab Thêm;
Trong menu phụ, bấm AddNewItem;
Trong trình hướng dẫn, chọn Trang HTML

Chủ Đề