Tôi muốn tạo một ứng dụng có thể đọc tệp html. Sau đó, tôi muốn tìm kiếm các chuỗi mong muốn và lấy dữ liệu thành các phần tử chỉnh sửa văn bản bằng C#. Bạn có thể vui lòng trợ giúp với bất kỳ ví dụ hoặc hướng dẫn nào không?
Trân trọng
Những gì tôi đã thử
Máy khách WebClient = WebClient mới[];
Chuỗi htmlCode = máy khách. DownloadString["D. /Công việc 2017/Trang web. html"];
Thêm giải pháp của bạn ở đây
B I U S small BIG code var
& link [^] encode untab case indent outdent
Xem trước 0
thành viên hiện có
hoặc tham gia với chúng tôi
Tải xuống, Bình chọn, Nhận xét, Xuất bản
Email của bạnEmail này đang được sử dụng. Bạn có cần mật khẩu của bạn?
Mật khẩu tùy chọnKhi trả lời một câu hỏi xin vui lòng
- Đọc kỹ câu hỏi
- Hiểu rằng tiếng Anh không phải là ngôn ngữ đầu tiên của mọi người, vì vậy hãy khoan dung với lỗi chính tả và ngữ pháp
- Nếu một câu hỏi được diễn đạt kém thì hãy yêu cầu làm rõ, bỏ qua nó hoặc chỉnh sửa câu hỏi và khắc phục sự cố. Xúc phạm không được chào đón
- Đừng bảo ai đó đọc hướng dẫn. Rất có thể họ có và không nhận được. Đưa ra câu trả lời hoặc chuyển sang câu hỏi tiếp theo
Nội dung này, cùng với bất kỳ tệp và mã nguồn liên quan nào, được cấp phép theo Giấy phép Mở Dự án Code [CPOL]
Nếu bạn là một lập trình viên C# đang tìm kiếm một cách hiệu quả để làm việc với các tệp HTML, thì bài viết này là dành cho bạn. Chúng tôi sẽ giải thích những điều cơ bản về cách C# hoạt động với các tệp HTML, từ việc tạo chúng từ đầu đến đọc và chỉnh sửa các tài liệu hiện có. Trong bài viết này, chúng ta sẽ tìm hiểu cách tạo, đọc và chỉnh sửa tệp HTML trong C#
HTML [Hyper Text Markup Language] là ngôn ngữ được sử dụng để tạo các trang web và trang web. Mặt khác, C# là ngôn ngữ lập trình hướng đối tượng được sử dụng để xây dựng các ứng dụng. Tệp HTML chứa các thẻ đánh dấu được sử dụng để định dạng cấu trúc của trang web để hiển thị trong trình duyệt. Chúng ta có thể dễ dàng thao tác các tệp HTML theo chương trình trong. ứng dụng NET. Trong bài viết này, chúng ta sẽ khám phá cách sử dụng C# để đọc, viết và chỉnh sửa tệp HTML. Chúng tôi sẽ xem xét các cách để phân tích cú pháp mã HTML cho các thành phần cụ thể và tạo các thành phần mới từ đầu hoặc chỉnh sửa các thành phần hiện có. Hãy bắt đầu nào
Các chủ đề sau đây sẽ được đề cập trong bài viết này
API C# để tạo, đọc và chỉnh sửa tệp HTML
Để tạo, đọc và chỉnh sửa các tệp HTML, chúng tôi sẽ sử dụng Aspose. HTML cho. NET API. Đây là API xử lý HTML nâng cao cho phép tạo, sửa đổi và trích xuất dữ liệu từ tài liệu HTML. Nó cũng cho phép chuyển đổi và hiển thị các tài liệu HTML mà không cần bất kỳ phần mềm bên ngoài nào
Lớp HTMLDocument của API đại diện cho một tài liệu HTML hoặc trang HTML mà chúng ta thấy trong trình duyệt. Phương thức CreateElement[] của lớp này tạo phần tử HTML được chỉ định bởi tagName. Phương thức CreateTextNode[string] tạo một nút Văn bản với chuỗi đã chỉ định. Phương thức AppendChild[] của giao diện Node thêm một nút vào cuối danh sách con của nút cha được chỉ định. Phương pháp lưu tệp đầu ra. Bạn cũng có thể đọc thêm về trong tài liệu
Vui lòng tải xuống DLL của API hoặc cài đặt nó bằng NuGet
PM> Install-Package Aspose.Html
Tạo một tệp HTML trong C#
Chúng ta có thể dễ dàng tạo một tệp HTML bằng cách làm theo các bước dưới đây
- Đầu tiên, tạo một thể hiện của lớp HTMLDocument
- Tiếp theo, gọi phương thức CreateElement[] để tạo các thành phần như tiêu đề, đoạn văn, văn bản, v.v.
- Sau đó, gọi phương thức CreateTextNode[] để thêm nút văn bản
- Tiếp theo, nối nút đã tạo vào phần tử bằng phương thức AppendChild[]
- Sau đó, đính kèm các thành phần vào nội dung tài liệu bằng HTMLDocument. Cơ thể người. phương thức AppendChild[]
- Lặp lại các bước trên để thêm các phần tử khác
- Cuối cùng, lưu tài liệu HTML bằng phương thức Save[]. Nó lấy đường dẫn tệp đầu ra làm đối số
Mẫu mã sau đây cho biết cách tạo tệp HTML bằng C#
Tạo tệp HTML trong C#
Đọc tệp HTML trong C#
Trong phần trước, chúng ta đã tạo một tệp HTML. Bây giờ, chúng tôi sẽ tải tệp và đọc nội dung của nó bằng cách làm theo các bước dưới đây
- Tải tệp HTML hiện có bằng lớp HTMLDocument
- Đọc và hiển thị nội dung của HTMLDocument. Yếu tố tài liệu. HTML bên ngoài
Mẫu mã sau đây cho biết cách đọc tệp HTML bằng C#
This is Sample Heading!
This is first paragraph.
- First list item.
- Second list item.
Chỉnh sửa tệp HTML trong C#
Chúng tôi cũng có thể cập nhật nội dung của tệp HTML. Chúng tôi có thể thêm nhiều nút/phần tử hơn bằng cách làm theo các bước được đề cập ở trên. Tuy nhiên, chúng tôi có thể sửa đổi các ghi chú/yếu tố hiện có bằng cách làm theo các bước dưới đây
- Tải tệp HTML hiện có bằng lớp HTMLDocument
- Tiếp theo, gọi phương thức CreateTextNode[] để thêm nút văn bản
- Tiếp theo, lấy phần tử đoạn đầu tiên bằng phương thức GetElementsByTagName[]. Nó lấy “p” làm đối số
- Sau đó, gọi phương thức AppendChild[] để nối thêm nút văn bản
- Lặp lại các bước trên để sửa đổi nhiều yếu tố hơn
- Cuối cùng, lưu tài liệu HTML bằng phương thức Save[]. Nó lấy đường dẫn tệp đầu ra làm đối số
Mẫu mã sau đây cho biết cách sửa đổi tệp HTML bằng C#
Chỉnh sửa tệp HTML trong C#
Mẫu mã sau đây cho thấy một ví dụ phức tạp hơn trong đó chúng tôi đang thêm các phần tử mới và sửa đổi các phần tử hiện có
Thêm và chỉnh sửa các phần tử trong tệp HTML bằng C#
Thêm nội dung HTML thô trong C#
Chúng tôi có thể thêm hoặc chỉnh sửa các phần tử bằng cách thêm thủ công mã HTML làm nội dung bằng cách sử dụng thuộc tính InnerHTML của một phần tử. Chúng tôi có thể thêm HTML thô bằng cách làm theo các bước dưới đây
- Đầu tiên, tạo một thể hiện của lớp HTMLDocument
- Tiếp theo, đặt nội dung của Nội dung. Phần tử InternalHTML dưới dạng chuỗi HTML thô
- Cuối cùng, lưu tài liệu HTML bằng phương thức Save[]. Nó lấy đường dẫn tệp đầu ra làm đối số
Mẫu mã sau đây cho biết cách thêm nội dung HTML thô vào tệp bằng C#
Thêm HTML thô vào tệp HTML bằng C#
Nhận giấy phép miễn phí
Bạn có thể nhận giấy phép tạm thời miễn phí để dùng thử Aspose. HTML cho. NET không có giới hạn đánh giá
Phần kết luận
Trong bài viết này, chúng ta đã học cách
- tạo tài liệu HTML theo chương trình;
- tải tài liệu HTML hiện có từ đường dẫn đĩa cục bộ;
- đọc HTML từ tệp đã tải;
- thêm nội dung mới vào tệp HTML hiện có;
- sửa đổi nội dung hiện có trong C#
Bên cạnh việc tạo, đọc và chỉnh sửa tệp HTML trong C#, bạn có thể tìm hiểu thêm về Aspose. HTML cho. NET API sử dụng tài liệu. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn hỗ trợ miễn phí của chúng tôi