HTML là cốt lõi của web, tất cả các trang bạn thấy trên internet đều là HTML, cho dù chúng được tạo động bởi JavaScript, JSP, PHP, ASP hay bất kỳ công nghệ web nào khác. Trình duyệt của bạn thực sự phân tích cú pháp HTML và hiển thị nó cho bạn Nhưng nếu chúng tôi cần phân tích cú pháp tài liệu HTML và tìm một số thành phần, thẻ, thuộc tính hoặc kiểm tra xem một thành phần cụ thể có tồn tại hay không. Trong java, chúng ta có thể trích xuất nội dung HTML và có thể phân tích cú pháp Tài liệu HTML
phương pháp tiếp cận
- Sử dụng FileReader
- Sử dụng url. openStream[]
Cách tiếp cận 1. Thư viện được gọi là FileReader cung cấp cách đọc bất kỳ Tệp nào bất kể Tiện ích mở rộng nào. Cách nối các dòng HTML vào Trình tạo chuỗi như sau
không dùng nữa. Tính năng này không còn được khuyến nghị. Mặc dù một số trình duyệt có thể vẫn hỗ trợ nó, nhưng nó có thể đã bị xóa khỏi các tiêu chuẩn web có liên quan, có thể đang trong quá trình loại bỏ hoặc chỉ có thể được giữ lại cho mục đích tương thích. Tránh sử dụng nó và cập nhật mã hiện có nếu có thể; . Xin lưu ý rằng tính năng này có thể ngừng hoạt động bất cứ lúc nào
Phần tử ứng dụng HTML lỗi thời [] nhúng một ứng dụng Java vào tài liệu;
Việc sử dụng các tiểu dụng Java trên Web không được dùng nữa;
Thuộc tính
align
Không dùng nữa
Thuộc tính này được sử dụng để định vị applet trên trang so với nội dung có thể chảy xung quanh nó. HTML4. 01 xác định các giá trị của bottom
, left
, middle
, right
và top
, trong khi Microsoft và Netscape cũng có thể hỗ trợ absbottom
, 0,
1,
2 và
3
4 Không dùng nữaThuộc tính này làm cho một văn bản mô tả thay thế được hiển thị trên các trình duyệt không hỗ trợ Java. Người thiết kế trang cũng nên nhớ rằng nội dung nằm trong phần tử cũng có thể được hiển thị dưới dạng văn bản thay thế
6 Không dùng nữaThuộc tính này đề cập đến một phiên bản được lưu trữ hoặc nén của applet và các tệp lớp được liên kết của nó, điều này có thể giúp giảm thời gian tải xuống
7 Không dùng nữaThuộc tính này chỉ định URL của tệp lớp của applet sẽ được tải và thực thi. Tên tập tin applet được xác định bởi một. phần mở rộng tên tệp lớp. URL được chỉ định bởi mã có thể liên quan đến thuộc tính 8
8 Không dùng nữaThuộc tính này cung cấp URL tuyệt đối hoặc tương đối của thư mục chứa các applet'. các tệp lớp được tham chiếu bởi thuộc tính mã được lưu trữ
0 Không dùng nữaThuộc tính này, được hỗ trợ bởi Internet Explorer 4 trở lên, chỉ định tên cột từ đối tượng nguồn dữ liệu cung cấp dữ liệu bị ràng buộc. Thuộc tính này có thể được sử dụng để chỉ định các phần tử 1 khác nhau được chuyển đến tiểu dụng Java
2 Không dùng nữaGiống như 0, thuộc tính này được sử dụng để liên kết dữ liệu trong Internet Explorer 4. Nó cho biết id của đối tượng nguồn dữ liệu cung cấp dữ liệu được liên kết với các phần tử
1 được liên kết với tiểu dụng
5 Không dùng nữaThuộc tính này chỉ định chiều cao, tính bằng pixel, mà applet cần
6 Không dùng nữaThuộc tính này chỉ định không gian ngang bổ sung, tính bằng pixel, được đặt trước ở hai bên của applet
7 Không dùng nữaTrong triển khai Netscape, thuộc tính này cho phép các chương trình truy cập vào một applet bằng ngôn ngữ kịch bản được nhúng trong tài liệu
8 Không dùng nữaThuộc tính này gán tên cho applet để nó có thể được xác định bởi các tài nguyên khác;
9 Không dùng nữaThuộc tính này chỉ định URL của một đại diện được tuần tự hóa của một applet
align
0 Không dùng nữaNhư được định nghĩa cho Internet Explorer 4 trở lên, thuộc tính này chỉ định URL cho tệp được liên kết cho tiểu dụng. Ý nghĩa và cách sử dụng không rõ ràng và không phải là một phần của tiêu chuẩn HTML
align
1 Không dùng nữaThuộc tính này chỉ định không gian dọc bổ sung, tính bằng pixel, được dành riêng bên trên và bên dưới applet
align
2 Không dùng nữaThuộc tính này chỉ định bằng pixel chiều rộng mà applet cần
Thí dụ
HTML
Sorry, you need Java to play this game.
Tóm tắt kỹ thuật
Danh mục nội dung Nội dung luồng, nội dung theo cụm từ, nội dung được nhúng, nội dung tương tác, nội dung có thể sờ thấy. Nội dung được phépKhông có hoặc nhiều phần tử 1, sau đó trong suốt. Thiếu thẻ Không có; . Cha mẹ được phép Bất kỳ phần tử nào chấp nhận nội dung được nhúng. Giao diện DOM____34