SQL trích xuất văn bản từ HTML

ScrapeText là một chức năng đơn giản mà tôi sử dụng để lấy văn bản thuần túy ra khỏi chuỗi chứa định dạng ngôn ngữ đánh dấu. Tôi viết chức năng này để hỗ trợ xây dựng báo cáo cho hệ thống câu hỏi. Báo cáo cần thiết để chỉ hiển thị văn bản thuần túy của mỗi câu hỏi. Tuy nhiên, văn bản của mỗi câu hỏi được lưu trữ trong HTML được định dạng nặng

I searched online for a solution but didn’t find anything useful.Then, in a moment of clarity,a solution came to me:Write a function that accepts an HTML string as input and returns a plain text string by simply skipping over any text contained within the tags. For example, if you run the code

SELECT dbo.ScrapeText
  [‘
  SQL Server

kết quả là "Máy chủ SQL"

Tôi đã viết hàm ScrapeText cho SQL Server 2005 và SQL Server 2000. Liệt kê 1 cho thấy đoạn mã thực hiện quá trình xử lý chính. Mã này trước tiên bao bọc chuỗi đầu vào [có thể là một chuỗi hoặc một cột chữ và số trong bảng] bằng dấu > và

Chủ Đề