Hướng dẫn tách file pdf Informational
Thuật ngữ dữ liệu gốc (meta-data) theo nghĩa đen có nghĩa là ‘dữ liệu về dữ liệu’. Dữ liệu gốc cung cấp thêm thông tin về một tệp cụ thể, chẳng hạn như tác giả, dữ liệu khởi tạo, các hạn chế bản quyền khả dĩ hoặc ứng dụng được sử dụng để tạo tệp. Cách sử dụng các dữ liệu gốc trong tệp PDF được miêu tả trong bài này. Nội dung hướng tới ngành công nghiệp in – bao bì nhưng cũng hữu ích cho các ứng dụng khác của của định dạng PDF: Show
Cách xem dữ liệu gốc trong tệp PDFĐể xem dữ liệu gốc trong tài liệu PDF, hãy mở tệp đó bằng Adobe Reader hoặc Adobe Acrobat rồi chọn Properties trong menu File. Ảnh chụp màn hình bên dưới hiển thị cửa sổ Additional Metadata trong Adobe Acrobat DC. Adobe Reader không có cửa sổ bổ sung này. Các ứng dụng khác quan tâm đến việc quản lý dữ liệu có thể hiển thị dữ liệu gốc. Ví dụ: Adobe Bridge cho phép bạn duyệt qua các thư mục chứa tệp PDF và kiểm tra các dữ liệu gốc cơ bản như tác giả (author), mô tả (description) và bản quyền (copyright) của các tệp PDF. Về mặt lý thuyết, các hệ điều hành cũng có thể làm điều này: Windows 7 làm rất tốt trong việc hiển thị dữ liệu gốc liên quan đến hình ảnh (chẳng hạn như độ phân giải, độ sâu bit, từ khóa,..) hoặc dữ liệu gốc liên quan đến âm nhạc (như nghệ sĩ, album và thể loại), nó lại không làm vậy đối với các tệp PDF. Những hệ thống quản lý nội dung chuyên nghiệp không chỉ có thể hiển thị dữ liệu gốc mà còn cho phép tìm kiếm mở rộng dựa trên từ khóa hoặc trường mô tả. Nhiều ứng dụng tạo nội dung, chẳng hạn như Microsoft Word, Adobe InDesign hoặc Adobe Photoshop, cho phép người dùng thiết lập dữ liệu gốc trên các tệp của mình. Ví dụ: trong InDesign, bạn có thể sử dụng tùy chọn File Info để thiết lập các dữ liệu gốc như tựa đề, mô tả, tác giả, từ khóa và các thông tin bản quyền. Những thông tin này được nhúng trong các trường dữ liệu gốc của tệp PDF khi ứng dụng xuất tệp PDF. Các công cụ chỉnh sửa PDF, chẳng hạn như Adobe Acrobat Professional, cho phép bạn thêm dữ liệu gốc hoặc chỉnh sửa chúng. Đối với vài loại dữ liệu gốc chuyên biệt, sẽ cần một chương trình mở rộng – plug-in – để có thể nhập dữ liệu hoặc cung cấp cho người dùng các hướng dẫn và lựa chọn rõ ràng để nhập liệu. Các công cụ như Exiftool cho phép bạn trích xuất hoặc nhúng dữ liệu gốc. Ngoài ra còn có các công cụ trực tuyến – như PDF Candy – để chỉnh sửa dữ liệu gốc. Tôi (tác giả – ND) chưa thử nghiệm công cụ này nên không thể bình luận về độ tin cậy hoặc tính hữu dụng cho ngành in ngoài việc giới hạn dung lượng tệp là 10MB. Cách xóa dữ liệu gốcDữ liệu gốc tạo thêm giá trị sử dụng cho tệp PDF nhưng tùy trường hợp mà bạn có thể muốn loại bỏ chúng. Chẳng hạn như lý do pháp lý hoặc vì những lo ngại về bảo mật hay quyền riêng tư.
Cách dữ liệu gốc được lưu trữ trong các tệp PDFCó một số cơ chế để thêm dữ liệu gốc vào các tệp PDF:
Các giá trị phải là định dạng văn bản và các loại định dạng nào khác không được chấp nhận. Vài ứng dụng còn cho phép thêm các cặp dữ liệu của riêng chúng vào từ điển gốc.
Các tiêu chuẩn về dữ liệu gốc của PDFCó một số tiêu chuẩn để áp dụng dữ liệu gốc vào tệp PDF:
Tên tệp cũng có thể dùng như dữ liệu gốcCách dễ nhất để cung cấp thêm thông tin vào tệp PDF là đặt tên tệp một cách thích hợp. Một cái tên như ‘SmartGuide_12_p057-096_v3.pdf’ cho người nhận biết nhiều hơn về tệp so với cái tên “pages_part2_final.pdf”. |