日韩欧美爱爱,欧美日韩一级大片,极品久久久久久,色黄网站,38激情网,日韩成人资源,日韩一级

現(xiàn)在位置:范文先生網(wǎng)>理工論文>計(jì)算機(jī)信息技術(shù)>用PDF文檔制作特色文獻(xiàn)全文數(shù)據(jù)庫(kù)的實(shí)踐

用PDF文檔制作特色文獻(xiàn)全文數(shù)據(jù)庫(kù)的實(shí)踐

時(shí)間:2023-02-22 15:51:43 計(jì)算機(jī)信息技術(shù) 我要投稿
  • 相關(guān)推薦

用PDF文檔制作特色文獻(xiàn)全文數(shù)據(jù)庫(kù)的實(shí)踐


摘要:文章系統(tǒng)分析了PDF文檔的特點(diǎn),根據(jù)開(kāi)發(fā)"粵北地方文獻(xiàn)全文數(shù)據(jù)庫(kù)"的方法和實(shí)踐,指出圖書館制作特色文獻(xiàn)數(shù)據(jù)庫(kù)應(yīng)首選PDF文檔。

中圖分類號(hào):250.74
文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1006-1525(2004)01-0046-03

國(guó)家數(shù)字圖書館是依托互連網(wǎng)連接起來(lái)的全國(guó)各地圖書館電子信息數(shù)據(jù)庫(kù)群,其信息基礎(chǔ)由國(guó)家圖書館藏文獻(xiàn)信息、網(wǎng)絡(luò)信息、各地圖書館藏特色文獻(xiàn)信息構(gòu)成。全國(guó)各地的地方特色文獻(xiàn)是國(guó)家數(shù)字圖書館中具有重要意義的信息,地方圖書館盡快設(shè)法將這些信息數(shù)字化是國(guó)家數(shù)字圖書館工程的重要基礎(chǔ)。下面是我館以PDF文檔格式制作"粵北地方文獻(xiàn)數(shù)據(jù)庫(kù)"的一點(diǎn)認(rèn)識(shí)和經(jīng)驗(yàn)。

1什么是PDF

PDF是Adobe公司開(kāi)發(fā)的一種電子文檔格式PortableDocumentFormat的簡(jiǎn)稱,這是一種可移植的結(jié)構(gòu)化通用文檔格式,它可以將任何文字、表格、顏色、圖形圖像、超文本鏈接、聲音、動(dòng)態(tài)圖像等信息封裝在一個(gè)電子文檔中,而不管創(chuàng)建該文檔所使用的應(yīng)用程序和平臺(tái)。AdobePDF是出版業(yè)新興的工作流程標(biāo)準(zhǔn)。

PDF文檔是通過(guò)一系列對(duì)象序列來(lái)構(gòu)造的,PDF對(duì)象包括直接對(duì)象(DirectObject)和間接對(duì)象(IndirectObject)。直接對(duì)象通常有布爾型(Boolean)、數(shù)值型(Number)、字符串型(String)、名字型(Name)、數(shù)組型(Array)、字典型(Dictionary)、空對(duì)象(Null)、流對(duì)象(Stream)等基本類型,間接對(duì)象是經(jīng)過(guò)標(biāo)識(shí)了的PDF對(duì)象。一個(gè)PDF文檔包含了一個(gè)或多個(gè)頁(yè)面,而每一頁(yè)都可以包含文檔、圖形和圖像。一個(gè)典型的PDF文件包含文件頭、文件主體、交叉引用表和文件尾4個(gè)部分。文件頭(Header)位于PDF文檔的第一行,它表明當(dāng)前文件使用PDF規(guī)范的版本;文件體(Body)中包括構(gòu)成文件間接對(duì)象的一個(gè)序列,這些對(duì)象代表文檔中的各個(gè)組件,例如字體、頁(yè)數(shù)和圖像等,交叉引用表(Cross-referenceTable)則是為了能對(duì)間接對(duì)象進(jìn)行隨機(jī)存取而設(shè)立的一個(gè)間接對(duì)象地址索引表,它給出了所有當(dāng)前文件使用對(duì)象的入口地址,即字節(jié)偏移量,以便系統(tǒng)隨機(jī)訪問(wèn)不同的對(duì)象;文件尾(Trailer)中包含了交叉引用表的起始地址和其中的對(duì)象總數(shù)、文檔中Catalog(目錄)對(duì)象的對(duì)象號(hào)以及加密等安全信息,根據(jù)文件尾提供的信息,PDF的應(yīng)用程序可以找到交叉引用表和整個(gè)PDF文件的目錄對(duì)象,從而控制整個(gè)PDF文檔。

2PDF的特點(diǎn)

目前國(guó)內(nèi)文獻(xiàn)數(shù)字技術(shù)飛速發(fā)展,已有多家文獻(xiàn)數(shù)字化處理系統(tǒng),據(jù)筆者所知,DIPS數(shù)字文獻(xiàn)處理系統(tǒng)、TRS系統(tǒng)等都是性能出色的系統(tǒng),而價(jià)廉物美的AdobeAcrobatReader制作利用PDF文檔確實(shí)是最好選擇。用PDF制作電子文獻(xiàn)只需安裝:(1)中文操作系統(tǒng);(2)任何字處理軟件,排版軟件,圖形軟件;(3)中文4.0版本以上的AdobeAcrobat。ActivePDF公司還發(fā)布了以ActivePDFServer?yàn)橹行模校模乒ぞ甙#粒悖簦椋觯澹校模疲樱澹颍觯澹蚴且粋(gè)服務(wù)器軟件,可以讀取幾乎所有Windows應(yīng)用文檔,并把它們轉(zhuǎn)換成PDF格式。該服務(wù)器軟件有標(biāo)準(zhǔn)版和專業(yè)版兩個(gè)版本,專業(yè)版支持PDF加密解密。軟件包的其他工具還有DocConverter(能將280多種文檔轉(zhuǎn)換成PDF)、Web Grabber(能將HTML轉(zhuǎn)換成PDF)、Spooler(打印服務(wù)器的PDF文檔)等。

PDF是從頁(yè)面描述語(yǔ)言PS(PostScript)發(fā)展而來(lái),具有與PS幾乎相同的頁(yè)面描述能力和相似的描述方法。但與PS不同的是,PDF除了能描述復(fù)雜版面外,還具有交互功能(如超鏈接、交互表單等)、頁(yè)面隨機(jī)存取及圖形字體仿真描述等特性。因此,PDF不僅適合印刷出版,而且也適合電子出版,是全世界電子版文檔分發(fā)的公開(kāi)實(shí)用標(biāo)準(zhǔn)。

PDF與在電子出版中占統(tǒng)治地位的HTML語(yǔ)言相比也有自己明顯的優(yōu)勢(shì),實(shí)現(xiàn)了紙張印刷和電子出版的統(tǒng)一。排版后的內(nèi)容生成PDF文件,則能在交付印刷的同時(shí),進(jìn)行網(wǎng)絡(luò)數(shù)字化發(fā)行。此外,PDF還有下列優(yōu)點(diǎn):

(1) 容易制作和利用---大眾化

制作PDF格式的多媒體電子圖書目前主要有三種途徑:第一是應(yīng)用專門的PDF制作工具軟件進(jìn)行制作;第二是將包含有Postscript頁(yè)面描述語(yǔ)言的文件轉(zhuǎn)換成PDF文檔;第三是利用轉(zhuǎn)換工具把其他格式文件(如DOC、HTML等)轉(zhuǎn)換成PDF文檔。

(2)跨平臺(tái)應(yīng)用---通用性

集約的PDF文件比原來(lái)的源文件小很多,以致在Web上下載文件的同時(shí)可以快速地顯示頁(yè)面。PDF獨(dú)立于軟件、硬件和創(chuàng)建的操作系統(tǒng)平臺(tái),任何人都可以使用免費(fèi)的AdobeAcrobatReader在任何電腦、任何系統(tǒng)平臺(tái)上共享、查看、瀏覽和打印,并具有強(qiáng)大的全文檢索功能。

(3)高效的瀏覽和打印---所見(jiàn)即所得

壓縮的AdobePDF文件比源文件小,每次下載一頁(yè),可以在網(wǎng)頁(yè)上快速顯示,而且不會(huì)降低網(wǎng)絡(luò)速度。創(chuàng)建PDF者可以加入書簽,Web鏈接來(lái)使PDF文件容易瀏覽,讀者可以直接使用電子化的便箋、高亮度顯示、下劃線等來(lái)對(duì)PDF文件進(jìn)行標(biāo)注。不管你的顯示器是何種類型,PDF文件精確的顏色匹配保證忠實(shí)再現(xiàn)原文。讀者可以放大或縮小一個(gè)文件以適應(yīng)屏幕和自己的視覺(jué),PDF文件可以放大到800%而絲毫不損失清晰。由于PDF文件是以PostScript語(yǔ)言圖像模型為基礎(chǔ),它將忠實(shí)地再現(xiàn)原稿的每一個(gè)字符、顏色以及圖像,正適合特色文獻(xiàn)載體種類繁多、形式各異的數(shù)字化要求。PDF文檔無(wú)論在哪種打印機(jī)上都可保證圖形精確、顏色準(zhǔn)確的打印效果。

(4)高安全加密特性---版權(quán)保護(hù)

使用Acrobat5.0軟件,可以輕松添加書簽,設(shè)置安全選項(xiàng)以及生成微型AdobePDF預(yù)覽視圖,Acrobat5.0還可以在網(wǎng)頁(yè)瀏覽器內(nèi)使用"數(shù)字簽名",從而對(duì)AdobePDF文檔加上評(píng)語(yǔ)或?qū)ζ溆枰詼?zhǔn)核。對(duì)PDF"加密"可以控制敏感信息的可訪問(wèn)性,能夠控制機(jī)密文件的訪問(wèn)權(quán)限,防止PDF被改動(dòng)或打印。"數(shù)字簽名"更可對(duì)審閱過(guò)程的每一步進(jìn)行控制。由于PDF文檔具有的種種優(yōu)點(diǎn),使它成為出版界的新寵,目前網(wǎng)上的電子出版物大多采用PDF文檔格式發(fā)行。利用PDF格式制作特色文獻(xiàn)全文數(shù)據(jù)庫(kù)可以保留發(fā)表出版時(shí)的原版原式,圖文并茂,既可以直接打印,也可以下載保存。

3用PDF文檔制作特色文獻(xiàn)全文數(shù)據(jù)庫(kù)

鑒于PDF的上述優(yōu)點(diǎn),我館在建設(shè)"學(xué)院科研成果管理系統(tǒng)"和"粵北地方文獻(xiàn)全數(shù)據(jù)庫(kù)"時(shí)就選用PDF文檔格式,建設(shè)和運(yùn)行的效果良好。

3.1PDF文檔制作

安裝了Acrobat之后,在Windows控制面板中的"打印機(jī)"中會(huì)出現(xiàn)兩種Acrobat的虛擬打印方式---AcrobatDistiller以及AcrobatPDFWriter,通過(guò)我們的反復(fù)測(cè)試,建議使用PDFWriter來(lái)打印中文電子文檔,原因有二:第一,打印出的PDF文檔體積小;第二,比Distiller可以更快速地制作。

特色文獻(xiàn)通常表現(xiàn)為論文、專著、實(shí)驗(yàn)數(shù)據(jù)、統(tǒng)計(jì)表格、繪畫圖片、音像制品,多表現(xiàn)為文本文件、HTML文件、DOC文件、JPG或RTF文件等等,這些文檔都可以轉(zhuǎn)換成PDF格式文檔。根據(jù)我們的實(shí)踐,建議能轉(zhuǎn)換成DOC文件的盡量使用MSWord來(lái)制作PDF文檔。需要注意的是,使用Word排版,正文文字選擇"黑體,五號(hào)"或者"宋體加粗,五號(hào)"為最佳打印字體,標(biāo)題及其他文字大小、顏色可以自定義,但是字體最好也要選擇上述兩種字體。圖片建議選擇JPG或者GIF圖像,不推薦使用BMP圖像。Word文檔的頁(yè)面大小最好為16開(kāi)、32開(kāi)或者B5,因?yàn)閷?duì)于A4這樣的大小,一行上的文字會(huì)容納很多,這樣不利于讀者閱讀。

如上所述,AcrobatPDFwriter可將任何格式的文檔轉(zhuǎn)換成PDF文檔,它是一個(gè)模擬的"打印"驅(qū)動(dòng)程序,即在客戶應(yīng)用程序中調(diào)用打印命令,以"打印"文件的方式創(chuàng)建PDF格式的文檔。PDFwriter的使用方法是:首先安裝該軟件,安裝完成后在Windows打印機(jī)設(shè)置的列標(biāo)上將增加PDFwriter;然后啟動(dòng)應(yīng)用程序并打開(kāi)用于轉(zhuǎn)換的文件,在菜單或工具欄中選擇"打印";在打印機(jī)名稱菜單上選擇PDFwriter;接著選擇目標(biāo)目錄并為PDF文檔取名;在填寫完相應(yīng)的信息后,PDFwriter?qū)?huì)自動(dòng)生成PDF文檔。AcrobatDistiller是一個(gè)可以用來(lái)制作和編輯PDF格式文件的高端PDF文檔生成器,利用它可以將Postscript文件轉(zhuǎn)換成PDF文檔。AcrobatPDFmaker則是一個(gè)系列工具,例如AcrobatPDFmakerForWord97可在Word97中直接將編輯好的DOC文件轉(zhuǎn)換成PDF文檔,轉(zhuǎn)換過(guò)程中PDFmaker會(huì)將Word文件中的一些信息和結(jié)構(gòu)相應(yīng)地轉(zhuǎn)換成PDF文檔中的信息和結(jié)構(gòu),比如將Word中的頭部轉(zhuǎn)換成PDF書簽,將Word中的URL轉(zhuǎn)換成PDF的網(wǎng)頁(yè)鏈接等等。對(duì)于掃描輸出或其他圖片格式則可通過(guò)Adobe公司推出的Photoshop6.0保存為JPG或者GIF圖像后轉(zhuǎn)換成PDF文檔,以確保文檔最小化。

單擊"打印"按鈕開(kāi)始打印,PDFWriter進(jìn)行簡(jiǎn)單的文字預(yù)處理以后會(huì)要求選擇輸出PDF文件的保存路徑,之后等著PDFWriter打印文檔就行了。這里要注意保存路徑選項(xiàng),我們的經(jīng)驗(yàn)是建立專項(xiàng)目錄樹(shù)。

3.2PDF文檔組織管理

對(duì)制作好的PDF文檔腳本,必須進(jìn)行一些必要的處理,包括超級(jí)鏈接、書簽、注釋、文檔初始化、電子信息加密等屬性設(shè)置,提取目錄索引標(biāo)識(shí)。然后對(duì)眾多的PDF文檔分類組織。運(yùn)行Acrobat,打開(kāi)PDF文檔腳本。

首先是加入超級(jí)鏈接,對(duì)需要加入超鏈接的文字設(shè)置超鏈接的外觀、位置和讀者點(diǎn)擊超鏈接時(shí)的顯示方式、效果和將發(fā)生的事件;其次是加入書簽,書簽的作用旨在快速的定位文章中特定的部分,某種情況下可以起到目錄作用,因?yàn)椋粒悖颍铮猓幔糁С謺灥耐献Р僮?即您可以將一個(gè)書簽"拖動(dòng)"到另一書簽上,建立書簽的邏輯關(guān)系;第三是加入注釋,注釋的作用很多,最主要是對(duì)文檔或者文檔的某個(gè)部分的說(shuō)明;第四是對(duì)文檔初始化屬性的設(shè)置,選擇"BookmarksandPage"單選項(xiàng),其他選項(xiàng)使用默認(rèn)值;第五是文檔加密設(shè)置,如果希望用戶需要密碼才能閱讀,請(qǐng)選擇"PasswordRequiredtoOpenDocument",輸入用戶打開(kāi)文檔時(shí)需要的密碼。建議選擇"PasswordRequiredtoChangePermissionsandPasswords"選項(xiàng),即只有制作者才可以修改文檔信息及文檔安全性密碼。雖然現(xiàn)在有很多軟件是用來(lái)破解PDF文檔密碼的,但是想輕易地破解也并非易事。在EncryptionLevel(加密級(jí)別)中可以選擇使用的加密級(jí)別:包括40-bit和128-bit兩種方式,其中128-bit只能針對(duì)5.0版本,所以建議選擇40-bit即可,以確保文檔的向下兼容。應(yīng)選擇"NoChangingtheDocument",即不允許用戶修改文檔中的任何部分。如果需要禁止用戶打印和復(fù)制文檔中的文字和圖片可以選"NoPrinting"、"NoContentCopyingorExtraction,DisableAccessibility"選項(xiàng)。最后要做的是保存所做的修改。

如果想對(duì)PDF文檔內(nèi)容進(jìn)行編輯和修改,可使用AdobeExchange,利用它可以在文檔中添加超文本鏈接、書簽、小書頁(yè)圖標(biāo)、表格等,也可以在文檔中插入、刪除、復(fù)制或者移動(dòng)一個(gè)或多個(gè)頁(yè)面。
3.3PDF文檔的閱讀與管理

PDF支持任意字符檢索,與TRS、TBS檢索系統(tǒng)配套更是完美的數(shù)字化文獻(xiàn)集合。AcrobatReader是我們閱讀PDF格式文檔的較好選擇,這是一個(gè)免費(fèi)軟件,可直接從網(wǎng)上下載。AcrobatReader既可以獨(dú)立運(yùn)行,也可以作為瀏覽器的插件(plug-in)對(duì)PDF文檔進(jìn)行在線閱讀。如果計(jì)算機(jī)中已經(jīng)安裝了Netscape瀏覽器,則在安裝AcrobatReader時(shí)安裝程序會(huì)自動(dòng)將其作為插件插到Netscape中;如果使用IE瀏覽器,則要在程序安裝完成后,將目錄"\Adobe\AcrobatX.0\Reader\browser"中的nppdf32.dll文件拷貝到IE的插件目錄"\InternetExplorer\Plugins\"中,并重新啟動(dòng)計(jì)算機(jī),這樣就可以在瀏覽器中像瀏覽HTML網(wǎng)頁(yè)一樣方便地瀏覽PDF文檔了。

AcrobatReader?yàn)橛脩籼峁┝硕喾N形式的瀏覽窗口,有"單頁(yè)面"、"頁(yè)面 書簽?zāi)夸?和"頁(yè)面 書頁(yè)圖標(biāo)"等顯示方式,既可以全屏瀏覽,也可以單頁(yè)瀏覽。它還提供了翻頁(yè)功能,可利用菜單、滾動(dòng)條,右鍵菜單、方向鍵等進(jìn)行翻頁(yè),可選擇首尾、前后及指定頁(yè)號(hào)翻頁(yè)。AcrobatReader的頁(yè)面多級(jí)縮放功能可以按12.5%到1600%的比率進(jìn)行縮放,使用戶選擇合適的比例閱覽。此外,它還提供了復(fù)制的功能,點(diǎn)擊工具欄中含"T"字樣的"TextSelectTool"按鈕,通過(guò)拖拉鼠標(biāo)選定要復(fù)制的文本范圍,點(diǎn)擊復(fù)制后就可以粘貼到需要的地方了。要注意的是,如果在制作PDF文檔時(shí)設(shè)定了"不允許選擇文本和圖形"的安全保護(hù),則不可能復(fù)制,這對(duì)需要保護(hù)的文檔非常有用。

3.4知識(shí)產(chǎn)權(quán)問(wèn)題

由于PDF文檔易于傳輸,且在獲得了免費(fèi)閱讀軟件后可進(jìn)行隨意瀏覽,給PDF格式電子文獻(xiàn)的知識(shí)產(chǎn)權(quán)保護(hù)帶來(lái)了極大的挑戰(zhàn)。針對(duì)這一問(wèn)題,Adobe公司推出了面向出版商和發(fā)行商的安全出版系統(tǒng)。該系統(tǒng)包括AdobePDFMerchant和AcrobatReader的WebBuy插件兩部分。其中PDFMerchant是作為服務(wù)器端的程序,WebBuy插件是客戶端程序,通過(guò)兩者配合使用來(lái)確保網(wǎng)上出版物免遭盜版。PDFMerchant的功能是為準(zhǔn)備傳送的PDF文檔加"鎖",當(dāng)讀者試圖利用AcrobatReader閱讀上了"鎖"的文件時(shí),會(huì)提示無(wú)權(quán)閱讀該文件內(nèi)容的信息,并詢問(wèn)你是否愿意購(gòu)買文件內(nèi)容,在點(diǎn)擊購(gòu)買之后,PDFMerchant就會(huì)直接將用戶帶到出版商或發(fā)行商的站點(diǎn)上,在完成購(gòu)買后,網(wǎng)站就會(huì)配合AcrobatReader?qū)⑽募䞍?nèi)容和閱讀許可發(fā)送到讀者用戶的計(jì)算機(jī)上。當(dāng)然,這個(gè)系統(tǒng)只是針對(duì)出版商和發(fā)行商的。如何保護(hù)自己制作的全文數(shù)據(jù)庫(kù)的權(quán)益,堵住盜版的漏洞,目前還沒(méi)有現(xiàn)成的解決方案,但是至少我們可以為PDF格式的電子文檔加"鎖",當(dāng)網(wǎng)絡(luò)用戶將其下載并進(jìn)行閱讀時(shí),要求用戶輸入相關(guān)使用權(quán)信息(如身份證、閱覽證等號(hào)碼),并要求信用承諾不將此書用作商業(yè)用途,然后才將內(nèi)容顯示出來(lái),具有一定的保護(hù)作用。

目前,數(shù)字圖書館建設(shè)如日中天,圖書館可以將從網(wǎng)絡(luò)上下載或者購(gòu)買的電子文獻(xiàn)、館藏的諸如"學(xué)?蒲谐晒"、地方文獻(xiàn)等特色文獻(xiàn),對(duì)其進(jìn)行著錄和標(biāo)引之后組織成電子書庫(kù)提供給讀者。PDF文檔格式作為全世界電子版文檔分發(fā)的公開(kāi)實(shí)用標(biāo)準(zhǔn),是建設(shè)特色文獻(xiàn)數(shù)據(jù)庫(kù),為用戶提供內(nèi)容豐富、圖文并茂的電子文獻(xiàn)之首選。

參考文獻(xiàn):
[1] 什么是PDF〔EB/oL〕.http://www.chinapdf.com/begin.htm
[2] [2]李慧.PDF文檔與多媒體電子圖書[J].晉圖學(xué)刊,2001,(1).
[3] [3]深藍(lán)色系統(tǒng).PDF電子書簡(jiǎn)要制作方法〔EB/oL〕.http://lib.haiyang.net.cn/ebook/multi/bl.HTM
[4] [4]肖明.PDF文檔的閱讀與生成工具[J].電子與電腦,2000,(1).
[5] [5]官建生.地方文獻(xiàn)數(shù)字化:中國(guó)數(shù)字圖書館工程信息基礎(chǔ)[J].大學(xué)圖書情報(bào)學(xué)刊.2002,(2).

〔出處〕 大學(xué)圖書情報(bào)學(xué)刊2004年3月第22卷第1期



【用PDF文檔制作特色文獻(xiàn)全文數(shù)據(jù)庫(kù)的實(shí)踐】相關(guān)文章:

基于PDF文檔的網(wǎng)絡(luò)學(xué)習(xí)資源建設(shè)08-06

基于PDF文檔的網(wǎng)絡(luò)學(xué)習(xí)資源建設(shè)08-06

基于PDF文檔的網(wǎng)絡(luò)學(xué)習(xí)資源建設(shè)08-06

區(qū)域文獻(xiàn)特色數(shù)據(jù)庫(kù)的建立及其服務(wù)平臺(tái)的搭建08-09

淺談區(qū)縣圖書館地方文獻(xiàn)特色數(shù)據(jù)庫(kù)的共建策略08-09

高校圖書館建設(shè)地方特色文獻(xiàn)數(shù)據(jù)庫(kù)的再思考08-09

地方文獻(xiàn)數(shù)據(jù)庫(kù)建設(shè)初探08-09

地方文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)08-09

惠州地方文獻(xiàn)數(shù)據(jù)庫(kù)的建設(shè)08-09