- 相關(guān)推薦
對應(yīng)用TPI系統(tǒng)建設(shè)石油學(xué)科特色數(shù)據(jù)庫論文
資源重組與整合是信息服務(wù)個性化發(fā)展和數(shù)字資源多樣性發(fā)展的產(chǎn)物,是數(shù)字化圖書館發(fā)展的必然趨勢 [1] 。特色數(shù)據(jù)庫是指充分反映本單位(尤其是高校和科研院所)在同行中具有文獻(xiàn)和數(shù)據(jù)資源特色的信息總匯,是圖書館在充分利用自己的館藏特色基礎(chǔ)上建立起來的一種具有本館特色的可供共享的文獻(xiàn)信息資源庫,因此,特色數(shù)
據(jù)庫建設(shè)是圖書館數(shù)字化資源建設(shè)的核心和發(fā)展方向。長江大學(xué)是一所地方綜合性大學(xué),學(xué)校在石油科學(xué)與技術(shù)領(lǐng)域具有鮮明特色。本文初步探討了TPI系統(tǒng)應(yīng)用于我校石油學(xué)科特色數(shù)據(jù)庫建設(shè)中的諸多優(yōu)越性。
一、TPI系統(tǒng)簡介
TPI系統(tǒng)即清華同方專業(yè)數(shù)據(jù)庫制作管理系統(tǒng),是清華同方光盤股份有限公司在積累了信息資源建設(shè)領(lǐng)域的大量寶貴經(jīng)驗的基礎(chǔ)上,為大中小型信息服務(wù)機(jī)構(gòu)開發(fā)的一個以內(nèi)容管理為核心的數(shù)字圖書館解決方案。TPI是基于非結(jié)構(gòu)化文檔管理而開發(fā)的大型智能內(nèi)容管理系統(tǒng)。該系統(tǒng)以FTS全文檢索數(shù)據(jù)庫為核心,集成了字典管理(FDT)、內(nèi)容發(fā)布系統(tǒng)(CPS)、元數(shù)據(jù)標(biāo)引(ME)、類工具(CF)、檢查工具(CKT)、光盤出版工具(CDPT)六大模塊[2]。
采用流行的B/S瀏覽器的檢索方式和先進(jìn)的3層C/S架構(gòu),能夠同時管理文字、圖片、多媒體等信息,并提供全文檢索服務(wù)高校圖書館,支持網(wǎng)頁的動態(tài)發(fā)布,是一個面向內(nèi)容管理的數(shù)字圖書開發(fā)平臺。TPI系統(tǒng)針對數(shù)字圖書建設(shè)提供了一條捷徑,特別是其高性能的全文數(shù)據(jù)庫系統(tǒng),先進(jìn)的信息發(fā)布系統(tǒng),支持標(biāo)準(zhǔn)的檢索協(xié)議,完全兼容普遍使用的CNMARC標(biāo)準(zhǔn),支持Z39.50協(xié)議,動態(tài)實時信息處理,可利用COM實現(xiàn)二次開發(fā)以及高性能的全文檢索引擎,是解決目前數(shù)字圖書館資源建設(shè)的專業(yè)化軟件[3]。另外TPI系統(tǒng)具有電子圖書制作功能,能夠?qū)⒓堎|(zhì)文獻(xiàn)描述成為中國期刊網(wǎng)的CAJ格式,很適合自建特色、非文本信息的數(shù)據(jù)庫。
二、TPI自建數(shù)據(jù)庫步驟
1.確定資源對象、標(biāo)準(zhǔn)、分類法
根據(jù)不同數(shù)據(jù)庫的各自特點采取相應(yīng)的標(biāo)準(zhǔn),目的是方便共享資源及知識產(chǎn)權(quán)的保護(hù)。論文作者在書寫論文的時候一般是用word來編寫的,但因word格式的論文易修改、粘貼、復(fù)制的特性不利于論文知識產(chǎn)權(quán)的保護(hù),甚至?xí)䴙槟切┬钜獬u他人作品的人打開方便之門,所以,此數(shù)據(jù)庫一致采用PDF格式的論文,這種格式的論文既方便下載又能很好地保護(hù)了論文的知識產(chǎn)權(quán)。本庫采用的分類法是《中國圖書館分類法》。
2.設(shè)置檢索字段,輸入數(shù)據(jù)
TPI安裝后,在工具欄上選擇“新建數(shù)據(jù)庫”,然后選擇數(shù)據(jù)庫模板,TPI提供多種數(shù)據(jù)庫模板:CNKI風(fēng)格、Google風(fēng)格、EI風(fēng)格、OCLC風(fēng)格、圖片風(fēng)格等等二十多種供選擇,數(shù)據(jù)庫命名根據(jù)此數(shù)據(jù)庫的用途和實際需要高校圖書館,我們共定義了14個檢索字段,分別是:作者、學(xué)院、專業(yè)、關(guān)鍵詞、中文題名、英文題名、分類號、指導(dǎo)教師、學(xué)位名稱、中文摘要、英文摘要、畢業(yè)年度、目錄和全文,這些字段今后也可以根據(jù)自己的需要任意添加或刪除。最后,設(shè)置數(shù)據(jù)庫的發(fā)布選項和數(shù)字對象的命名方式,一個一個地把PDF格式的論文引入到數(shù)據(jù)庫中。
3.標(biāo)引、分類數(shù)據(jù)
“標(biāo)引”即指把對象每一個檢索字段的內(nèi)容標(biāo)示出來,告訴計算機(jī)每個檢索字段的內(nèi)容應(yīng)該在對象的哪一部分,所以,用戶檢索該字段,實際上就是檢索標(biāo)引出來的字段。數(shù)據(jù)標(biāo)引完后即可以進(jìn)行分類數(shù)據(jù)!胺诸悺笔侵赴凑罩袌D法的規(guī)則,把論文歸納到相對應(yīng)的類目里。一般來講,數(shù)據(jù)庫都有“分類檢索”這種檢索方式,把論文分類正是為能夠分類檢索做鋪墊。
4. 內(nèi)容發(fā)布
制作數(shù)據(jù)庫的最終目的是發(fā)布出來供讀者檢索。TPI系統(tǒng)里的內(nèi)容發(fā)布平臺CPS可滿足我們的不同需要,把數(shù)據(jù)以各種風(fēng)格發(fā)布到Internet上。只要在“數(shù)據(jù)庫管理欄”里選擇要發(fā)布的數(shù)據(jù)庫,設(shè)置好概覽字段和細(xì)覽字段等項目,就開始Web發(fā)布[4]。
三、TPI各模塊在特色數(shù)據(jù)庫中的作用
1. 全文檢索服務(wù)器
FTS應(yīng)用優(yōu)點:(1)檢索信息快而全:采用基于分詞的策略,可以同時對詞和非詞進(jìn)行檢索,提高查準(zhǔn)率。對檢索結(jié)果進(jìn)行排序,極大提高了檢索結(jié)果的準(zhǔn)確性。(2)響應(yīng)快:檢索速度為1Sp100GB。(3)檢索功能強(qiáng)大:提供單庫檢索﹑多認(rèn)識個人跨庫檢索﹑視圖檢索﹑二次檢索﹑高級檢索等檢索方式,提供and﹑or﹑not等邏輯操作,并且提供更新日期排序按相關(guān)度等排序方式,還提供了檢索結(jié)果重排功能。
2. 內(nèi)容發(fā)布系統(tǒng)
CPS完成圖書館數(shù)據(jù)庫的分布式采編人庫,實 現(xiàn)網(wǎng)站信息的發(fā)布與管理,實現(xiàn)動態(tài)實時發(fā)布高校圖書館,即發(fā)即得,立即生效。CPS中提供了多種庫結(jié)構(gòu)模板以供選擇,同時還可以根據(jù)需要進(jìn)行自定義。在CPS中還可以建立Web訪問數(shù)據(jù)庫的賬號及操作員賬號。前者允許限定賬號的有效期限及指定訪問的數(shù)據(jù)庫,還可以通過IP地址限定訪問者的范圍。操作員的設(shè)置是為了更好地實現(xiàn)職責(zé)明確的信息加
工,支持多人協(xié)同采編,實現(xiàn)信息發(fā)布之前的編審控制。根據(jù)需要賦予操作員標(biāo)引﹑分類﹑檢查等權(quán)限。CPS還可以進(jìn)行數(shù)據(jù)庫的分類管理,建立導(dǎo)航分類。導(dǎo)航分類將會直接和分類結(jié)果一一對應(yīng),用戶就可以在Web頁面上直接按照導(dǎo)航樹檢索。
3. 元數(shù)據(jù)標(biāo)引工具
MET是通過TCPPIP與FTS相配合,對分配的元數(shù)據(jù)進(jìn)行標(biāo)引,因此標(biāo)引工具與檢索服務(wù)不必運(yùn)行在同一臺計算機(jī)上,可以進(jìn)行遠(yuǎn)程標(biāo)引工作,也可以多臺機(jī)器同時運(yùn)行,提高效率。數(shù)據(jù)標(biāo)引就是給項目中記錄的部分或全部字段填上合適的值,以此來標(biāo)識這條記錄,使用戶能通過對字段的檢索來搜索到此記錄。數(shù)據(jù)標(biāo)引中對原文類型為KDH﹑NH﹑PDF﹑TXT﹑HTML和WORD文件的記錄可以通過原文進(jìn)行標(biāo)引。對不能通過原文進(jìn)行標(biāo)引的記錄,需要利用相應(yīng)的文檔編輯器配合進(jìn)行間接標(biāo)引。
4. 分類工具
CFT也是采用TCPPIP與FTS相聯(lián)接,實現(xiàn)分布式的并行數(shù)據(jù)加工。數(shù)據(jù)分類,就是將數(shù)據(jù)庫中的記錄,通過一定方法與導(dǎo)航樹中的相應(yīng)節(jié)點聯(lián)起來,以便用戶通過分類導(dǎo)航檢索到此記錄。分類操作是以簡單直觀的鼠標(biāo)拖曳方式完成的,只需將選定的文件直接拖曳到分類樹相應(yīng)的最終一級節(jié)點上即可。
5. 檢查工具
CKT也是采用TCPPIP與FTS相聯(lián)接,實現(xiàn)分布式的并行數(shù)據(jù)加工。檢查操作是對標(biāo)引﹑分類操作結(jié)果進(jìn)行檢查,將錯誤數(shù)據(jù)記錄重新返回給標(biāo)引或分類工序高校圖書館,確保數(shù)據(jù)的正確性﹑準(zhǔn)確性。
6. 光盤出版工具
CDPT可以把數(shù)據(jù)以光盤的形式進(jìn)行發(fā)布,用戶拿到光盤后,只需要簡單的安裝后,就能進(jìn)行分類導(dǎo)航﹑專項檢索﹑組合檢索﹑跨庫檢索﹑原文瀏覽等功能。
四、總結(jié)
特色數(shù)據(jù)庫建設(shè)是數(shù)字化圖書館建設(shè)的核心和發(fā)展趨勢,目前TPI系統(tǒng)在技術(shù)上己經(jīng)成熟,并促進(jìn)了知識創(chuàng)新和全民科學(xué)文化水平的提高,但作為知識服務(wù)平臺核心的知識元庫的建設(shè),TPI系統(tǒng)提出的宗旨是:一個平臺,解決所有問題。截止到2002年已經(jīng)有一些大學(xué)圖書館、科研院所和一些企事業(yè)單位(天津大學(xué)、中國農(nóng)業(yè)大學(xué)、廈門市圖書館、北京軍事科學(xué)院、信息產(chǎn)業(yè)部電子第十研究所,等)采用了TPI系統(tǒng)來作為自己數(shù)字圖書館的平臺。這里介紹了TPI系統(tǒng)應(yīng)用在圖書館特色數(shù)據(jù)庫建設(shè)中的很多優(yōu)點,但在實際特色數(shù)據(jù)庫建設(shè)過程中還要遇到其他具體的問題,比如:資金的投入、建設(shè)周期的要求、知識產(chǎn)權(quán)等等,這些問題在實際工作中都有待我們解決。
參考文獻(xiàn)
[1]崔宇紅,劉濤.圖書館數(shù)字資源與OPAC系統(tǒng)的整合[J]. 圖書館雜志,2003(1):57-58.
[2]清華同方.清華專業(yè)數(shù)據(jù)庫制作管理系統(tǒng)技術(shù)白皮書,2003
[3]張肖回,紀(jì)綠緣.清華同方數(shù)字圖書館TPI系統(tǒng)在廈門圖書館中的應(yīng)用[J].上海交通大學(xué)學(xué)報,2003,(9):
[4]楊小琴,袁潤.基于TPI的教學(xué)參考信息系統(tǒng)研究[J]. 現(xiàn)代情報,2007(9):165-166
【對應(yīng)用TPI系統(tǒng)建設(shè)石油學(xué)科特色數(shù)據(jù)庫論文】相關(guān)文章:
石油工程中物料追蹤系統(tǒng)應(yīng)用的論文04-27
EPC模式在石油工程建設(shè)中的應(yīng)用的論文04-27
河北省水文數(shù)據(jù)庫應(yīng)用系統(tǒng)與三級節(jié)點建設(shè)04-28
石油特色機(jī)自專業(yè)認(rèn)識實習(xí)的改革與建設(shè)05-01
數(shù)據(jù)庫系統(tǒng)教材建設(shè)的探索與實踐04-28
論高校圖書館特色數(shù)據(jù)庫的建設(shè)04-29
基于TPI的教學(xué)參考信息系統(tǒng)研究04-30
石油工程信息化建設(shè)的論文04-27
石油工程信息化建設(shè)論文04-27