這是最近趕的報告之一,寫得還算OK
快被"心得"兩個字搞到吐血 = 3=
Subject:XML與數位圖書館
XML(eXtensible Markup Language)在國內是一個相當熱門的議題,許多專家學者公認XML是第二代全球資訊網的主要平台。而XML也在Metadata的格式上,帶來改變以及效益,進而影響數位圖書館的發展。
什麼是XML?
XML全名為EXtensible Markup Language,中文大致翻譯有可擴展標記語言,可擴展置標語言或可延伸標示語言,為一種標記語言。是從標準通用標記語言(The Standard Generalized Markup Language, SGML)中簡化修改、去蕪存菁出來的。而標記是指電腦所能理解的訊息符號,電腦之間可以通過此種標記處理包含各種資訊的文件。XML制定的目標著重在對文件資料的結構性描述,並且能在網際網路上傳送或處理文件資料。而XML文件(document)的特性,從資料上可以歸納出以下幾點:
1.結構性
2.可擴展性
3.自我描述性
4.資料和樣式的分離原則
5.整合性
由於它具有相當大的自由度跟彈性,解決許多瓶頸也開拓了新的領域,同時也帶來新的問題。 為什麼我們要學XML 從資料上我們可以知道,這是由於HTML的嚴重缺陷,使得專家們又再次對SGML做精簡製作,並依照HTML的發展經驗,產生出一套使用上規則嚴謹,卻簡單的描述資料語言:XML。 XML被廣泛用來作為跨平臺之間交互資料的形式上。其用途大致為:
Rich Documents
自定文件描述並使其更豐富,屬於文件為主的XML技術應用,標記是用來定義一份資料應該如何呈現。
Metadata
在Metadata詮釋資料上,XML是作為資料結構性的描述,無論在語意、結構上皆可利用XML語法加以組織與呈現,標記是用來說明一份資料的意義。
Configuration Files
描述軟體的結構參數。
從《無廢話XML》一書中,我們可以得知,XML能夠使異質系統間的資訊,利用其自我描述與整合的特性而使之加以互通。這是意義非常重大的,這表示著系統間的互通性會變得極為便利而急速發展,並且加速資訊交流,資料處理的速度在未來將不是問題。
在現今數位化的時代,許多文獻大量電子化,要如何保存這些文件,是一大課題,而XML的產生可以說是科技所給予的答案,XML文件在轉換上是相當暢通的,不會有新舊版與不相容的問題,要從XML轉成其他格式是輕而易舉的事情,因而使其加強了保值的效果,能夠讓重要的文獻被確實而長久的保存下來。
XML在數位圖書館的應用
在XML出現之前,Metadata的概念既已出現了。圖書館也一直運用這概念進行管理。在XML出現之後,對Metadata而言,XML以其具有可擴展性、高度結構化和良好的資料組織能力,能夠有效的表達網路上各種知識訊息,為資料的交換和處理提供新的機制。並能配合DTD驗證其資料內容與結構是否合乎規範,確保其正確性。正因為這些特性,使得注錄著有極大的彈性,並依循其結構性去完成。
From Marc to XML
圖書館在書目資料交換上一直以來皆採用MARC格式。而MARC格式也僅僅用於圖書館系統間資料交換,其不能取代系統的內部格式。這些異質系統要想在網路環境下實現資源共享,還必須採用Z39.50協定。圖書館界一向使用ISO 2709做為資料交換格式的標準,但其並無檢查記錄正確性的功能,換言之,單一書目資料的交換作業流程中,便需要歷經三個不同的格式標準,我想這是極為浪費成本與缺乏效率的,若直接使用XML做為資料交換格式,可以統一過程中所有的輸出格式,避免額外製作許多的不同格式相互轉換工具,增進成本效率。
XML Topic Maps(XTM)
主題地圖(Topic Maps)在數位圖書館的應用上,應用XML的語法仍是主流,由於其不錯的結構性,能使主題地圖的架構相當完整,近期文獻所討論的是利用XTM來標示數位化物件,可依其主題加以串聯,用來儲存和取得metadata與數位物件的群體知識及推衍關係,開發出以XML Topic Maps為主的知識管理平台,也就是更進一步,使數位圖書館不只是metadata與數位物件之管理系統或是一個主題索引。我認為XML的技術能將資源加以整合,讓主題地圖與實體資源充分的相互結合,同時具有良好的結構性,無論在搜尋檢索上,或是系統管理互通方面,XML的技術皆能帶來相當大的助益。
關於ODF與OpenXML
關於開放文件格式的議題,ODF與OpenXML兩者先前的明爭暗鬥,引起熱烈的討論,主要兩者皆以XML技術作為開放格式的基礎,致力於文件資料與資訊內容的交換格式與互通性。對數位圖書館而言,無論最後誰為主流,其互通性與整合性皆能改善工作效率,而有更便利的使用方式。如此也勢必會帶來衝擊,當XML技術與開放電子文件格式被泛用時,許多轉換與跨區域型的標準與協議就顯得沒那麼重要了,而圖書館管理系統的各作業流程上,是否也應該有所調整(甚至是丕變),同時還須考慮長期保存上,這樣的方式是否適合等相關問題的前瞻與評估,我想這些都是令人期待也需要深思的。
我的看法是,除非有更好的技術被開發出來,XML必定會泛用在各領域層面上,圖書館界也不例外,圖書館的資訊系統會因而有所轉變,無論是內部作業或是使用者介面,它將會帶來更簡潔同時更精確的檢索。文件之間的傳遞將發展到另一個階段,在XML的格式下,其實已經不需要文件交換格式,因為XML可以充分整合與相容,未來所發展出的標準將圍繞在XML的互通上。在開放文件格式普及化之後,民眾對XML的了解也會有所提升,他們的檢索策略與資訊需求行為同樣會受到影響,圖書館所要做的是,評估以及討論如何將XML融入圖書館的系統中才是最適當的方式,並充分發揮其特性,進而提供更好的服務。
參考資料:
林信成。「XML相關技術與Web出版趨勢之研究」。教育資料與圖書館學,第三十七卷,第二期,頁184-210,民88年12月。
陳昭珍。「以XML技術設計詮釋資料格式(Metadata)及數位圖書館管理系統之理論與實作」。大學圖書館,5卷2期,頁12-24,民90年9月。
林信成、楊翔淳。「以XML與CMARC為基礎之編目模組與WebOPAC/WAPOPAC設計」。大學圖書館,8卷1期,頁44-70,民93年3月。
http://www.lib.ncu.edu.tw/book/n39/39-2b.htm
http://zh.wikipedia.org/wiki/XML
http://blog.xuite.net/anti_ms/index?st=c&w=192157&re=list&p=1
http://taiwan.cnet.com/news/software/0,2000064574,20104823,00.htm