帳號:
密碼:
最新動態
 
產業快訊
CTIMES / 文章 /
漫談網格資料庫
 

【作者: 張東淼】   2007年03月27日 星期二

瀏覽人次:【5460】

前言

資料庫相關技術的發展,總是離不開資訊科技演進的影子,早在70年代的大型 mainframe 時代,資料庫總是隱身在大型主機身上;及至80年代的PC盛行,資料庫系統也隨之現身在各式PC的身上。當物件導向技術逐漸走向成熟時,資料庫系統也跟著這股浪潮,推向物件的世界。90年代是一個屬於網際網路的時代,各式各樣的應用都搬到了虛擬網路的世界,資料庫也不例外地加入了這股無法抵擋的趨勢;而其中網格運算( grid computing )更是扮演舉足輕重的地位。誠如 Wells(1) 所言,網格運算即將改變人們使用電腦的方式,亦即,今日電腦可以透過網際網路各自交換資訊,在可預見的未來,網格將會是個虛擬網路中的池子(Pool),提供足夠的計算能力,來解決許多目前仍無法順利進行的大量運算問題。 當然,以往常見的計算機科學概念,移到網格的世界之後,亦會有另一番新意。


若單從資料庫技術發展及應用也會發現遵循著相同的足跡,從早期的各式資料庫模型到80年代盛行的關聯式資料庫(RDBMS)以及物件導向式資料庫(ODBMS),都可看出與資訊科學、程式語言發展密不可分的關係。在網格運算的世界裡,這些資料庫的基本元素也有了不同的詮釋,尤其是平行運算所強調的工作(job)化為許許多多同步進行的次工作來完成的特性,大大提高了資料的獨立性(data Independence)。因此,不論是儲存的實體或是存取的方式都有著不同以往的面貌。以下將從硬體元件及軟體發展,兩個不同的面向,來介紹網格資料庫所應俱備的各式元素。


網格資料庫的硬體基石:平行運算及網格環境

談到網格資料庫,就不得不聊聊平行運算,因為這正是建立網格資料庫的基石。平行運算的概念,也是來自硬體的發展;當硬體的開發日漸成熟,人們就希望在同樣的時間單位,PC能多做點事,其中有兩種方法可以達成目的,其一是增加運算能力,例如提高CPU 時脈及匯流排速度等;另一方面則可以利用平行運算的方式,讓更多機器在同一時間內共同工作。顯然地是後者在硬體開發成本上是比較佔優勢的。


平行運算的發展已有一段時日了,早些年多是在科學計算上,尤其是需要大量運算方面,如天氣資料或天文資訊的計算等。隨著PC的日漸普及,這些以往只能在超級電腦上才能進行的工作,也逐漸藉由平行運算的建置,轉移至小型PC上;因此,常聽到一些叢集電腦(clustering PC)的平行運算能力,大大超越傳統的超級電腦的消息。不過這些例子都只集中在某些特定的應用範圍,與一般大眾比較難有交集。直到90年代末期,網際網路的興起,一種架構在平行運算之上的 網格運算(grid computing)環境被提出,大家才真正感受到平行運算所帶來好處。所謂的網格是指一架構在網路基礎上的完全分散式系統,其系統不但可以橫跨各個不同的網路域(domain),也可以容納各種不同的硬體主機系統,而其上所提供的應用是以服務(service)形式存在,不論使用者或所需之資源都可動態分配;亦即這是一種非常有彈性的機制,可以根據使用者的需要及網路狀況,以及其使用權限而授予可用之資源。所以,網格所帶來的使用環境,早已超越先前平行運算所能提供的。對企業而言,網格不但能提供大量運算所需的計算能力,也可以以其建立虛擬平台,整合更多的硬軟體資源,提供單一使用介面,讓應用可擴及相關的企業伙伴。當然,在學術研究上的工程及科學計算方面,網格更是最佳的大型問題解決工具。


然而人們真正看到網格的能力,是在P2P 資料分享機制的出現。 P2P 一開始僅是網路上音樂檔案分享的機制,伴隨的是 Napster 及 Gnutella 兩個檔案分享模式,雖然 Napster 因智財權的問題而關閉,但其所提出的分享平台,卻如雨後春筍般的在網路世界出現,近來,人們也漸漸能接受這種分享機制,也看到了網格所能展現的無遠弗屆的傳播能力。其實,這只是網格世界的冰山一角,尤其是在硬體建罝成本逐年下降之後,網格的硬體環境日趨成熟,網際網路更是架構了一個虛擬的網格世界;目前已有愈來愈多的應用,轉移至網格的平台來使用。除了上述的檔案分享之外,Skype 亦利用相同的網格概念,來傳送語音資料;電玩公司亦走相同的分享機制來建立龐大的線上遊戲世界。


網格資料庫的軟體之路

光有硬體的支援,並不足以支撐起網格資料庫系統;上節所談的硬體發展,只是資料庫系統最底層的硬體儲存單位,完整的資料庫系統則包含了資料結構、操作命令、安全管控以及儲存元件等部份。在資料庫技術的發展歷史中,資訊科技一直扮演重要的推手。其中最重要的改變是在70年代初期,Dr. Codd 所提出的關聯式資料庫的概念,在此之前有關資料庫的理論與實作,都是以作業系統的檔案結構,當做建構資料庫的基礎單元;而有了關聯式資料庫的理論架構之後,資料庫有了長足的進步,資料存取單元也從實體檔案結構,轉成以表格(table)當作最基本的結構。此一轉變不但讓資料庫系統的發展,逐漸擺脫硬體製造廠商的束縛,也讓資料庫系統找到了一更寬廣的發展空間。從大型主機到桌上型PC都有相應的資料庫可資利用,而在企業界的應用,更是擴及各行各業。


此後資料庫技術的發展,則與程式語言的演進有了更密切的關聯。例如當物件導向程式語言發展成熟,資料庫系統也從關聯式資料庫轉進到物件導向式資料庫。其中最主要的變革是資料結構導入物件的觀念,以及資料存取操作命令的改變,都讓資料的存取更有效率。當然,硬體的發展仍舊提供了最佳的支撐力量,尤其是儲存媒體的開發與儲存空間的倍增,都讓資料庫有更大發揮空間;不過,網路技術的發展則讓資料庫系統有了不一樣的面貌,以往的資料庫系統,都與硬體、作業系統息息相關,有了網路之後,人們開始有分散風險的想法,當然資料庫系統也從中央控制逐漸走向分散式的架構。此種分散式架構漸漸蔚為主流,其中又因平行運算技術的出現,更讓資料庫技術的開發活絡了好一陣子,各種不同的平行化理論及其實驗性平台,都一一出現在學術研究及市售的系統中。


直到90年代網際網路的出現,資料庫系統又注入了新的元素,這也是本文所要談及的網格資料庫。網格的發展當然是如上述硬體及網路技術的更新,不過要落實到資料庫系統之中,仍有許多必須考量的因素。


網格資料庫的建置

網格運算的環境所強調的即是,完全的分散式俱彈性的資源共享機制;然而對資料庫系統而言,所要求的不僅僅是將資料單元,當做物件分散到網路上而已,還必須考慮使用者權限、系統安全以及查詢效率等等因素。上一節所提及的平行運算即是提升系統效能的最有力工具。但是若只做到平行運算的要求,也僅是平行運算資料庫系統而已,並不能發揮網格的特性。若要完全運用到網格的能力,就必須做到分散式資料庫才行。以下是 Wells(1) 所提出的12項分散式資料庫應俱備的要求:


  • ●Local autonomy


  • ●No reliance on a central site


  • ●Continuous operation


  • ●Location independence


  • ●Fragmentation independence


  • ●Replication independence


  • ●Distributed query processing


  • ●Distributed transaction management


  • ●Hardware independence


  • ●Operating system independence


  • ●Network independence


  • ● DBMS independence



從上面的要求項目中,可以看出網格環境所強調的是分散、自主的精神。所以要打造一個網格資料庫系統,的確存在一些門檻;並不是換換資料庫系統或是更新一些硬體設備即可達成的。若一切都是從頭建立,那也許是最簡單的解決方式,問題是有許多的硬體早已購買,也有許多資料庫系統早已上線服役多年,並不是用汰換的方式可以解決的。如何整合現有的系統,遂成為近來學術研究的熱門題目。為了有效解決此問題,於是有了 OGSA-DAI(Open Grid Services Architecture


Data Access and Integration)中介軟體整合介面的提出。這是一個介面整合的框架(Framework),亦即任何有心想在現有系統中發展網格資料庫系統的,都可根據這個框架來自行開發相關程式。以下(圖一)與(圖二)即是此整合介面的示意圖。



《圖一    整合介面的示意圖(1)》
《圖一 整合介面的示意圖(1)》

《圖二    整合介面的示意圖(2)》
《圖二 整合介面的示意圖(2)》

由於這是個中介軟體是採開放式的架構,所需的相關開發工具,可從網站上自行下載安裝。這個中介軟體也使用了許多開放原始碼(open source)程式,所以使用者可自行依本身的硬軟體配置,自行撰寫或修改程式,以符合本身的系統需求。


結語

隨著資訊技術的不斷演進,資料庫系統一直扮演著重要的角色;在進入網際網路的新世代,資料庫及其應用依然有著鮮明的標記。在可預見的未來,無論是透過何種機制來整合舊有的資料庫系統,或是利用更先進的資訊通訊技術,網格資料庫系統及其相關技術,無疑是未來發光發熱的明日之星。(作者為玄奘大學資傳所助理教授)


(資料來源:參考文獻


Wells, April J. ,‘Grid Database Design’, Auerbach Publications (2005)


Xiufen Fu et al, ‘Research of the Access and Integration of Grid Database’, ‘Proceedings of the 10th International Conference on Computer Supported Cooperative Work in Design’ (2006)


http://www.ogsadai.org.uk/)


相關文章
Android裝置多核心系統設計策略
多核心電腦帶來軟體應用的困擾
伺服器系統大吹多心風
多核心伺服器處理器架構介紹(下)
多核心伺服器處理器架構介紹(上)
相關討論
  相關新聞
» 偏鄉醫療IDS再升級 增加全人整合照護成效
» 台灣大哥大IDC雲端機房提早6年實現使用100%再生能源達標
» ESG智能永續數據平台2.0正式上線
» Anritsu 安立知全新非地面網路專題網站亮相,支援裝置開發
» 中嘉寬頻攜手NOKIA商轉MoCA Access網路技術服務


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2025 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.2048.172.69.7.15
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: [email protected]