數據庫技術

數據庫技術

信息系統的核心技術
數據庫技術是一種核心的信息系統技術,是一種借助計算機來輔助管理數據的方式。數據庫技術最根本的作用實際上是存儲數據、組織數據,并且還能夠處理和獲取數據信息。數據庫技術能夠合理應用數據庫設計、結構、相關應用、存儲管理等方法以及基本理論,并且分析處理數據庫中的相關數據信息。數據庫技術在應用的時候主要研究目标可以在一定程度上決定數據庫研究實際内容。所以數據庫技術最根本的就是利用數據來建立管理數據的相關數據庫,依據應用系統能夠處理分析數據信息,依據數據庫的管理系統能夠分析處理、修改、删除、添加相關數據信息。[1]
    中文名:數據庫技術 外文名: 所屬學科: 産生時間:20世紀60年代末70年代初 研究内容:結構、存儲、設計 公司:IBM公司

概述

數據庫技術是通過研究數據庫的結構、存儲、設計、管理以及應用的基本理論和實現方法,并利用這些理論來實現對數據庫中的數據進行處理、分析和理解的技術。即:數據庫技術是研究、管理和應用數據庫的一門軟件科學。

數據庫技術研究和管理的對象是數據,所以數據庫技術所涉及的具體内容主要包括:通過對數據的統一組織和管理,按照指定的結構建立相應的數據庫和數據倉庫;利用數據庫管理系統和數據挖掘系統設計出能夠實現對數據庫中的數據進行添加、修改、删除、處理、分析、理解、報表和打印等多種功能的數據管理和數據挖掘應用系統;并利用應用管理系統最終實現對數據的處理、分析和理解。

發展應用

從20世紀60年代末期開始到如今,數據庫技術已經發展了30多年。在這30多年的曆程中,人們在數據庫技術的理論研究和系統開發上都取得了輝煌的成就,而且已經開始對新一代數據庫系統的深入研究。數據庫系統已經成為現代計算機系統的重要組成部分。

數據庫最初是在大公司或大機構中用作大規模事務處理的基礎。後來随着個人計算機的普及,數據庫技術被移植到PC機(PersonalComputer,個人計算機)上,供單用戶個人數據庫應用。接着,由于PC機在工作組内連成網,數據庫技術就移植到工作組級。如今,數據庫正在Internet和内聯網中廣泛使用。

20世紀60年代中期,數據庫技術是用來解決文件處理系統問題的。當時的數據庫處理技術還很脆弱,常常發生應用不能提交的情況。20世紀70年代關系模型的誕生為數據庫專家提供了構造和處理數據庫的标準方法,推動了關系數據庫的發展和應用。1979年,Ashton-Tate公司引入了微機産品dBaseⅡ,并稱之為關系數據庫管理系統,從此數據庫技術移植到了個人計算機上。20世紀80年代中期到後期,終端用戶開始使用局域網技術将獨立的計算機連接成網絡,終端之間共享數據庫,形成了一種新型的多用戶數據處理,稱為客戶機/服務器數據庫結構。如今,數據庫技術正在被用來同Internet技術相結合,以便在機構内聯網、部門局域網甚至WWW上發布數據庫數據。

基本概念

數據庫技術涉及到許多基本概念,主要包括:信息,數據,數據處理,數據庫,數據庫管理系統以及數據庫系統等。

數據庫技術是現代信息科學與技術的重要組成部分,是計算機數據處理與信息管理系統的核心。數據庫技術研究和解決了計算機信息處理過程中大量數據有效地組織和存儲的問題,在數據庫系統中減少數據存儲冗餘、實現數據共享、保障數據安全以及高效地檢索數據和處理數據。數據庫技術的根本目标是要解決數據的共享問題。

發展

數據管理技術是對數據進行分類,組織,編碼,輸入,存儲,檢索,維護和輸出的技術。數據管理技術的發展大緻經過了以下三個階段:人工管理階段;文件系統階段;數據庫系統階段。

人工管理階段

20世紀50年代以前,計算機主要用于數值計算。從當時的硬件看,外存隻有紙帶,卡片,磁帶,沒有直接存取設備;從軟件看(實際上,當時還未形成軟件的整體概念),沒有操作系統以及管理數據的軟件;從數據看,數據量小,數據無結構,由用戶直接管理,且數據間缺乏邏輯組織,數據依賴于特定的應用程序,缺乏獨立性。

文件系統階段

50年代後期到60年代中期,出現了磁鼓,磁盤等數據存儲設備。新的數據處理系統迅速發展起來。這種數據處理系統是把計算機中的數據組織成相互獨立的數據文件,系統可以按照文件的名稱對其進行訪問,對文件中的記錄進行存取,并可以實現對文件的修改,插入和删除,這就是文件系統。文件系統實現了記錄内的結構化,即給出了記錄内各種數據間的關系。但是,文件從整體來看卻是無結構的。其數據面向特定的應用程序,因此數據共享性,獨立性差,且冗餘度大,管理和維護的代價也很大。

數據庫系統階段

60年代後期,出現了數據庫這樣的數據管理技術。數據庫的特點是數據不再隻針對某一特定應用,而是面向全組織,具有整體的結構性,共享性高,冗餘度小,具有一定的程序與數據間的獨立性,并且實現了對數據進行統一的控制。

數據模型

⒈2。1數據模型的概念及要素數據模型是現實世界在數據庫中的抽象,也是數據庫系統的核心和基礎。數據模型通常包括3個要素:

⑴數據結構。數據結構主要用于描述數據的靜态特征,包括數據的結構和數據間的聯系。

⑵數據操作。數據操作是指在數據庫中能夠進行的查詢,修改,删除現有數據或增加新數據的各種數據訪問方式,并且包括數據訪問相關的規則。

⑶數據完整性約束。數據完整性約束由一組完整性規則組成。

⒈2。2常用的數據模型

數據庫理論領域中最常見的數據模型主要有層次模型,網狀模型和關系模型3種。

⑴層次模型(HierarchicalModel)。層次模型使用樹形結構來表示數據以及數據之間的聯系。

⑵網狀模型(NetworkModel)。網狀模型使用網狀結構表示數據以及數據之間的聯系。

⑶關系模型(RelationalModel)。關系模型是一種理論最成熟,應用最廣泛的數據模型。在關系模型中,數據存放在一種稱為二維表的邏輯單元中,整個數據庫又是由若幹個相互關聯的二維表組成的。

⒈2。2常用的數據模型

當前,已經有一些流行的,也比較成熟的軟件産品能夠很好地支持關系型數據模型,這些産品也因此稱為關系型數據庫管理系統(RelationalDataBaseManagementSystem,RDBMS)。例如,微軟公司的MicrosoftAccess和MS-SQLServer,Sybase公司的Sybase,甲骨文公司的Oracle以及IBM公司的DB2。其中,MicrosoftAccess是一個中小型數據庫管理系統,适用于一般的中小企業;MS-SQLServer,Sybase和Oracle基本屬于大中型的數據庫管理系統;而DB2則屬于大型的數據庫管理系統,并且對計算機硬件有很高和專門的要求。

技術

信息技術(InformationTechnology,IT)是當今使用頻率最高的名詞之一,它随着計算機技術在工業、農業以及日常生活中的廣泛應用,已經被越來越多的個人和企業作為自己趕超世界潮流的标志之一。而數據庫技術則是信息技術中一個重要的支撐。沒有數據庫技術,人們在浩瀚的信息世界中将顯得手足無措。

數據庫技術是計算機科學技術的一個重要分支。從20世紀50年代中期開始,計算機應用從科學研究部門擴展到企業管理及政府行政部門,人們對數據處理的要求也越來越高。1968年,世界上誕生了第一個商品化的信息管理系統IMS(InformationManagementSystem),從此,數據庫技術得到了迅猛發展。在互聯網日益被人們接受的今天,Internet又使數據庫技術、知識、技能的重要性得到了充分的放大。如今數據庫已經成為信息管理、辦公自動化、計算機輔助設計等應用的主要軟件工具之一,幫助人們處理各種各樣的信息數據。

發展曆史

數據模型是數據庫技術的核心和基礎,因此,對數據庫系統發展階段的劃分應該以數據模型的發展演變作為主要依據和标志。按照數據模型的發展演變過程,數據庫技術從開始到如今短短的30年中,主要經曆了三個發展階段:第一代是網狀和層次數據庫系統,第二代是關系數據庫系統,第三代是以面向對象數據模型為主要特征的數據庫系統。數據庫技術與網絡通信技術、人工智能技術、面向對象程序設計技術、并行計算技術等相互滲透、有機結合,成為當代數據庫技術發展的重要特征。

系統

第一代數據庫系統是20世紀70年代研制的層次和網狀數據庫系統。層次數據庫系統的典型代表是1969年IBM公司研制出的層次模型的數據庫管理系統IMS。20世紀60年代末70年代初,美國數據庫系統語言協會CODASYL(ConferenceonDataSystemLanguage)下屬的數據庫任務組DBTG(DataBaseTaskGroup)提出了若幹報告,被稱為DBTG報告。DBTG報告确定并建立了網狀數據庫系統的許多概念、方法和技術,是網狀數據庫的典型代表。在DBTG思想和方法的指引下數據庫系統的實現技術不斷成熟,開發了許多商品化的數據庫系統,它們都是基于層次模型和網狀模型的。

可以說,層次數據庫是數據庫系統的先驅,而網狀數據庫則是數據庫概念、方法、技術的奠基者。

數據庫系統

第二代數據庫系統是關系數據庫系統。1970年IBM公司的SanJose研究試驗室的研究員EdgarF。Codd發表了題為《大型共享數據庫數據的關系模型》的論文,提出了關系數據模型,開創了關系數據庫方法和關系數據庫理論,為關系數據庫技術奠定了理論基礎。EdgarF。Codd于1981年被授予ACM圖靈獎,以表彰他在關系數據庫研究方面的傑出貢獻。

20世紀70年代是關系數據庫理論研究和原型開發的時代,其中以IBM公司的SanJose研究試驗室開發的SystemR和Berkeley大學研制的Ingres為典型代表。大量的理論成果和實踐經驗終于使關系數據庫從實驗室走向了社會,因此,人們把20世紀70年代稱為數據庫時代。20世紀80年代幾乎所有新開發的系統均是關系型的,其中湧現出了許多性能優良的商品化關系數據庫管理系統,如DB2、Ingres、Oracle、Informix、Sybase等。這些商用數據庫系統的應用使數據庫技術日益廣泛地應用到企業管理、情報檢索、輔助決策等方面,成為實現和優化信息系統的基本技術。

第三代數據庫系統

從20世紀80年代以來,數據庫技術在商業上的巨大成功刺激了其他領域對數據庫技術需求的迅速增長。這些新的領域為數據庫應用開辟了新的天地,并在應用中提出了一些新的數據管理的需求,推動了數據庫技術的研究與發展。

1990年高級DBMS功能委員會發表了《第三代數據庫系統宣言》,提出了第三代數據庫管理系統應具有的三個基本特征:

應支持數據管理、對象管理和知識管理。必須保持或繼承第二代數據庫系統的技術。必須對其他系統開放。

四個方向

規模會向兩頭發展—大的越來越大,小的越來越小。所謂大的,指的是企業級數據庫的規模。前10年,數據庫存儲的數據大都以GB為基準衡量,幾十GB就已經非常龐大。而如今,隻廣東移動每個月新增的數據量,就已經以TB衡量,不出3年,很多企業要存儲的數據就要達到PB級。數據量越來越大,需要更大的數據庫做支撐,這就是數據庫的發展方向之一。另一方面,數據庫也會越來越小。如今,Sybase的數據庫已經安裝在高檔的Casio手表中了,這些手表中記錄的有天氣情況、氣壓、佩帶者的血壓、心跳等數據。這種數據庫并不要求數據存儲量大,但是要求在低計算量的情況下反應快,而且能夠适應外界環境的變化。存儲方式從行到列的改變。

以前數據庫都是以行的形式存儲的,理由很簡單,用戶需要的是對單條數據的讀取和存儲。而如今,單純的數據記錄已經不足以支撐企業發展了,企業更需要的是數據分析和決策支持。那麼,單純看一條記錄沒有任何意義,而是要把所有數據的某一項都統計出來進行分析,這就是列的概念。以中國移動為例,上億個用戶,每個月上TB的數據,哪些是ⅥP用戶,該如何根據他們的需求提供專有服務,對于那些動感地帶的用戶,到底應該制定哪些優惠政策,除了看話費,是不是還能挖掘出他們的消費特點,進行更有針對性的業務推廣活動?這些,就不是看一條數據的問題,而需要頻繁對列進行操作。預計,不出半年,各大數據庫廠商都會推出以列為存儲方式的數據庫。

非結構化數據仍然不能納入數據庫中。說到這裡,可能大家都認為我在逆潮流而動,如今很多數據庫廠商都可以接受圖像、視頻等非結構化數據了,Sybase怎麼還要死守着結構化數據呢?其實我認為,非結構化數據要想進入數據庫,仍然需要結構化,隻是這種結構化的方法各廠商不一樣,而且相比以前有了很大的進步和提高。以前我們圖片的記錄方式是記錄它的文件名,如果文件名中提到了某個人的名字,那麼在整個數據庫查詢的時候,就可以把這個圖片找到。而這是非常不科學的,因為很多非結構化數據的文件名起的并不可能完全。

那麼,如今大家把非結構化的數據變得結構化,其實就是在用結構化的數據描述這張圖片,比如用點和位置來記錄這張圖片的每個像素。而一旦需要做查詢的時候,可以根據像素的組合記錄來比對,把符合比對要求的數據全部篩選出來。這樣就把非結構化數據以結構化的方式納入數據庫中了,并能接受查詢、檢索等操作。數據庫和數據倉庫會分開。很多數據庫廠商認為,數據庫一個就行,一專多能,既能用它進行實時交易,也能用它來進行數據分析。但是,其實很多用戶如今在前台需要數據庫提供實時交易功能,需要有很快的響應速度,而在後台,則需要設立一些規則進行數據分析和商務智能分析。Sybase就認為,這兩個數據庫應該是兩種格式,畢竟它們的功能不一樣。因此,從産品設置上,Sybase有交易型數據庫和分析型數據庫兩種。

發展趨勢

下一代數據庫技術的發展主流

針對關系數據庫技術現有的局限性,理論界如今主要有三種觀點:

面向對象的數據庫技術将成為下一代數據庫技術發展的主流部分學者認為現有的關系型數據庫無法描述現實世界的實體,而面向對象的數據模型由于吸收了已經成熟的面向對象程序設計方法學的核心概念和基本思想,使得它符合人類認識世界的一般方法,更适合描述現實世界。甚至有人預言,數據庫的未來将是面向對象的時代。

面向對象的關系數據庫技術關系數據庫幾乎是當前數據庫系統的标準,關系語言與常規語言一起幾乎可完成任意的數據庫操作,但其簡潔的建模能力、有限的數據類型、程序設計中數據結構的制約等卻成為關系型數據庫發揮作用的瓶頸。面向對象方法起源于程序設計語言,它本身就是以現實世界的實體對象為基本元素來描述複雜的客觀世界,但功能不如數據庫靈活。因此部分學者認為将面向對象的建模能力和關系數據庫的功能進行有機結合而進行研究是數據庫技術的一個發展方向。

面向對象數據庫技術面向對象數據庫的優點是能夠表示複雜的數據模型,但由于沒有統一的數據模式和形式化理論,因此缺少嚴格的數據邏輯基礎。而演繹數據庫雖有堅強的數學邏輯基礎,但隻能處理平面數據類型。因此,部分學者将兩者結合,提出了一種新的數據庫技術——演繹面向對象數據庫,并指出這一技術有可能成為下一代數據庫技術發展的主流。

數據庫技術發展的新方向

非結構化數據庫是部分研究者針對關系數據庫模型過于簡單,不便表達複雜的嵌套需要以及支持數據類型有限等局限,從數據模型入手而提出的全面基于因特網應用的新型數據庫理論。支持重複字段、子字段以及變長字段并實現了對變長數據和重複字段進行處理和數據項的變長存儲管理,在處理連續信息(包括全文信息)和非結構信息(重複數據和變長數據)中有着傳統關系型數據庫所無法比拟的優勢。但研究者認為此種數據庫技術并不會完全取代如今流行的關系數據庫,而是它們的有益的補充。

數據庫技術發展的又一趨勢

有學者指出:數據庫與學科技術的結合将會建立一系列新數據庫,如分布式數據庫、并行數據庫、知識庫、多媒體數據庫等,這将是數據庫技術重要的發展方向。其中,許多研究者都對多媒體數據庫作為研究的重點,并認為多媒體技術和可視化技術引入多媒體數據庫将是未來數據庫技術發展的熱點和難點。

未來數據庫技術及市場發展的兩大方向數據倉庫電子商務部分學者在對各個數據庫廠商的發展方向和應用需求的不斷擴展的現狀進行分析的基礎上,提出數據庫技術及市場在向數據倉庫和電子商務兩個方向不斷發展的觀點。他們指出:從上一年開始,許多行業如電信、金融、稅務等逐步認識到數據倉庫技術對于企業宏觀發展所帶來的巨大經濟效益,紛紛建立起數據倉庫系統。在中國提供大型數據倉庫解決方案的廠商主要有Oracle、IBM、Sybase、CA及Informix等廠商,已經建設成功并已收回投資的項目主要有招商銀行系統和國信證券系統等。

當前,國内外學者對數據倉庫的研究正在繼續深入。與此同時,一些學者将數據庫技術及市場發展的視角瞄準電子商務領域,他們認為:如今的信息系統逐漸要求按照以客戶為中心的方式建立應用框架,因此勢必要求數據庫應用更加廣泛地接觸客戶,而Internet給了我們一個非常便捷的連接途徑,通過Internet我們可以實現所謂的OneOneMarketing和OneOnebusiness,進而實現Ebusiness。因此,電子商務将成為未來數據庫技術發展的另一方向。

面向專門應用領域的數據庫技術許多研究者從實踐的角度對數據庫技術進行研究,提出了适合應用領域的數據庫技術如工程數據庫、統計數據庫、科學數據庫、空間數據庫、地理數據庫等。這類數據庫在原理上也沒有多大的變化,但是它們卻與一定的應用相結合,從而加強了系統對有關應用的支撐能力,尤其表如今數據模型、語言、查詢方面。部分研究者認為,随着研究工作的繼續深和數據庫技術在實踐工作中的應用,數據庫技術将會更多朝着專門應用領域發展。

基本概念

數據和數據處理

數據(Data)是用于描述現實世界中各種具體事物或抽象概念的,可存儲并具有明确意義的符号,包括數字,文字,圖形和聲音等。數據處理是指對各種形式的數據進行收集,存儲,加工和傳播的一系列活動的總和。其目的之一是從大量的,原始的數據中抽取,推導出對人們有價值的信息以作為行動和決策的依據;目的之二是為了借助計算機技術科學地保存和管理複雜的,大量的數據,以便人們能夠方便而充分地利用這些寶貴的信息資源。

數據庫

數據庫(DataBase,DB)是存儲在計算機輔助存儲器中的,有組織的,可共享的相關數據集合。數據庫具有如下特性。

⑴數據庫是具有邏輯關系和确定意義的數據集合。

⑵數據庫是針對明确的應用目标而設計,建立和加載的。每個數據庫都具有一組用戶,并為這些用戶的應用需求服務。

⑶一個數據庫反映了客觀事物的某些方面,而且需要與客觀事物的狀态始終保持一緻。

數據庫管理系統及其基本功能

數據庫管理系統(DataBaseManagementSystem,DBMS)是對數據庫進行管理的系統軟件,它的職能是有效地組織和存儲數據,獲取和管理數據,接受和完成用戶提出的各種數據訪問請求。能夠支持關系型數據模型的數據庫管理系統,稱為關系型數據庫管理系統(RelationalDataBaseManagementSystem,RDBMS)。

RDBMS的基本功能包括以下4個方面:

⑴數據定義功能:RDBMS提供了數據定義語言(DataDefinitionLanguage,DDL),利用DDL可以方便地對數據庫中的相關内容進行定義。例如,對數據庫,表,字段和索引進行定義,創建和修改。

⑵數據操縱功能:RDBMS提供了數據操縱語言(DataManipulationLanguage,DML),利用DML可以實如今數據庫中插入,修改和删除數據等基本操作。

⑶數據查詢功能:RDBMS提供了數據查詢語言(DataQueryLanguage,DQL),利用DQL可以實現對數據庫的數據查詢操作。

⑷數據控制功能:RDBMS提供了數據控制語言(DataControlLanguage,DCL),利用DCL可以完成數據庫運行控制功能,包括并發控制(即處理多個用戶同時使用某些數據時可能産生的問題),安全性檢查,完整性約束條件的檢查和執行,數據庫的内部維護(例如索引的自動維護)等。RDBMS的上述許多功能都可以通過結構化查詢語言(StructuredQueryLanguage,SQL)來實現的,SQL是關系數據庫中的一種标準語言,在不同的RDBMS産品中,SQL中的基本語法是相同的。此外,DDL,DML,DQL和DCL也都屬于SQL。

⒈3。4數據庫應用系統及其組成

數據庫應用系統又簡稱為數據庫系統,是指擁有數據庫技術支持的計算機系統,它可以實現有組織地,動态地存儲大量相關數據,提供數據處理和信息資源共享服務的功能。

各類人員主要參與數據庫應用系統的需求分析,設計,開發,使用,管理和維護,他們在數據庫應用系統的開發,運行及維護等階段扮演着不同的角色,并起着不同的作用。各類人員主要包括以下幾種。

⑴最終用戶。

⑵系統分析員。

⑶應用程序員。

⑷數據庫管理員(DataBaseAdministrator,DBA)。

應用方式

從其應用方式來看,數據庫技術主要起着兩方面的作用。

⑴信息系統開發作用。利用數據庫技術以及互聯網技術,并結合具體的編程語言,可以開發一個信息系統,從而解決業務數據的輸入和管理問題。在信息系統開發中,主要利用的是RDBMS的基本功能,即數據定義功能,數據操縱功能,數據查詢功能以及數據控制功能。

⑵數據分析與展示作用。利用RDBMS的數據查詢功能對數據庫中的數據進行關聯組合或逐級彙總分析,并以表格,圖形或報表形式将分析結果進行展示,從而解決業務數據的綜合利用問題。

相關詞條

相關搜索

其它詞條