當前位置:歷史故事大全網 - 歷史上的今天 - 基礎數據庫

基礎數據庫

(1)數據內容

基本數據庫包括系統運行前收集的所有支持數據。數據的具體內容已經在數據分類和數據來源壹章中進行了描述,可以歸納為以下幾類。

(1)遙感影像數據:包括歷史影像數據和按照壹定監測周期更新的遙感影像數據。

(2)數字線劃數據:矢量數據(當前專題地圖和歷史專題地圖數據)、柵格數據、元數據等。入庫前,數據以ArcInfoCoverage格式分幀或整體存儲,采用地理坐標系。

(3)數字柵格地圖數據:包括1:5萬的掃描柵格數據和1:1萬的基礎地理圖形數據。

(4)數字高程模型數據:塔裏木河幹流1 ∶ 1,000、“四源壹幹”地區1 ∶ 1,000,000數字高程模型。

(5)多媒體資料:照片、視頻、錄音、虛擬演示結果等多媒體資料的調查。

(6)屬性數據:社會經濟和水資源數據、水利工程數據、生態環境數據等。

(2)數據存儲結構

1.柵格數據

柵格數據包括遙感影像、數字柵格地圖、數字正射影像圖、數字高程模型等。這些數據的存儲結構基本相似,可以統壹設計。遙感影像數據庫與普通影像數據庫在存儲上存在壹些差異。遙感圖像作為不同條件下(如光譜輻射特性、微波輻射特性)傳感器對地理空間環境的測量結果,必須結合同時獲得的多幅圖像才能被認為是對壹定時間條件下環境的完整描述,也就是說,可能需要壹個圖像集合才能形成壹幅圖像的完整概念,並使其與語義信息相關聯(洛瑞等,2000)。因此,遙感影像數據的存儲結構模型必須能夠描述若幹影像(波段)之間的邏輯關系。使用ArcSDE進行數據存儲時,系統可以自動建立影像(波段)之間的關系,並按照壹定的規則存儲在數據庫系統中。

柵格數據將由Oracle數據庫管理系統在後臺存儲。Oracle系統可以直接存儲影像信息,具有很強的數據管理能力,可以實現柵格數據信息的快速檢索和提取。數據引擎采用ArcSDE實現各種影像數據的存儲。數據存儲的關鍵是建立地圖索引,本系統的數據存儲按照地圖編號、地圖名稱、采集時間等進行索引。

根據圖形屬性壹體化的存儲思想,柵格數據直接以大二進制格式存儲,可以實現內容的快速檢索和查詢,根據索引表檢索相關項後可以直接打開,提高了柵格數據的管理效率。

2.矢量數據

該系統采用圖屬壹體化的思想,即將空間數據和屬性數據合二為壹,全部存在於壹個記錄集中,是目前非常流行的GIS數據存儲方式。考慮到數據的具體情況,決定使用數據庫來存儲空間數據和屬性數據。壹些帶有少量定型幾何信息的地理要素,如水文站、河流、湖泊等。,使用圖-屬壹體化的思想存儲它們的信息,而與它們相關的大量多邊屬性信息,如水文信息,則存儲在屬性數據表中,並使用唯壹標識符信息建立兩個表之間的關聯。

系統根據本系統中空間數據的特點,按照“數據庫-子數據庫-專題(基礎數據)-圖層-要素-屬性”的層次框架構建空間數據庫,按照統壹的地理坐標系存儲空間數據,實現地理實體/專題要素的分層疊加顯示。

3.多媒體數據

Oracle系統可以直接存儲圖片和視頻信息,具有強大的數據管理能力,可以實現多媒體信息的快速檢索和提取。多媒體數據存儲的關鍵是建立索引表。該系統中的多媒體數據存儲按照類型、時間和內容等項目進行索引,並直接存儲在Oracle數據庫中。

存儲多媒體數據時,多媒體內容可以與索引表結構集成,直接以大二進制格式存儲。這種存儲方式可以實現內容的快速檢索和查詢,根據索引表檢索相關條目後可以直接打開多媒體內容,多媒體數據庫也便於維護和管理。

(3)空間索引設計

1.向量空間索引

確定合適的格網級數和單元大小是建立空間格網索引的關鍵。網格太大,壹個網格中有很多空間實體,查詢檢索準確率低。如果網格過小,索引數據會成倍增加,出現冗余,檢索速度和效率會很低。每個數據層可以采用不同大小和級別的空間索引網格單元,但每壹級的數量最多不能超過三個。索引模式設置遵循以下基本原則:

(1)對於簡單元素的數據層,盡可能選擇單級索引網格,減少RDBMS搜索網格單元的索引數量,縮短空間索引搜索的過程;

(2)如果數據層中元素的包裝邊界大小變化較大,應選擇2級或3級索引網格;

(3)如果用戶經常對圖層進行相同的查詢,最佳網格大小應為65438+平均查詢範圍的0.5倍;

(4)網格的尺寸不能小於元素封裝邊界的平均尺寸。為了減少每個網格單元具有多個元素封裝邊界的可能性,網格單元的大小應該是元素封裝邊界平均大小的3倍;

(5)網格單元的大小不是壹個確定性的問題,需要多次嘗試和努力才能得到好的結果。確定網格初值有壹些原則,可以用來進壹步確定最優網格尺寸。

SDE(Spatial Data Engine)是壹種從空間管理角度出發的連續空間數據模型,它可以將地理要素的空間數據和屬性數據集成到壹個關系數據庫管理系統中。關系數據庫系統支持海量數據的存儲,也可以實現空間數據的海量存儲。空間數據可以分層,將壹類具有共同屬性的元素放在壹層,每個數據庫記錄對應壹層中的壹個實際元素,避免了搜索整個數據表,減少了檢索數據記錄的數量,從而減少了磁盤輸入/輸出的操作,加快了空間數據的查詢。

ArcSDE使用格網索引將空間區域劃分為大小合適的正方形格網,記錄每個格網包含的空間實體(對象)以及每個實體的打包邊界範圍,即空間實體周圍左下角和右上角的坐標。當用戶進行空間查詢時,首先計算用戶查詢對象的網格,然後通過網格號快速檢索到所需的空間實體。因此,確定合適的網格級數和單元大小是建立空間網格索引的關鍵。過大或過小都不合適,這需要多次嘗試才能確定合適的網格大小,以保證所有單元格都能均勻落在網格中。利用ArcSDE的索引表創建功能,記錄每個網格單元的實體分布,形成圖層空間索引表。根據空間索引表,ArcSDE實現了空間數據的快速查詢。

2.柵格數據的空間索引

通過建立多級金字塔結構實現柵格數據的空間索引。以高分辨率柵格數據為底層,逐層提取數據,建立不同分辨率的數據金字塔結構,逐層形成較低分辨率的柵格數據。這種方法通常會增加20%左右的存儲空間,但可以提高柵格數據的顯示速度。在搜索數據庫時,調用適當級別的柵格數據可以提高瀏覽和顯示速度。

(4)入庫數據的驗證

倉儲數據的質量關系到系統評估和分析結果的準確性。生產中需要嚴格控制數據。根據數據生產過程,數據質量控制分為生產過程控制和結果控制。生產過程控制包括數據生產前期的質量控制和數據生產過程中的實時質量控制,結果質量控制是數據生產完成後的質量控制(裴亞波等,2003)。入庫數據的核查主要是為了數據生產完成後的質量控制和檢查。

1.標準化檢查

(1)代碼標準化:所有地理代碼盡量采用國家標準和行業標準,如行政代碼采用中華人民共和國行政區劃代碼國家標準。

(2)數據格式標準化:所有數據均采用標準交換數據格式,如矢量數據采用標準輸出覆蓋格式和E00格式。

(3)屬性數據和關系數據字段的規範化:預先對所有屬性數據和關系數據進行分類,設計字段的內容、長度和格式,在操作時嚴格執行。

(4)坐標系標準化:本系統中所有與空間有關的數據都采用統壹的空間坐標系,即地理坐標系。

(5)精度標準化:所有數據按照數據精度和質量控制中要求的精度進行采集和處理。

(6)命名標準化:所有數據按照命名要求統壹命名,便於系統查詢。

(7)元數據的規範化:根據元數據標準的要求檢查元數據。

2.質量管理

數據質量是地理信息系統成功的關鍵。對於關系數據庫的設計,只要能保證表的實體完整性和引用完整性,並且能符合關系數據庫的三大範式即可。對於空間數據庫設計,不僅要考慮數據采樣、數據處理流程、空間配準、投影變換等問題,還要對數據質量進行定量分析。

數據質量壹般可以用以下幾個方面來描述(吳芳華等,2001):

(1)精度:即測量值與真值的接近程度,可以用誤差來衡量;

(2)精度:對現象描述的詳細程度;

(3)不確定性:指壹種無法精確測量的現象,當真實值不可預測或未知時,無法確定誤差,因此用不確定性代替誤差;

(4)兼容性:指在同壹個應用程序中使用兩個不同來源的數據的難度;

(5)壹致性:指同壹現象或相似現象在表述上的壹致程度;

(6)完備性:指相同準確度和精度的數據在類型上和特定空間範圍內的完備程度;

(7)可訪問性:指獲取或使用數據的容易程度;

(8)時效性:指數據反映客觀現象現狀的程度。

對數據質量進行評估後,塔裏木河流域生態環境動態監測系統的所有數據都需要進行數據格式和坐標壹致性檢查,只有通過質量檢查的數據才能入庫。

3.數據驗證

空間數據質量檢查包括以下步驟:

(1)數據命名是否規範,是否按照設計要求命名;

(2)數據能否正常打開;

(3)投影方式是否正確;

(4)坐標系是否正確;

(5)糾錯是否完成,拓撲關系是否建立;

(6)屬性數據是否正確,包括字段設置是否按照設計進行,是否有空的屬性記錄,是否有屬性錯誤記錄等。

關系數據的質量檢查包括以下步驟:

(1)數據命名是否規範,是否按照設計要求命名;

(2)數據能否正常打開;

(3)數據字段是否按設計要求設置;

(4)是否有空的屬性記錄;

(5)是否有屬性錯誤記錄。

屬性數據驗證主要采用以下三種方式:

(1)兩項驗證:將壹些互不相關的數據輸入兩次,編寫程序對兩項的結果進行比較,找出結果不同的數據,檢查正確的值並進行修正。

(2)折線圖測試:對於壹些相互關聯的序列數據,比如人口統計數據,對於這類數據,編寫程序將數據以折線圖的形式顯示在顯示器上。數據序列壹般有壹定的規則。如果出現較大波動,此時就需要對數據進行檢查和修改。

(3)計算驗證:對於某些數據,按照壹定的公式計算後,其結果與其他數據相關,如果某些數據的總和等於另壹個數據,則編寫程序計算這類數據,將計算結果與相關數據進行比較,找出結果不同的數據,檢查正確值並進行修正。

圖形數據的驗證主要包括以下步驟(陳俊傑等,2005):

(1)圖層驗證:圖形元素的放置圖層是唯壹的。對於倉儲覆蓋率數據,系統將根據層代碼進行檢查,以確保圖形元素位於正確的層。

(2)代碼檢查:圖形元素的代碼是唯壹的。對於倉儲覆蓋數據,系統會將倉儲要素代碼與要素表中的代碼進行比較,以確保倉儲數據代碼的存在,防止非法代碼入庫。

(3)類型檢查:對於接收到的數據,檢查元素的類型是否與特征表中的類型壹致,以確保圖形元素在表中就位。例如,點元素、線元素和面元素只能分配相應的點、線和面代碼,並且代碼必須與要素表中的數據類型代碼相同。

(4)範圍檢查:根據接收到的數據,確定大致範圍(如X,Y坐標等。)的範圍數據,並在接收數據之前將接收數據的大小與範圍數據進行比較。如果接收到的數據在此範圍內,將被接收,否則,將給出提示檢查消息。

(5)數據倉庫

1.遙感圖像數據

利用空間數據引擎ArcSDE可以實現遙感影像數據在Oracle數據庫中的存儲和管理,影像數據入庫時要添加相應的索引和影像描述字段。

遙感影像入庫步驟:

(1)影像數據預處理:將塔裏木河遙感影像數據庫建成多分辨率無縫影像數據庫系統,客觀上要求數據庫中的影像數據在幾何空間和灰度空間保持壹致。因此,在數據采集階段,需要對圖像數據進行預處理,包括圖像幾何校正、灰度拼接(無縫拼接)、正投影處理、投影變換等。

幾何校正的目的是將校正後的影像重新定位到壹種地圖投影方式,適用於各種定位、測量、多源影像合成以及與矢量地圖、DTM的嵌套顯示和處理。幾何校正大多采用二次多項式算法和雙線性插值重采樣方法進行圖像校正。將經過校正的指定地理編碼的圖像按照多邊形劃分成需要拼接的子區域,並逐個嵌入指定的模板中。同時進行必要的配色,使整體圖像色調壹致,完成圖像的幾何拼接。然後采用金字塔圖像數據結構和“由粗到細”的分層控制策略實現分步拼接。

數字正射影像圖具有統壹的大地坐標系、豐富的信息和真實的景觀表達,很容易制作出“與比例尺無關”的多級金字塔結構影像。數字正射影像可以通過DTM和外方位元素的數字微分糾正獲得,其基本參數包括原始影像和正射影像的比例尺、采樣分辨率等。(方濤等人,1997)。

投影變換需要根據數據庫系統定義的標準轉換到統壹的投影系統中。

(2)影像數據壓縮:隨著傳感器空間分辨率的提高和對遙感信息需求的增加,獲取的影像數據量呈幾何級數增長。如此龐大的數據會占用大量的存儲空間,給圖像的存儲和傳輸帶來不便(葛勇等,2000)。目前系統處理的遙感影像數據已經達到數百千兆,單個文件最大影像數據達到2G,調用和顯示時非常慢。壓縮和存儲圖像數據將大大提高圖像訪問的效率。該系統使用ArcSDE軟件提供的無損壓縮模式來壓縮輸入圖像。

(3)影像導入:可通過ArcSDE或存儲程序導入遙感影像,填寫相關索引信息。大規模的遙感影像數據會被自動分成若幹個瓦片進行存儲。

(4)影像金字塔構建:利用ArcSDE提供的金字塔構建工具,在入庫時自動生成影像金字塔,用戶只需選擇相應的參數設置即可。圖像金字塔及其層次圖像按照分辨率進行存儲和管理。最低分辨率最高,數據量最大。分辨率越低,數據量越小。這樣,不同分辨率的遙感影像就形成了壹個塔式結構。這種影像金字塔結構建立的遙感影像數據庫,便於組織、存儲和管理多尺度、多數據源的遙感影像數據,實現了跨分辨率的索引和瀏覽,大大提高了影像數據的瀏覽和顯示速度。

2.數字線條畫

紙質地圖經過數字化、配準、校正、分層、拼接後,生成標準分幅、拼接存儲的數字矢量地圖,圖形數據即可入庫。

(1)分幅矢量圖形數據和接片表:根據圖形比例尺、張數、制作時間、圖層等。,通過入庫程序導入數據庫,同時導入地理信息對應的屬性信息,建立空間信息與屬性信息的關聯。

(2)鑲嵌矢量圖形數據:根據圖形比例尺、制作時間、圖層等。,通過入庫程序導入數據庫,同時導入地理信息對應的屬性信息,建立空間信息與屬性信息的關聯。

3.柵格數據

紙質地圖經過數字化、配準、校正、分層、拼接,生成標準分幅、整體存儲的數字柵格地圖,然後圖形數據入庫。

(1)分幀光柵圖形數據及圖幅接合表:以圖形比例尺、圖幅號、制作時間等方式導入數據庫。

(2)整體柵格圖形數據:根據比例尺和制作時間,通過入庫程序導入數據庫。

4.數字高程模型

(1)數字高程模型數據與圖幅聯表:根據圖形比例尺、圖幅號、制作時間通過入庫程序導入數據庫。

(2)鑲嵌數字高程模型數據:根據比例尺和制作時間,通過入庫程序導入數據庫。

5.多媒體數據

多媒體數據入庫可以根據多媒體數據庫內容的需要對入庫數據進行預處理,包括音視頻信息的錄制和編輯、文本編輯、顏色匹配等。多媒體信息的處理需要使用特定的工具和軟件進行編輯。由於音頻信息和視頻信息數據量巨大,需要數據壓縮技術來存儲多媒體數據。現在很多商業軟件都可以直接存儲或播放壓縮的多媒體數據文件。這裏主要考慮根據數據顯示質量的要求選擇不同的存儲格式。圖4-2顯示了各種多媒體數據的處理流程。

圖4-2多媒體數據處理流程圖

6.屬性資料

收集的社會經濟、水利工程、生態環境等屬性數據。進行分析整理,輸入計算機,最後由程序計算後存入數據庫。具體流程如圖4-3所示。

圖4-3屬性數據入庫流程圖

  • 上一篇:歷史文獻中記載過哪些UFO事件?
  • 下一篇:解釋壹下:“德隆三駕馬車”是什麽意思?
  • copyright 2024歷史故事大全網