科勝科技官方部落格 - Utitech Blog

資料庫是什麼?有哪些?從關聯式資料庫到 NoSQL 該怎麼選?

Written by 克里斯 - Chris | Dec 22, 2025 9:54:37 AM

在工業 4.0 的浪潮下,我們常說「數據就是新石油」。但如果沒有一個好的油槽和煉油廠,這些石油充其量只是地上的汙漬,沒價值還很難清。

對於製造業和工業自動化領域的決策者來說,資料庫(Database) 就是那個核心的煉油設施。但打開市面上的選型清單:Oracle、MySQL、MongoDB、InfluxDB、AVEVA Historian…琳瑯滿目。到底該選傳統的「關聯式資料庫」,還是這幾年紅得要命的「NoSQL」?還有為什麼做 IoT 監控一定要用「時序資料庫」?

這篇文章沒有程式碼也沒有艱澀技術名詞,從認識資料庫出發以工業製造業公司內的決策人角度,帶你看懂資料庫該如何選擇與佈局。

資料庫 (Database) 是什麼? 跟資料庫管理系統一樣嗎?

資料庫是用來集中儲存與管理資料的系統,將結構化的資訊或資料集合,通常以數位方式儲存在電腦、伺服器或雲端中。簡單來說,它就像一個數位倉庫,把文字、數字、圖像、影片等資訊都收納起來。

不過資料庫本身只是儲藏資料,資料庫管理系統 (DBMS) 則是控制和操作資料庫的「大腦」。DBMS 介於你的應用程式(如 ERP、MES)和硬碟之間 ,它不只負責「存」,更負責「管」,確保你的資料不會因為兩個人同時按存檔而打架(這叫併發控制),也要確保斷電時資料不會人間蒸發(這是備份與復原)。

從架構來看,大多數 DBMS 是採用多層結構。例如企業應用很常見的三層架構,它是前端應用程式與資料庫伺服器分離,應用伺服器負責商業邏輯、資料庫伺服器負責資料存取。DBMS 內部則由資料庫引擎(儲存管理)、查詢處理器(SQL 解譯器與最佳化器)、緩衝區管理等構成。

這部分還有另一種技術架構稱為「超融合」,簡單來說就是把剛提到的三層架構 (包含伺服器、儲存設備和網路),整合在單一設備或平台上。有興趣可以閱讀這篇介紹


 

資料庫有哪些?

資料庫的類型大抵分兩大門派 : 關聯式資料庫 (RDBMS) & 非關聯式資料庫 (NoSQL)。下圖清楚分類目前市面上常見的資料庫種類。

圖片來源 :  https://hackmd.io/@flyxiang/SkGT3E-VP

關聯式資料庫 (RDBMS)

市面上的代表性產品有 Oracle, MySQL, Microsoft SQL Server, PostgreSQL 等。關聯式資料庫的特性是資料以「表格(Table)」形式儲存,講究行與列的整齊劃一,最在乎的是 ACID(原子性、一致性、隔離性、持久性)。

因為這些特性,所以只要跟錢、庫存、訂單有關的,絕對會選關聯式資料庫。例如銀行轉帳,你不能接受錢扣了但對方沒收到,這種「強一致性」是關聯式資料庫的強項 。在工業管理的應用如 ****ERP 系統、MES 中的工單管理、人事資料等。

非關聯式資料庫 (NoSQL)

代表性產品有目前非常受歡迎的 MongoDB,以及 Redis, Cassandra, Neo4j 。非關聯式資料庫的特性是不受表格限制,它可以存 JSON 文件、鍵值對(Key-Value),甚至是圖形關係,通常為了追求擴充性與速度,願意在一致性上做些妥協(稱為 BASE 原則)。例如社群網站按讚(少算一個讚不會怎樣,追求可用性高、速度要快)、非結構化的日誌數據、或是產品規格差異極大的型錄 。在工業上的應用如儲存機台產生的半結構化資料(Log)、AI 影像辨識的原始檔案、靈活的 IoT 設備屬性配置等 。

 

我們的觀點 : 別陷入二選一的迷思。
現代工廠通常是「混合雙打」,用 RDBMS 管訂單,用 NoSQL 處理大數據分析。

 

選擇資料庫需考量因素

Amazon Web Service (AWS) 有一篇決策指南就提醒選擇資料庫時「首先要釐清商業目標資料特性」。任何資料庫選擇的重點都在於「你要儲存與處理的是什麼資料」及「你的業務場景需要什麼特性」。理解資料的類型、存取模式和使用情境後,再考慮性能、可擴充性、安全和成本等,才能做出最明智的選擇。因此做決定前至少要考慮:

  • 資料類型:需要處理的資料是結構化、半結構化,或時序資料?是高度連線的圖形關係還是簡單鍵值?

  • 擴展性與效能:資料量和存取量會多大?是否需要水平橫向擴展?讀多寫少還是寫多讀少?回應延遲要求,毫秒級還是秒級?

  • 一致性需求:是否需要強一致性(ACID),或可接受最終一致性(BASE)?舉例來說就是金融交易 vs 社群按讚,待會的篇章下面會更仔細說明。

  • 高可用與容錯:系統需要多少冗餘設計?要在多地區部署以提升可靠度嗎?

  • 成本與維運:預算有限時可考慮開源 DB;雲端付費模式可以隨用而付;自建需要的硬體/人力成本、授權費也需列入考量。

  • 生態與工具:是否需與特定生態系整合?例如要在 AWS 平台使用,AWS DynamoDB、Aurora 會更易整合;在 Microsoft 平台,SQL Server 或 Azure SQL Database 可能更方便。

  • 安全與法規:若涉及敏感資料(個資、工業機密等),必須支援資料加密、金鑰管理、審計記錄、存取控制等功能;並符合 GDPR、資安法等合規要求。

 


常見的關聯式資料庫

關聯式資料庫的選擇百百種,選擇時通常會考慮預算、作業系統環境、需要的企業特性,以及現有系統相容性。就我們的觀察,企業一般都愛用 Oracle 或 Microsoft SQL Server,很穩定但費用高;雲端與開源使用者則偏好 MySQL、PostgreSQL 等;行動裝置或嵌入式則常用 SQLite。

常見的關聯式資料庫

資料庫

說明

Oracle Database 商用歷史悠久,功能強大。支援複雜的 SQL 查詢、事務控制與自動分割表格(分頁)等企業級功能。通常需要專用硬體或高規格虛擬機,多用於金融、電信、大型 ERP 等場景。缺點是授權費用高昂。
MySQL / MariaDB 目前最流行的開源關聯式資料庫,經常用來支援各種網路應用程式。MySQL 易於部署與管理,社群活躍,適合動態網站和中小型應用。其預設儲存引擎 InnoDB 支援 ACID 事務。MariaDB 是 MySQL 的分支版,強調性能優化。
PostgreSQL 又稱 Postgres,是功能極為豐富的開源關聯式資料庫。它支援更多資料型別、進階 SQL 特性(例如窗口函數、完整性檢查)、以及內建地理資訊 (PostGIS) 支援。與 MySQL 相比,Postgres 在可擴充性、併發處理和資料完整性方面通常更出色,也提供更豐富的功能,更大的擴展性和更高的資料完整性。
Microsoft SQL Server 微軟的商用關聯式資料庫,與 Windows 生態深度整合,也有 Linux 版。它包含企業等級的資料倉儲與分析功能(如 OLAP)、高可用方案 (Always On) 和圖形/串流整合等。廣泛用於大型企業環境,雖然部分已雲端但通常只能在授權的軟體環境上運行。
SQLite 超輕量級的嵌入式資料庫,以單一檔案運作,幾乎零配置,常見於行動裝置或小型應用。它不適合高併發與巨量資料,但對開發者使用上非常友善。
IBM Db2、Amazon Aurora 等

如 IBM Db2 也長期在企業環境中使用;Amazon Aurora 則是兼容 MySQL 和 PostgreSQL 的雲端服務版,聲稱性能優於純開源版本。

表格來源 : 科勝科技整理

 

 

常見的非關聯式資料庫

根據國外網站 DNS stuff 調查,2025 年最熱門的非關聯式資料庫( NoSQL) 系統包括 MongoDB、Apache Cassandra、Redis、Couchbase 和 Neo4j

常見的非關聯式資料庫

資料庫

說明

文件導向資料庫

例如 MongoDB 和 Couchbase。它們將資料存成文件(通常是 JSON/BSON 格式),結構可靈活變動,適用於儲存非結構化或半結構化資料。MongoDB 是最受歡迎的文件型資料庫之一,被廣泛用於需要快速開發和靈活架構的應用。

鍵值 (Key-Value) 資料庫

例如 Redis 和 Amazon DynamoDB、Memcached 等。這類資料庫以鍵對值的形式儲存資料,存取效率極高。Redis 主要在記憶體中運行,適合快取、即時分析或訊息代理等需求,而 DynamoDB 是雲端服務,可在毫秒級延遲內響應,非常適合高效能需求。

廣列 (Wide-Column) 資料庫

例如 Apache Cassandra 和 HBase。這些系統以分布式架構儲存大量時序或半結構化資料,擅長水平擴展與高可用。Cassandra 特別適合需要跨多資料中心存放資料、且寫入/讀取量極高的場景。

圖形資料庫 (Graph DB)

例如 GraphDB、Neo4j、JanusGraph。它們以節點和邊的形式儲存資料,最適合處理複雜關聯查詢(如社群網路、路徑搜尋等)。

多模型資料庫

一些新一代資料庫(如 Azure Cosmos DB、OrientDB 等)同時支援多種資料模型(文件、鍵值、圖形等),用戶可以依需求選擇。

表格來源 : 科勝科技整理

 

 

常見的時間序列資料庫

時間序列資料庫 (又稱時序資料庫,TSDB) 被 IBM 與 Actian 歸類在 NoSQL 中,而第三方評測機構 DB-Engines 則是設立「Time Series DBMS」這個獨立類別來進行評比。實務上,我們更傾向把它視為一種『專用型資料庫』。

時序資料庫是工業和 IoT 領域的主戰場,因為感測器、PLC、SCADA 無時無刻都在吐出數據:溫度、壓力、震動、電壓。這些數據有個共同點:都帶著時間戳記(Timestamp),而且數據量非常龐大。如果硬要用傳統的 SQL 資料庫來存這些數據,查詢速度真的會慢到你懷疑人生。因此時間序列資料庫對於工業領域收集即時數據是非常重要且基本的配置。常見的 TSDB 包括:

常見的時間序列資料庫
資料庫 說明
InfluxDB 專門為時序資料設計,內建高效壓縮與聚合功能,可存取大量高頻寫入的數據。開源版與企業版可針對長期儲存與查詢做最佳化。
TimescaleDB 實際上是 PostgreSQL 的擴充套件,將時間序列功能整合在 PostgreSQL 中。它支援完整的 SQL 查詢語法,適合需要 SQL 靈活性又要處理時序資料的用戶。
Prometheus 主要用於監控指標的系統,由 CNCF (Kubernetes 背後的基金會)管理。它把監控指標存成時序資料,並提供即時查詢和警報功能,廣泛用於雲端與容器環境。
Graphit 早期的時序資料庫,用來儲存數據並進行繪圖,現在多半與其他前端工具配合。
工業級專用方案 在 OT 領域,我們更常聽到「歷史資料庫(Historian)」。像 AVEVA PI System (前 OSIsoft)、AVEVA Historian (前 Wonderware)、GE Historian。這些系統雖然骨子裡是時序資料庫,但它們更懂工業通訊協定,且具備極高壓縮與不失真技術,是許多大型工廠的標配 。

表格來源 : 科勝科技整理

 

 

資料庫要放地端還是上雲?

資料庫要放在自家機房 (On-Premise) 還是丟上雲端 (Cloud) ? 要回答這題端看你的應用場景是什麼,沒有標準答案。雲端資料庫相比傳統提供更高的靈活度和可擴展性,同時減輕 IT 運維負擔。部署傳統資料庫則給予企業更多掌控權與穩定性。選擇時依照組織對可用性、延遲、成本和合規等的需求,綜合評估雲端與本地方案的取捨。

  • 部署與管理:傳統資料庫部署在公司自有伺服器或資料中心,需要自行設置硬體、安裝軟體並持續維運;雲端資料庫則由雲服務商管理,如 Amazon RDS、Azure SQL Database、Google Cloud SQL 等,可快速部署,且內建備份、監控與負載平衡功能。

  • 可擴展性:雲端資料庫可利用彈性架構,隨需求動態擴充(例如自動橫向分片、多節點複本),而傳統系統通常需人工升級硬體或添購資源才能應對負載變化。

  • 成本:傳統資料庫模式需要高額前期資本支出(購機與授權),且維運成本高;雲端採用付費模式,初期投資低,可彈性按需付費。不過長期下來,若資料量極大或持續高使用量,雲端費用也可能不小,因此需評估總擁有成本。

  • 資料與存取:在雲端,資料可以全球多區備援,並透過全球網路低延遲存取;而本地部署的資料庫可以完全掌握硬體位置和資料安全,但跨地域存取或災備可能不易。

  • 安全與控制:傳統系統可由企業自行完全掌控安全策略與網路隔離;雲端服務商則提供多層安全防護與符合各種法規認證的環境(如 ISO、SOC、GDPR 合規),但要信任供應商的安全機制。

我們的觀點 : 目前工業製造中的主流是 「混合多雲 (Hybrid Multi-Cloud)」。機密的製程配方留在地端,海量的分析數據送上雲端跑 AI 運算,方便解決儲存成本與算力問題,這就可以兼顧安全與效能 。

另外還有一個我們認為值得討論的議題,上雲端的綜合風險真的大於放地端所以有許多企業不願上雲? 又或,其實是「控制慾與安全感」的心理戰? 歡迎在底下留言告訴我們你是怎麼認為的。

 

 

 

工業領域整合應用多類型資料庫

應用場景與案例

在複雜的工業自動化系統中,通常會同時使用多種資料庫來處理不同類型的數據。舉例來說,工廠可能使用關聯式資料庫來管理設備參數和 ERP 資訊,使用時序資料庫或 Historian 來儲存感測器數據,並利用 NoSQL 資料庫做額外的數據分析或應用服務。

為了解決不同系統之間的資料孤島問題,整合平台變得非常重要。例如,AVEVA 與一家風力發電廠的案例中,他們建立一個統一命名空間 (Unified Namespace;UNS),將多個數據源(如 PLC、MES、SCADA 系統)的資料統一格式化,然後透過 MQTT 傳輸至後端的 SQL 資料庫做集中分析。這樣的整合平台允許將傳統工控資料轉換並送入雲端或資料倉儲,實現不同系統的互通。

圖片來源 : 科勝科技,AVEVA PI System 統合設備即時資料與歷史資料,進行視覺化的交叉表比對分析。

未來趨勢

根據業界報告整理,工業與大數據資料庫的發展與趨勢離不開三個重點 : 智慧化、串流化與分散式AI 將很多資料管理工作自動化,邊緣裝置與雲端會合作即時處理資料,而混合多雲與資料網格將成為常態。在這個演進過程中,具有高擴充性的 NoSQL 及時序資料庫將扮演重要角色,而傳統關聯式資料庫也會與之互補,確保企業在新舊技術間平滑過渡。

  • AI/機器學習助力資料管理:未來的資料平台將廣泛內建 AI/ML 工具,例如自動化資料清洗、分類與補全等。根據數據公司 Monte Carlo 的調查,Snowflake、Databricks 等大廠已使用機器學習來自動糾錯和標註數據,讓資料工程師更有效率。工業領域也會利用 AI 進行預測性維護或異常檢測,這都要求資料庫能方便地存取與整理機器學習所需的訓練數據。
  • 即時分析與邊緣運算:隨著 IoT 設備和 5G 的普及,連續串流分析已成為必須。企業需要就近處理生產數據以滿足低延遲需求。例如,半導體製造、大型發電廠會在廠區內部或近端資料中心運行分析服務。未來的技術堆疊將包含串流平台和時序資料庫,用於處理邊緣資料,並透過聯邦查詢將資料彙整到中央分析系統。
  • 混合多雲(Hybrid Multi-Cloud):越來越多企業不再只鎖定單一雲服務商,而是同時使用多家雲端與內部資料中心以達到成本效益與彈性。Monte Carlo 的報告也提到:「大多數組織正在運行多個雲端平台以最佳化成本、效能和可靠度」。例如,一家公司可能將機敏控制資料留在本地機房,而將大數據分析系統部署在 AWS 和 Azure 上,各環境之間協作。這也衍生出「雲邊協同」(edge-cloud) 的需求,資料庫需要能在多種環境間無縫運作。
  • 資料網格/資料領域 (Data Mesh):傳統「單一資料湖」模式正逐漸被領域分散式架構取代。許多公司開始讓各業務部門擁有自己的資料管線和資料產品,中央架構改為編排與治理。企業正採用資料網格(Data Mesh)和資料結構 (Data Fabric) 的原則,把資料所有權和責任分配到各業務域。這意味著資料庫系統也將趨向模組化設計,每個域可選擇最適合自己需求的資料庫技術。

 

 

資料庫安全性與數據保護

一些工業場域 OT 往往會因為一些便利性或不能中斷生產的緣故,選擇忽略資安。我們必須提醒,資安它重要到如同企業的生命線,由其在這個物聯網與 AI 高歌猛進的世代,更不能妥協。

資料庫中往往儲存組織的關鍵業務資料和敏感資訊。隔離加密監控備份是資料庫安全的四大支柱。任何出於生產和分析需求的資料蒐集方案,都應同時納入完備的安全防護與災難復原計畫,以免系統被攻破後造成重大損失。

存取控制:嚴格的身份驗證與授權機制是基本。使用者應依角色(Role-Based Access Control;RBAC)被授予最小權限,限制對資料庫操作的存取。資料庫帳號應盡量減少,而非讓每個人都使用同一共用帳號。

網路安全:資料庫通常部署在內部網路或私有子網中,與公開網路隔離;並使用防火牆、VPN、TLS/SSL 加密等方式保護資料傳輸。只對應用伺服器開放資料庫端口,避免直接暴露於公網。

資料加密

  • 數據靜態加密 (Data-at-Rest Encryption):資料庫伺服器的磁碟或備份檔案應加密存放。雲服務商(如 Azure、AWS、Google Cloud)通常內建透明資料加密功能,可自動加密儲存資料。
  • 數據傳輸加密 (Data-in-Transit Encryption):應強制使用 TLS/SSL 協定加密客戶端與資料庫之間的所有通訊,以防第三方竊聽。

日誌與監控:啟用審計日誌 (Audit Log) 功能,記錄所有使用者登入、查詢和資料變更行為。監控異常存取模式(如不尋常的查詢或大量資料匯出),配合入侵偵測系統能及早發現潛在攻擊。

漏洞管理與修補:定期更新 DBMS 軟體版本與作業系統,修補已知安全漏洞。對開放原始碼資料庫,也要關注社群安全公告及時更新。

備份與復原:定時備份資料庫並驗證備份有效性,以防資料損毀或勒索軟體攻擊。備份檔案也應存放在不同地點並加密保護。資料庫儲存加密能確保備份過程中的資料機密性,缺乏解密金鑰時即使備份洩露也無法讀取。

符合法規:若涉及個人資料或工業機密,需遵守相關法規(GDPR、CCPA、資安法規等)。這通常也意味著加強數據保護機制,例如在備份時進行加密、對使用者行為做定期審計、設定資料保留與刪除策略等。

 

 

選擇最適合資料庫系統的建議 : 「別想了,真的沒有萬靈丹」

常常有客戶問我們:「有沒有哪一款資料庫是可以涵蓋我所有需求的?」我們回答通常是:「資料庫不是面速力達母,擦傷破皮蚊子咬都能塗。」,回歸上面提到的原則,選型時先問自己這幾個簡單的問題 :

資料長怎樣?
    • 結構嚴謹的訂單、帳務 : 選關聯式資料庫 RDBMS (PostgreSQL, SQL Server)
    • 亂七八糟的 JSON、文件 : 選非關聯式資料庫 NoSQL (MongoDB)
    • 帶時間戳記的連續訊號 : 選時間序列資料庫 TSDB / Historian (InfluxDB, AVEVA PI System)
    • 複雜的圖形、關聯網路 (如供應鏈關係) : 選圖形資料庫 GDB (GraphDB / Neo4j)
一致性要求多高?
    • 絕對不能錯(例如銀行交易、工廠訂單): 選支援 ACID 的關聯式資料庫。
    • 可以容忍短暫延遲同步(例如社群按讚、訓練 AI 模型): 選 BASE 的 NoSQL 。

預算與人力?

    • 有錢沒人 : 用雲端託管服務 (Managed Service)。
    • 有人沒錢 : 用開源軟體 (Open Source) 自己架。

  1.  

若預算和管理人力都允許,最理想的架構就是多元混和,將最適合某種資料類型的資料庫放在該場景中運行。例如, ERP 系統使用關聯式資料庫儲存訂單數據,IoT 平台與監控儀表板使用時序資料庫儲存感測器數值,NoSQL 則在機器學習與 AI 生態中很常見且扮演重要角色,接著可考慮地端存放機敏資料、雲端上跑數據分析跟 AI 推理。

 

工業領域中特別要注意,歷史資料庫是許多公司必備的關鍵基礎設施。這些專業的時序資料庫系統用於收集、清理、儲存、豐富化、視覺化即時營運數據,能幫助你長期監控與決策支援,對需要分析極大量機台與系統數據的場景尤其值得考慮,以此支援操作人員和管理者最佳化效率、確保營運韌性並提升永續發展能力。

最後,選擇最適合的資料庫系統應始終從需求出發,潮流跟評比只是參考而已,要深入瞭解業務需求與資料特性,並根據可用資源與公司長期的發展策略做決策。

就像賽車一樣,跑拉力賽別開 F1,跑競速別開吉普車。要選最適合現在「賽道」的車款,才能跑得又快又穩。資料庫也是如此,選對了資料庫,你的數位轉型才能跑得快又穩。

 

 

參考資料來源:AVEVA, AWS, DB-Engines, Microsoft Azure, MONTE CARLO, Nutanix, Oracle, OPSWAT。