国产欧美日韩第一页|日本一二三不卡视频|在线精品小视频,亚洲第一免费播放区,metcn人体亚洲一区,亚洲精品午夜视频

幫助中心 >  行業(yè)資訊 >  其他 >  一種面向大數據主動(dòng)防御的低損耗數據采集方法

一種面向大數據主動(dòng)防御的低損耗數據采集方法

2021-04-28 18:32:07 11

隨著(zhù)大數據技術(shù)的日益成熟,圍繞大數據的應用呈現出了多種多樣的特點(diǎn),使得大數據的流轉更加錯綜復雜,導致了數據暴露出更大的受攻擊面。同時(shí),大數據在全生命周期過(guò)程中呈現出了類(lèi)型動(dòng)態(tài)化、等級多樣化、權屬復雜化、使用實(shí)時(shí)化等特點(diǎn),這些特點(diǎn)都導致了大數據環(huán)境下的安全威脅攻擊手段多樣化,攻擊程序不斷更新迭代,使得大數據在全生命周期過(guò)程中被竊取、被濫用、被篡改的風(fēng)險不斷增大。傳統的安全手段及體系呈現出的單點(diǎn)、靜態(tài)、被動(dòng)防護的特點(diǎn)已不能有效應對大數據環(huán)境下的安全威脅。在這種趨勢的推動(dòng)下,安全防御思想正在從“以網(wǎng)絡(luò )為中心”向“以數據為中心”轉變,安全防御體系正在從單點(diǎn)、靜態(tài)、被動(dòng)防護向全面、動(dòng)態(tài)、主動(dòng)防護轉變。

在圍繞大數據全生命周期安全的主動(dòng)防御體系中,主動(dòng)防御所需采集數據的種類(lèi)多、數據量大,應盡量減少對采集系統資源的占用率,不影響被防御對象系統的正常運行,因此,數據采集效率對整個(gè)防御體系的準確性、實(shí)時(shí)性和高效性至關(guān)重要。

針對上述問(wèn)題,特別是面向大數據分析應用場(chǎng)景,本文提出了一種面向大數據主動(dòng)防御的低損耗數據采集方法。該方法采用無(wú)代理帶外采集方式,結合虛擬機內省機制,從大數據分析節點(diǎn)中的虛擬機外部對虛擬機內部的數據進(jìn)行采集,僅采集安全防御所需數據,不僅提高了數據采集的效率,而且有效降低了大數據分析節點(diǎn)網(wǎng)絡(luò )資源和虛擬機計算資源的占用率,從而實(shí)現低損高效的數據采集目的。

一、主動(dòng)防御系統數據采集架構

大數據主動(dòng)防御系統數據采集架構如圖1所示。


1.png

圖1 大數據主動(dòng)防御系統數據采集架構


在一個(gè)典型的面向大數據環(huán)境下的主動(dòng)安全防御系統中的采集系統主要包括三類(lèi)數據:網(wǎng)絡(luò )、終端、大數據分析節點(diǎn)。目前,針對大數據環(huán)境下的網(wǎng)絡(luò )和終端的數據采集技術(shù)相對成熟。網(wǎng)絡(luò )流量主要以探針的方式進(jìn)行數據采集,采集技術(shù)主要有:基于SNMP的采集技術(shù)、基于流的采集技術(shù)和基于數據包抓取的采集技術(shù);終端主要以代理或探針?lè )绞竭M(jìn)行數據采集,終端采集代理或探針主要通過(guò)輕量化軟件容器實(shí)現;大數據分析節點(diǎn)由于部署在虛擬機上,數據采集方式以帶內采集方式為主,該方式的典型做法是基于主機的入侵檢測系統,由中心采集程序和植入虛擬機的代理程序組成,是一種松耦合的方法。帶內采集方式由于使用了采集程序和代理,會(huì )占用一定的虛擬機資源,占用量高時(shí)會(huì )嚴重影響到虛擬機的正常運行,而且更易于被攻擊和被繞過(guò)而導致數據采集失敗,這些問(wèn)題都會(huì )嚴重影響主動(dòng)防御系統的響應效率和防御效能,甚至導致防御失敗。

針對這些問(wèn)題,本文提出了一種高效低損的數據采集方法,該方法基于虛擬機內省技術(shù),通過(guò)虛擬機監控層從外部對虛擬機內部進(jìn)行選擇性的數據采集和監控,實(shí)現了高效低損的采集效果。同時(shí),由于帶外采集對虛擬機內部是透明的,虛擬機內部無(wú)法感知到帶外監控程序,因此本方法還具有更高的安全性。

二、基于虛擬化的數據采集技術(shù)

在大數據系統部署的過(guò)程中,為了實(shí)現高效的計算和存儲能力,一般大數據計算集群和存儲集群分開(kāi)部署,將計算集群部署在云計算平臺上,在這種部署情況下,為了實(shí)現大數據環(huán)境下的主動(dòng)防御能力,需要對計算集群進(jìn)行高效的數據采集和分析。在虛擬化環(huán)境下,從數據采集實(shí)現技術(shù)的角度看,采集方法主要有兩種:帶內采集(In-band)和帶外采集(Out-of-band)。

帶內采集是指從虛擬機內部進(jìn)行數據采集。如圖2所示,該方法主要通過(guò)在虛擬機中加載代理模塊攔截虛擬機內部事件來(lái)實(shí)現。該方法的優(yōu)點(diǎn)在于事件攔截是在虛擬機內部,可以直接獲取操作系統語(yǔ)義,獲取的語(yǔ)義精準且不需要進(jìn)行語(yǔ)義重構,因此減少了性能開(kāi)銷(xiāo);缺點(diǎn)是容易遭受惡意軟件的攻擊和控制,容易成為新的安全隱患點(diǎn),而且代理模塊采用加載的方式容易被用戶(hù)終止而輕松繞過(guò)。


2.jpg

圖2 帶內采集(In-band)


帶外采集是指從虛擬機外部,在虛擬機管理器中對虛擬機中的事件進(jìn)行攔截,從而實(shí)現對虛擬機數據的采集。由于帶外采集是在虛擬機管理器中執行,位于目標虛擬機的底層,可將數據采集單元與目標虛擬機隔離開(kāi)來(lái),數據采集對目標虛擬機是不可感知的,因此增強了數據采集單元的安全性。與帶內采集相比,帶外采集具有更高的安全性,但其存在虛擬機內部的真實(shí)狀態(tài)與虛擬機外部抽取信息之間的語(yǔ)義鴻溝問(wèn)題,也就是如何將從外部抽取的低層信息(寄存器值、系統調用、I/O請求等)轉譯成高層信息(進(jìn)程、文件等)。如圖3所示,這種從虛擬機外部監控虛擬機內部的方法稱(chēng)為虛擬機內?。╲irtual machine introspection,VMI)。


3.png

圖3 帶外采集(Out-of-band)


三、低損耗數據采集方法

通過(guò)結合帶內和帶外數據采集方法的優(yōu)點(diǎn),本文提出了一種基于虛擬機內省機制,面向大數據主動(dòng)防御的低損耗數據采集方法。

1.基于虛擬機內省的數據采集框架

本方法的主要思路是采用虛擬機內省技術(shù)在虛擬機監控器中設計數據采集監控模塊,通過(guò)監控模塊從虛擬機外部對虛擬機內部信息進(jìn)行采集,為了避免語(yǔ)義鴻溝問(wèn)題,設計一個(gè)采集注入模塊,在虛擬機啟動(dòng)時(shí),通過(guò)將采集代碼注入目標虛擬機內存中,按照采集策略對所需數據安全信息進(jìn)行采集,因此無(wú)須進(jìn)行語(yǔ)義轉換。低損耗數據采集方法的整體技術(shù)框架如圖4所示。


4.png

圖4 基于虛擬機內省的數據采集框架


低損耗數據采集方法主要包括四個(gè)部分:策略設置模塊、數據采集模塊、采集注入模塊和采集注入代碼。其工作流程說(shuō)明如下:

Step1:虛擬機啟動(dòng)時(shí),虛擬機監控器通過(guò)采集注入模塊將采集代碼以無(wú)感方式注入目標虛擬機的非換頁(yè)內存中,保證代碼不會(huì )被換出;

Step2:在虛擬機運行過(guò)程中,數據采集監控服務(wù)平臺管理員設置目標虛擬機的數據采集策略,采集策略管理模塊將制定好的策略下發(fā)至虛擬機監控器的策略設置模塊;

Step3:策略管理模塊通過(guò)采集注入模塊將策略下發(fā)至目標虛擬機的采集注入代碼中;

Step4:采集注入代碼根據策略,采集進(jìn)程、文件操作、磁盤(pán)訪(fǎng)問(wèn)等信息;

Step5:采集注入代碼將采集的信息定時(shí)或按照一定的數據量發(fā)送給數據采集模塊;

Step6:數據采集模塊將采集數據進(jìn)行清洗后,按照標準格式發(fā)送給數據采集監控服務(wù)平臺。

 數據采集監控服務(wù)平臺將接收到的采集數據進(jìn)行數據處理和數據分析,將發(fā)現的數據和進(jìn)程異常行為及時(shí)上報主動(dòng)防御系統,主動(dòng)防御系統根據接收到的威脅信息調整防御策略并進(jìn)行相應的協(xié)同防御。

2.數據采集優(yōu)化

數據采集模塊位于虛擬機監控器,利用虛擬機內省機制(LibVMI)實(shí)現虛擬機內部數據的外部采集。LibVMI是美國佐治亞理工學(xué)院的Payne等設計的一套開(kāi)源內省工具庫,如圖5所示,該工具不需要對虛擬機監視器進(jìn)行修改,而是直接利用虛擬機監視器提供的接口對虛擬機底層信息(進(jìn)程頁(yè)表、內存映射等)進(jìn)行重構,獲取虛擬機高層信息(進(jìn)程信息、內核數據),從而實(shí)現監控虛擬機的行為和狀態(tài),這種方法對虛擬機影響最小。


5.png

圖5 數據采集模塊


基于虛擬機內省機制的LibVMI也存在語(yǔ)義鴻溝問(wèn)題,為了避免該問(wèn)題,本方法設計了采集注入代碼模塊,該模塊在虛擬機啟動(dòng)時(shí)以無(wú)感的方式通過(guò)采集注入模塊注入虛擬機非換頁(yè)內存區域中,通過(guò)注入代碼直接采集虛擬機的高級信息,因此不需要進(jìn)行語(yǔ)義轉換,從而解決了資源消耗問(wèn)題。同時(shí),為了提高數據采集效率,并進(jìn)一步減小對目標虛擬機內存的占用率,對采集注入代碼進(jìn)行了優(yōu)化,設計了一種閾值綜合判定規則,該規則綜合考慮了采集時(shí)間(C)和資源占用率(S)兩個(gè)因素,資源占用率的閾值(T)一般為目標虛擬機內存的1%,該閾值可根據用戶(hù)需要進(jìn)行設定,采集時(shí)間間隔(I)由管理員設定,按照資源優(yōu)先原則,首先判斷資源占用率,如果S>T,則數據輸出,否則,如果C>I,則數據輸出。

通過(guò)上述的優(yōu)化過(guò)程,從系統層面到采集實(shí)施層面均對整體數據采集進(jìn)行了優(yōu)化,保障了采集效率和效果的有效權衡。

四、效果分析

實(shí)驗采用服務(wù)器配置:

CPU:Intel Xeon E5-2630 2.4 GHz

內存:64 GB

硬盤(pán):2 TB

操作系統:CentOS 7.2 64位

軟件:yum、libvirt、qemu-kvm、LibVMI

采集數據如表1所示。


表1 采集數據表

6.png


1. 采集效率

本文設計的數據采集優(yōu)化方法采用了內存注入代碼方式,可直接從目標虛擬機內部采集數據,經(jīng)過(guò)測試,通過(guò)對數據采集1 000次并取平均值計算,數據采集時(shí)間為0.002 s,而采用代理程序方式的采集時(shí)間為0.6 s,采集效率提升了100倍,實(shí)現了高效的數據采集能力。

2. 采集效果

通過(guò)測試,在目標虛擬機內存占用率方面,本文方法內存占用量為56 KB,采集代理程序內存占用量為1.2 MB,在內存占用量上減少了95%;測試采集9 MB數據,目標虛擬機內存為1 GB,本文方法內存占用量為9.056 MB,內存占用率小于1%,而采集代理程序內存占用量為10.2 MB,內存占用率大于1%,說(shuō)明在采集相同數據量的情況下,本文方法具有更低的資源占用量,保障了目標虛擬機的高效運行。同時(shí),采集的數據可根據采集策略進(jìn)行采集,故可根據防御的需求隨時(shí)更改采集的數據內容,保障采集內容的完備性,并可根據需要設定采集時(shí)間間隔,可動(dòng)態(tài)滿(mǎn)足主動(dòng)防御需求。

通過(guò)實(shí)驗分析,本方法從采集效率和效果上均達到了一種高效、低損的數據采集能力。

五、  結 語(yǔ)

本文圍繞大數據全生命周期安全的主動(dòng)防御體系對數據采集的準確性、實(shí)時(shí)性和高效性的需求,設計了一種基于虛擬機內省機制的高效低損的數據采集方法。該方法結合了帶內采集和帶外采集的優(yōu)點(diǎn),從主動(dòng)防御系統的整體出發(fā),從采集效果和采集效率上對采集模塊進(jìn)行了優(yōu)化,保證了數據采集的完備性和高效性,通過(guò)虛擬機內省機制和資源占用閾值的設定,保障了對虛擬機本身資源占用率的最小化。本文設計的方法為大數據主動(dòng)防御系統的構建提供了良好的支撐。



提交成功!非常感謝您的反饋,我們會(huì )繼續努力做到更好!

這條文檔是否有幫助解決問(wèn)題?

非常抱歉未能幫助到您。為了給您提供更好的服務(wù),我們很需要您進(jìn)一步的反饋信息:

在文檔使用中是否遇到以下問(wèn)題: