亚洲 日韩 激情 无码 中出,无码人妻久久一区二区三区蜜桃,亚无码乱人伦一区二区,四虎影视永久免费观看,四虎成人精品一区二区免费网站

什么是天氣預(yù)報算法(什么是天氣預(yù)報算法的基本)

小編:魅力 更新時間:2022-08-24 03:53
什么是天氣預(yù)報算法(什么是天氣預(yù)報算法的基本)

天氣預(yù)測又名氣象預(yù)報是由強大的超級計算機,其處理的當(dāng)前天氣狀況的觀測數(shù)十萬完成。為了觀察當(dāng)前的天氣,人類已經(jīng)向太空發(fā)射了無數(shù)的衛(wèi)星。這些衛(wèi)星穿越地球并捕獲數(shù)據(jù),然后發(fā)送到地球上建立的數(shù)據(jù)中心。

從衛(wèi)星接收的數(shù)據(jù)是RAW格式,不提供任何類型的信息。因此,為了獲得知識,我們需要使用各種數(shù)學(xué)模型來處理它。

為了從RAW數(shù)據(jù)預(yù)測天氣,我們需要使數(shù)據(jù)適合于數(shù)學(xué)模型的輸入。處理后的數(shù)據(jù)存儲在數(shù)據(jù)倉庫中。那些存儲的數(shù)據(jù)可以直接將其作為數(shù)學(xué)模型的輸入,最終為我們提供所需的信息。

將RAW數(shù)據(jù)轉(zhuǎn)換為清理數(shù)據(jù)的過程稱為知識發(fā)現(xiàn)過程,換句話說,我們稱之為數(shù)據(jù)挖掘。為了預(yù)測信息,使用了各種數(shù)據(jù)挖掘方法,例如;

決策樹

基于規(guī)則的方法

神經(jīng)網(wǎng)絡(luò)

樸素貝葉斯

貝葉斯信念網(wǎng)絡(luò)

支持向量機

在這些方法中,最著名的方法是決策樹方法。

什么是決策樹?

決策樹是樹狀圖或決策模型及其可能的后果,包括機會事件結(jié)果,資源成本和效用。決策樹的圖形表示可以是:

什么是天氣預(yù)報算法(什么是天氣預(yù)報算法的基本)

使用以下決策樹算法創(chuàng)建決策樹。

ID3(迭代dichotomiser3)

C4.5 (ID3的繼承者)

CART(分類和回歸樹)

CHAID(chi - squared自動互動探測器)

MARS(擴展決策樹以更好地處理數(shù)值數(shù)據(jù))

使用ID3算法的示例:

讓我解釋一下,如何生成決策樹以及如何使用它進行預(yù)測。為了計算,我使用了ID3算法。使用以下數(shù)據(jù)集,我們將預(yù)測11月18日的天氣。

什么是天氣預(yù)報算法(什么是天氣預(yù)報算法的基本)

要從任何數(shù)據(jù)集創(chuàng)建決策樹,我們需要執(zhí)行一些計算,比如熵,它是對消息來源不確定性的度量。它給了我們數(shù)據(jù)的無序程度。另一個是信息增益,用來測量熵的期望降低。它決定哪個屬性進入決策節(jié)點。執(zhí)行計算后,決策樹將如下所示

什么是天氣預(yù)報算法(什么是天氣預(yù)報算法的基本)

觀察生成的決策樹后,您可以預(yù)測11月18日的天氣。

滑動窗口算法

ID3算法的主要缺點是天氣數(shù)據(jù)的小尺寸。正如您所見,我們只采用了5個參數(shù)[最高溫度,最低溫度,濕度,降雨量,前景],它可能會產(chǎn)生錯誤的預(yù)測。解決這個問題的方法是花費幾年的歷史數(shù)據(jù),而不是一周。如果歷史趨勢與當(dāng)前趨勢無關(guān),則發(fā)生故障的風(fēng)險更高。

通過滑動窗口算法解決了這個問題:

每周天氣趨勢可能與歷史數(shù)據(jù)不完全一致??赡艽嬖诳赡艿窒c當(dāng)前條件相對接近的歷史趨勢的不同條件?;瑒哟翱谒惴ㄍㄟ^從兩周數(shù)據(jù)集中采樣來解釋這種潛在的偏差。通過劃分該樣本數(shù)據(jù),該算法可以確定最佳擬合 趨勢并預(yù)測第二天的天氣。

該算法的一個優(yōu)點是它使用從前一年的同一時間段觀察到的數(shù)據(jù)。樣本數(shù)據(jù)也可以調(diào)整; 除了增加歷史觀察周的數(shù)量之外,還可以觀察到多年的數(shù)據(jù)。應(yīng)限制增加觀察周數(shù),以確保預(yù)測基于一年中的同一時間。

該算法的缺點在于,已經(jīng)采樣的歷史數(shù)據(jù)可能無法參考當(dāng)前的趨勢。這可能是由于前幾年沒有觀察到的有影響的天氣條件造成的。由于缺乏類似的數(shù)據(jù),這樣的事件會導(dǎo)致預(yù)測偏差。

對于實驗觀點,您可以使用數(shù)據(jù)集和挖掘工具自行執(zhí)行預(yù)測。我想建議一些實驗的工具和數(shù)據(jù)集存儲庫。

工具

Weka [廣泛使用]

Rapid Miner

數(shù)據(jù)集存儲庫

UCI機器學(xué)習(xí)庫 - 數(shù)據(jù)集(https://archive.ics.uci.edu/ml/datasets.html)

一種使用機器學(xué)習(xí)的現(xiàn)代方法

到目前為止,無論我們看到什么,都被稱為傳統(tǒng)的天氣預(yù)報方法。這些傳統(tǒng)方法非常不穩(wěn)定,并且在預(yù)測中容易出錯。而且,我們無法預(yù)測使用它們的大部分時間,因為它們在那個階段變得不準確。

最常見的是,只有兩種機器學(xué)習(xí)技術(shù)用于天氣預(yù)報。

神經(jīng)網(wǎng)絡(luò)

貝葉斯網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)本質(zhì)上是高度動態(tài)的,因此它似乎是天氣預(yù)報中最受歡迎的機器學(xué)習(xí)模型選擇。與線性回歸和功能回歸模型不同,這種流行的主要原因是能夠捕獲過去天氣趨勢和未來天氣條件的非線性依賴性。

剩下的機器學(xué)習(xí)技術(shù)是貝葉斯網(wǎng)絡(luò),它最終使用機器學(xué)習(xí)算法來找到最優(yōu)的貝葉斯網(wǎng)絡(luò)和參數(shù)[溫度,濕度,前景等]。由于存在大量不同的依賴性,貝葉斯網(wǎng)絡(luò)的計算成本非常昂貴。