波力世冠杯投注

波力世界杯投注平台-2022世界盃場中投注網

【世足全預測】AI 鐵口直斷冠軍獎落西班牙、巴西,德國球迷認同嗎?

可能是由於人類預測不靠譜,前幾屆世界杯預測戰況和冠軍的任務,常常交給動物完成。比如,章魚哥保羅。如果保羅活到現在,應該驚喜的發現,它的工作,現在有人工智慧系統可以替代了。在 2018 俄羅斯世界杯即將開打之際,德國 4 位科學家聯手打造了一個世界杯 AI 預測模型。綜合各種應有盡有的因素:國際足聯排名、平均年齡、頂級聯賽球員數量、國家人口比率、GDP、教練國籍等等,AI 建模、大數據應用,雲端計算加持。輕輕鬆鬆,當前準確率不知比運彩公司高到哪裡去。

最後他們鄭重其事地推出結論:西班牙勝率最大
只是萬萬沒想到,比賽尚未開始,人類就給了 AI 意想不到的一擊。正所謂人算不如雲計算,雲計算難料人使絆。就在世界杯開戰前 24 小時,西班牙炒掉了帶隊 2 年的不敗戰績主教練。AI 看了都傻眼。不過這個 AI 模型就這樣了嗎?太天真了。這 4 位嚴謹德國科學家自然考慮到了可能存在的變量,在 10 萬次比賽模擬後,他們認為:如果德國人打入八強決賽,那西班牙就呵呵了。

好一個神奇的 AI
一般而言,大數據預測為導向的 AI,最常使用的方法有泊松回歸、排序算法以及隨機森林,都比較經典。而這次在綜合比較了幾種方法後,4 位德國科學家決定主採用隨機森林建模,該方法誕生於 2001 年,比起傳統的回歸和排序,預測效果更勝一籌。更重要的是,隨機森林附上排序算法裡的一個協變量,再經過合體進化,就能變成更加強大的算法,甚至比運彩公司預測的還要準。

數據準備
具體如何實現呢?首先要談到數據,往年世界杯對戰數據自然是題中之義,但光有比賽維度的數據又怎麼夠?所以這個 AI 還把經濟因素、球隊實力、主場優勢、球隊結構,教練因素等納入其中。經濟因素參考人口和人均 GDP 。前者參考各國人口數據,並與全球總人口對比,看球隊所屬國對全球人口增長的貢獻。人均 GDP 則重在增長,用球隊所屬國的人均 GDP,以及全球平均的人均 GDP,來看 2002 至 2014 年的經濟增長情況。球隊實力也從兩方面考量。一是歷史進程,使用國際足聯排名,可管窺球隊過去 4 年的核心表現;二是博奕彩金賠率,把博彩公司 ODDSET 提供的賠率,轉換為球隊勝率納入模型。主場優勢則有玄學意味。一看是否東道主(比如在俄羅斯舉辦),二看是否與東道主來自同一大陸,三看屬於國際足聯六大足球協會(CAF,AFC,UEFA,CONCACAF,OFC,CONMEBOL)中的哪一個。

球隊結構重點針對默契度。共4項:

最大隊友數:每支國家隊,在同一個俱樂部效力的隊員最多和第二多的人數
平均年齡:每支國家隊裡,所有隊員的平均年齡
歐冠隊員數:每支國家隊,進入歐冠或歐洲聯盟杯半決賽的人數
海外隊員數:每支國家隊,在國外俱樂部效力的人數。
最後是教練因素。比如教練的年齡,以及在本隊職教時間的長短,都被計算在內。另外,教練的國籍是否與職教的國家隊歸屬一致,也是接近玄學的考量 —— 但肯定沒想過會有臨陣換帥的情況。

綜上,差不多每隻參賽球隊都會有 16 個維度的變量。
然後就可以進入競技演化篇了。

算法模型
就像開頭所言,這個預測 AI 核心主打算法模型是隨機森林。這種方法是 Breiman 在 2001 年提出的,如今已成了統計學模型和機器學習之間的橋樑。法如其名,隨機森林需要建起許多的決策樹(Decision Trees),讓它們來預測每場比賽雙方的進球數。當然,系統要服用上文提到的所有變量。先讓每一棵樹都獨立生長,再把所有樹的判斷集合到一起,進而隨機森林再做出的預測,這樣就不容易有太多偏見。其間關鍵所在,是把樹與樹之間的相關性降到最低——
第一,樹並不是種在原始樣本上,而是在有放回抽樣(BootStrap Sample)的基礎上生長的。
第二,在每一個節點,所有變量中,一個隨機子集被提取出來,用於分出最完美的樹杈。
有了這兩步,每棵樹之間的相關性就變得很弱,隨機森林的不變性(invariance)就比一棵樹更強了。另外,除了進球數,隨機森林也可以給出勝、平、負這樣的結果。緊接著進入算法融合階段。雖然一開始所說的泊松回歸模型,以及排序算法,德國科學家認為沒有隨機森林的預測效果那麼好。但他們覺得,這些算法身上依然有隨機森林可以汲取的營養。畢竟預測勝負和預測進球數,是兩項不同的任務。於是,數據篇說到的新變量,在這裡登場——之前排序算法裡用到的、謎一般的球隊實力參數,就在合體過程中以新變量的身份出現了。如此融合進化完成後,再拿幾種方法出來測一下,新算法顯得更優秀——預測的準確度,已超過了博彩公司。如果更早一點推出,這個 AI 估計能賺不少錢。不過現在也為時未晚,2018 世界杯已開盤等你。

網站資訊

TOP