波力世冠杯投注

波力世界杯投注平台-2022世界盃場中投注網

2022世足預測用小數據方法或許更適合

2018年的FIFA世界盃爆出了不少冷門,尤其是針對德國與韓國的那場比賽,這時候有人便會質疑,所謂大數據分析與機器學習方法是否不管用了?根據資料分析,德國隊非冠軍莫屬,但德國卻在一開始的小組賽輸給了韓國,這是怎麼回事?

首先,我們可以先來想想世界盃的足球賽本身是如何運作:4年舉辦一次,而每位球員的平均年齡為20~32歲之間,也就是說如果這些球員即使一直以來都相當優秀,一生之中最多也只能參加世界盃足球賽3次,顯然對這樣的樣本數來說,用機器學習來預測結果似乎不太適合。最重要的是,許多表現優秀的年輕球員,恐怕無法被記錄進這些數據中。查閱一下2018年世足的進球數統計,進5球的英格蘭球員Harry Edward Kane只有24歲、進4球的比利時球員Romelu Lukaku今年25歲,這些進球數名列前茅的球員都是1990年以後出生的,恐怕在世足史上,只參賽過至多一次。

另外,球員在國家隊的比賽表現和在職業賽上也可能有所不同,也是機器學習的結果和實際不符的其中一個原因。例如最受矚目的梅西,他的足球「過人」技巧最令人為之驚嘆,然而在世界盃的比賽上,並不容易見到他使用這個華麗的技巧,筆者認為即使是王牌球員,也會有風險考量,對梅西來說亦是如此,在代表國家的比賽上傾向選擇比較保守的狀態,而非大秀自己的球技,而這可能並不是那麼適合透過先前的數據來精準地進行預測。

那麼,四年舉辦一次世界盃難道沒辦法預測嗎?其實,用小數據方法或許更適合,也就是用中學時學過的機率方法與統計方法即可;筆者曾在youtube上看過有人特別針對德國與韓國隊的比賽做分析,若假設韓國隊進球的機率是1/3,德國隊進球的機率是2/3,那麼如果韓國隊加強防守,使整場比賽進球數越少,其實越能夠模糊強隊與弱隊之間的差別,並能夠為自己的隊伍增加獲勝的機會,而西班牙對上俄羅斯也是採用類似的方法,在1比1的狀況下撐過延長賽,最後成功使比賽進入12碼罰球的PK戰,而對於兩隊來說PK戰幾乎可以說是兩方勝率各為50%,完全憑的是運氣,假設俄羅斯對上西班牙這場比賽本身的勝率只有30%,那麼透過這個戰術,最終成功讓俄羅斯隊的勝率提高,擊敗實力堅強的西班牙隊並進入前8強。

大數據跟小數據本質上其實並不互相牴觸,只是討論的層面不同罷了,並非預測所有的行為都適合用大數據作分析,選對適合的統計方法才是重點;然而,許多人都誤解了這點,才會認為機器學習無法勝任預測比賽,如果數據大部分並非來自於32強的世足比賽,而是一年舉辦數十次的職業賽,恐怕這些數據本身就不適合用來預測每四年颳起的世足旋風,才不足以滿足這些一日球迷的預期。

網站資訊

TOP