「數據派的迷思」的迷思

人笨不是罪,但笨又自以為是就是罪。

有位號稱學習哲學、教授運動倫理學的高知識份子 ( ? ) ,寫了一連串「數據派的迷思」文章。有興趣的人就去看吧,不過不管你看到什麼地方,最後的表情一定都是(…)

這傢伙最大的問題在哪裡?

我們說談一件事情前要先瞭解一件事情,他說數據派的問題前,知不知道統計是做什麼的?

未發生的事情無法預測,只能推測。而數據派,是「經由統計跟機率來分析風險,藉以推測行為合理性」理念的信徒。一個生涯面對左投手打600打數只打出50支安打的打者A,跟一個對左投手900打數有250支安打的打者B,在選擇代打面對對方左投後援時要派出誰?或許派B上去結果雙殺打,畢竟他打擊率也只有.278,也或許派A上去結果全壘打,誰知道那不是他生涯打左投手的第51安?但碰到這種狀況時,你是要直接把命運交給上帝,還是評估風險後再把命運交給上帝?

這就跟A賭盤中獎率0.083,B賭盤0.278一樣,機率會告訴你賭B的贏錢率比賭A高出3.3倍,當你非要選一個押時,你會下在哪一邊?這就是機率,它無法預測結果,但會有適當的資料告訴你每個選擇的風險高低。你還是可以選擇風險較高的,也有可能運氣好就賭到了,但是以這兩個賭盤來說,什麼時候你會想押在A上?

如果是我,除非賭A能贏的錢比賭B能贏的錢多10倍,不然我絕對押在B上頭。

盜壘、觸擊這些戰術也是一樣啊。數據派想的是,只有在它能得到的效益好到讓人覺得值得時,才有發動的價值。其實這種風險評估的數據派觀點早已經深植在棒球觀念裡,所以我們不喜歡給胖子盜壘,因為他被阻殺的機率高於飛毛腿;所以我們不喜歡在投手打九棒時讓八棒做觸擊推進,因為投手打擊出局機率遠高於其他棒次﹔所以我們會排打擊率高長打率好的人在三四棒,因為數據告訴我們這些人在打擊區造成破壞的機會高於其他選手。而所謂的「數據派」,只是在這個按風險評估概念的前提下,找出更多種拿來做風險評估的資訊罷了。

連統計跟機率沒辦法預測未來都不知道,這種人應該回去國中重讀機率,而不是跳出來寫什麼迷思的屁文。這些人最白癡的地方,就是一面抨擊數據派拿機率分析風險,一面說「這打者打擊率三成,打的不錯」。

一面說數據無用,一面又拿打擊率這個「數據」來判斷選手強弱是怎樣?同樣是數據,他看不懂的期望值就說這些數據沒考慮到實戰狀況blahblah…但誰都看得懂的安打機率就不用考慮實戰狀況?他說講觸擊的期望值數據必須把所有狀況分開,像是比分差幾分、幾局、投打狀況等等,但講打擊率時有誰把所有狀況分開?有把投手強弱、野手站位、鳥安還是紮實安打等等都列入考慮嗎?純粹只是他不想接受(或看不懂)的數據資料就拿「實戰狀況各有不同,數據不能用」,他能看懂的資料就不管「實戰狀況」而已。

就只是自以為是的白癡發的嘴砲而已。

說數據派無用,第一件事就是要推翻打擊率跟防禦率這兩個基礎數據。可是我只看到一些蠢蛋邊說要揭發數據派真面目邊死抱著這些基礎數據不放。

PS:竟然增加了那種北爛blog的點閱率,真是罪過。

在〈「數據派的迷思」的迷思〉中有 12 則留言

  1. 看了第一篇,這位大學教授顯然不知道數據派在幹嘛,一開始的想法就錯了,後面的推論我想也不用再看了(…)

  2. 據說這位先生不是教授, 只是講師. 是幸(他不是教授)還是不幸(以後會拿博士學位)?

    叉的, 想到以後如果攻讀博士會跟這種人擺一起, 就不太想去攻PhD-_-

  3. 根據動態競爭策略一書..
    蛋餅賣20、25兩種價位都有會比單一價位好賣
    所以那個林克的作者說25的蛋餅賣不出去..是錯誤的喔:D
    也就是說雖然觸擊的代價等同於25元的蛋餅..
    (不觸擊是20元的蛋餅..)
    但還是有人傻傻分不清楚:p

    當然..這是那本書的說法..實務上我不是很了解….

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *