數字不會騙人,但數字統計會

之前看到某個深綠ㄉㄉ eslite12和其信眾們,為了證明他們說的大安區偏綠,做出了超經典的統計推論。

拿台北市幾個區的外省人比例和得票率來做迴歸曲線,然後說比這曲線高的就是偏綠,低的就是偏藍。哇哈哈哈、敢情他們認定那條曲線上的點是中性的,是不偏綠也不偏藍的,所以比這個曲線高的就偏綠嗎XD

到底為什麼台北市的外省人比例跟得票率在XY圖表上的點,就代表是不偏綠也不偏藍的呢?這根本是風馬牛不相干的東西吧。連先射箭再畫靶都可以搞的比這種屎蛋推論還乾淨呢,你會拿一個段考英文科全班平均分數,然後說真詭異啊小明怎麼會考的比平均分數高呢,這當中必有緣故啊嗎?本來你拿一堆數字取平均,就會有比平均高的跟比平均低的,這種理所當然的事情還在那邊扯說背後必有因素,然後再說我找到答案了,這因素就是大安國偏綠,真是笑死人啊哈哈哈。

不過其實那批ㄉㄉ也沒多久好爽了,再過半年,總統大選的結果就會徹底打爆他們的臉,不知道到時候他們是會死鴨子嘴硬的繼續凹說他們的分析正確,還是就這樣消失在網路上呢XD

話說來看看這篇新聞(本站備份)︰

6個美國人 就有1個窮人

近半青年赤貧 歐巴馬失民心
2011年 09月15日
【陳家齊╱綜合外電報導】美國貧窮人口去年再創新高,貧窮率也升到17年新高,顯示長期貧富不均、居高不下的失業率,已讓更多美國人淪為窮人。經濟學家警告美國已經出現「失落的10年」,美國民眾對歐巴馬總統的不滿意程度也再創新高。

根據美國人口普查局(U.S. Census Bureau)最新的調查報告,2010年有4620萬的美國人口所得低於標準,活在貧窮線以下,創1959年開始統計以來的最高數字。

貧窮率創17年新高
美國貧窮人口所佔總人口的比率,或稱貧窮率,則是升高到15.1%,創1993年以來的17年新高。這等於將近每6個美國人就有1個是窮人。
報告中還顯示一般美國家庭的平均年收入已經跌回1997年的水準,等於是13年的停滯。哈佛大學經濟學教授卡茲(Lawrence Katz)說:「這真的是失落的10年。我們還以為美國人一代生活得比一代好,但事實上是一般家庭所得比1990年代末期還糟。」2010年的美國家庭收入中位數為49445美元,比1999年還低7%。

失業率仍高達9.1%
失業率居高不下是美國貧窮人口激增的主因。儘管美國在2007年12月開始的經濟衰退已經在2009年6月結束,但美國失業率至今仍然高達9.1%。失業人口多,被迫退休、打零工的人也很多,家庭收入自然銳減。
美國總統歐巴馬上周發表就業演說,呼籲國會通過約13兆元台幣的就業刺激方案。貧窮人口激增可能讓共和黨承受必須通過法案的壓力。但是共和黨也能藉此指摘歐巴馬治國無方,讓美國人變窮。美國有線電視新聞網(CNN)最新調查顯示,美國民眾對歐巴馬的不滿比率高達55%,比7月、8月間的54%再創新高。認為歐巴馬表現良好的民眾僅有43%,但仍遠高於國會的15%。

年輕人靠父母過活
貧窮人口認定標準每年都會隨物價調整,2010年的統計標準是四口之家的年收入若低於22314美元(約65.8萬元台幣)就是窮人。
這次統計也證實了美國的青年貧窮問題。若不計父母的所得,25到34歲的美國人近半屬於貧戶,即獨身的收入低於約32.86萬元台幣。

報你知 貧窮率
貧窮率是指貧窮人口所佔整體人口的比率,貧窮人口則是收入低於「貧窮門檻」(poverty threshold)的人。美國人口普查局根據最基本的食物、住房、交通需求,參考通貨膨脹,計算得出「貧窮門檻」的數字。
台灣的貧窮人口是以符合「低收入戶」資格的人計算,台北市的低收入戶補助門檻是每人每月所得低於14794元台幣(每年17.75萬元),擁有的自有住宅價值不得超過550萬元;台灣省是10244元台幣,住宅不得超過300萬元。台灣依低收入補助門檻計算的貧窮率明顯過低,不到2%。

喔喔喔支持中國崛起或社會主義的人要爽翻了,米國這麼先進的國家竟然有六分之一人民是窮人,這一定代表了資本主義的失敗,代表美國霸權的日落西山!

真的是這樣子嗎?

之前有聽過一個很北爛的說法,他說米國之所以厲害不是沒道理的,看看他們的窮人,平均起來一戶只擁有一棟房子跟一台車子而已.連窮人這句話的定義都跟世界上其他國家不一樣,連在米國當窮人的換在別的國家可能都算有錢人,真不愧是美帝啊。

這話當然有點誇張不實(無殼蝸牛睡在地鐵站的流浪漢也是很多的),不過其實反映了一個事實︰米國人計算貧窮的方法跟別人不一樣。

話說這個界定一戶家庭是不是窮人的貧窮線是這麼來的。1964年時人口普查局決定,要判定一個四口之家算不算貧窮,就認定每個家庭的餐費支出約為收入的一半,然後再設定「能供給這個四口之家的成員充足營養的食物,所需的餐費為多少」,將這個餐費乘以三,如果家庭所得比這數字小,就代表這個家庭賺的錢不夠供給其成員吃的營養,那就是窮人。之後每年這個貧窮線在根據物價指數等等做調整。

也就是說,今日的米國貧窮線基準,用這公式推算回去的話,大概就是一個四口家庭每天的餐費要有20美元(約600元台幣),否則就是窮。

看到這種算法,會不會讓人覺得他們的窮人可能平均擁有一棟房子一台車子也沒有那麼奇怪了啊?XD

所以其實我一直不是很喜歡某些數據派,應該說不是每個人都跟Bill James一樣嚴謹,願意推翻自己的舊觀念,而且提出新看法的時候不會做太多想當然爾但實際上很白爛的假設。打個比方來說,在OBP當道的那幾年,大家都說腿哥是垃圾,第一棒根本就不需要速度,只要會上壘就好,就算慢的跟烏龜一樣也沒關係。

當時我算了綠帽被雙殺的比率,高到嚇死人。可是當時數據派的主流是什麼?是認定雙殺是運氣,就是衰而已,你堆一群烏龜到壘包上,後頭還有打滾滾的人,也不會被雙殺害死的啊。那種看法就是太過於自以為是。

沒錯,雙殺在普遍看法下可以當成是運氣,不過也有例外情況,你堆卡車司機在壘包上是例外,你在一壘有人時讓丁eter打是例外,你對上受傷前的Brandon Webb也是例外,當這些情況出現時,雙殺的發生就不只是運氣了。

因為認為某種事件的發生純屬運氣,所以定義出不會考慮這種事件發生的數據,然後說這是去除了運氣因子比較準的東西,就是很多數據派ㄉㄉ最會犯的錯啊。「巨觀看來像是運氣,可是微觀來看呢?有沒有在某種情況下這就會變成不是運氣呢?」

認定數據能解釋一切現象,過度高估數據的價值。或是為了證明自己的觀點正確,就去設計對自己有利的統計方法或是做出對自己有利的數據解讀。如果搞數據會弄成這樣子的話,那還不如不去搞會比較好哩。

在〈數字不會騙人,但數字統計會〉中有 10 則留言

  1. 很不錯的文章! 不過根據地方勢力的消息指出,明年總統大選的結果應該還在未定之天. 應該沒那麼快下定論才是

  2. 「不過其實反映了一個事實︰米國人計算貧窮的方法跟別人不一樣。」

    套回去的話其實就是不同地區不同情況下用的標準可以不一樣,既然這樣的話,在不同的基準上,論台北市藍綠光譜,或是族群影響之類分布差異,其實還是有他的意義就是,至於哪些條件可以設定或是研究方法合不合理,倒是還有討論的空間。

    老實說我會覺得這種爭論有點雞同鴨講了,你認定的偏綠就是超過得票超過 50% 就是綠,他們認定的看起來是在那些條件下,比平均值高就是偏綠,如果期待大安國這次民進黨不會過半(這應該是廢話) 他們就會閉嘴,這可能會有點難 :p

  3. 阿ㄈ版主

    對您精闢的棒球知識和文章一直很感興趣..可以說說您心中美職最厲害的打者和投手嗎..

    巨人隊今年好像連季後賽都進不去的感覺..NBA那種5成以上勝率就可以拿到季後賽進場資格的事情好像不存在MLB?

    您覺得MLB賽制是否有盲點? 一隻去年的冠軍隊 今年也不是說很差 卻快連季後賽都進不去?

    謝謝撥冗回答

  4. modern day還是all-time?XD

    現役打者的話, 當然會選Roy Halladay和Albert Pujols吧. All-time的話, 打者我會選Barry Bonds和Honus Wagner, 投手的話大概是Christy Mathewson和Pete Alexander(個人喜好XD)

    另外我不覺得現在的賽制有啥不好啊, 反而我反對再增加進季後賽的隊數, 進的隊伍數太多的話playoff打太久了, 而且現在Divion Series的關注力已經不夠了, 還再多一輪的話還得了-_-

    當然季後賽場次增加門票收入會更好, 可是我不喜歡這樣弄成季後賽太容易打進去的情況-_-

  5. to Pig:

    不是雞同鴨講, 他們根本就沒有認定”看起來是在那些條件下,比平均值高就是偏綠”, 只是他們玩弄數據要騙你們而已.]

    “用我的公式算來, OO區支持民進党的比例應為20%, 但實際上是25%, 可見這個區原本的住民都支持民進党”, 他們說的也就是這種漏洞百出的白爛話而已.

    而且還有哩, 比方說這個
    http://www.ptt.cc/bbs/Datong/M.1166796732.A.E5A.html

    你看的出這篇文章最致命的問題在哪裡了嗎XD

發佈回覆給「路過的」的留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *