close

即便在這個關係延畢與否的重要時刻,小弟仍要發個文章一吐煙酒生的甘苦談並與跟各位報告一下我的近況與感想~

今天講我的工作與我的論文之間的相似性~首先先來說說Andy的工作。在今年五月以前小弟的工作是it工程師或稱mis也可,主要的工作就是協助企業裡的user談談自己工作上的需求、協助企業導入資訊系統、找尋適合的solution與廠商、或自行開發、並安排教育訓練...除了這些比較有價值的事情外,有時也得接接user的電話,幫user解決問題或是開發一些報表,對了!就是報表,在企業內的it可能對這項工作感到無奈或厭煩,它算是routine的工作,在企業內的it人員有永無止盡的報表需求,加個欄位、換個計算方法、或重新組一個新的樣子.....每家公司都會有很多很多的報表需求、每個user使用角度不同,若it人員不做好規劃,會讓自己變得很累又沒價值,先不談上面這個無窮迴路如何解套,基本上開發報表的這個工作,就是根據user的需求把他們需要的欄位去不同的資料庫一個一個抓下來,然後組合起來後表現在user希望的格式上,大致上是這樣子

接著談談我的論文,Andy在做的部份叫做實證研究,就是根據現有的資料證實一個我們提出的假設。舉一個簡單又貼近時事的例子,說明研究生的工作:首先我們要看很多先前前輩、學者發表的論文,看了很多之後,以他們的理論為基礎找尋可以繼續探討的議題,譬如說有一篇文章在說明了『色情行業通常與黑道有關』、又有一篇文章在說明『棒球選手在出入色情場所後隔天的比賽容易出現異常』,根據這兩文章為基礎我們就可以創立一個新的題目來試試看『棒球選手常與黑道接觸並出入色情場所較有可能出現打假球的情形』。題目很長(因為題目短的都被做完了)、拐彎抹角(因為到處攀官附戚)、感覺跟前面基礎文章有一點關係又好像不是很完整,總之這是一個新的又有創意的題目。所以我們要蒐集資料以證明這些假設是對的,假設1:『棒球選手常與黑道接觸容易打假球』、假設2:
『棒球選手常出入色情場所較有可能打假球』,不但要證明彼此有相關甚至我們還可以為這個理論做出一條方程式:棒球選手打假球的機率=與黑道接觸的次數*係數1+出入色情場所的次數*係數2+誤差,這樣未來我們就可以用這條式子用其與黑道接觸的次數與出入色情場所的次數來估計某某棒球員打假球的機率,你看很有貢獻的學術研究吧~

好啦,來開始蒐集資料以證明我們的假說吧!首先有公開的資料例如棒球員的成績這個可以公開取得且已經整理好了,很簡單,另外呢有一些不容易取得但有人可以幫我們處理但要花錢買,例如酒店消費記錄,這大概需要找『抓猴徵信社』處理,有的時候第一手資料還需要人工處理一下,例如消費記錄我只要球員的、非球員的要刪除,然後球員是自己去的還是朋友帶去的?朋友是不是黑道?你看這個工就很複雜了吧,要篩選還好,有的還要自行判斷,我哪有天大的能力可以取得台灣黑道名單,所以有一些只好自己來,依據過去文獻記載『理平頭穿黑衣服的有可能是黑道(信心指數75%)』有理論根據喔~所以我可以自己判斷,但要承擔誤判風險,所以不要在跟穿黑衣的Andy一起去吃飯,因為你有可能因此被誤判與黑道有掛勾.......有了數據資料偶爾還要做個運算(計算比賽失誤次數並與整體水準做比較...可能失誤大家都很多就會找不到異常了)還要比對時間關係(9/8晚上上酒店,9/9比賽輸掉,這是同一組的資料,9/9晚上那一拖是慶功宴請排除)

寫到這邊有發現相關的嗎?Andy的論文跟開發報表在某些地方蠻雷同的,在確定論文架構之後要去找欄位資料、找資料庫、有些資料還要運算、配對、篩選,然後組合在一起,在丟進去統計軟體跑結果之前,也是要做一份大報表,報表上的每個資料都要小心的蒐集、比對,若一個環節出錯了,有可能會讓這個報表結果相差十萬八千里。所以囉~做it的要來念財務是ok的啦,做的事情都差不多,假設您有心想進修歡迎同行來報考~

當然一個研究生要蒐集那麼多的資料是很困難的,所以如果同一個指導教授底下是在做相關研究的,是可以一起合作共享資料的,研究『棒球員打假球』的同學可以跟『研究官員與黑道掛勾關連性』的同學共享黑道、酒店的資料,所以有些教授通常會發揮團隊戰鬥力一口氣帶多個學生同時發出『棒球選手常出入色情場所較有可能打假球』、『官員常出入色情場所較有可能貪汙』、『丈夫常出入色情場所較有可能外遇』、『老師常出入色情場所較有可能對學生性騷擾』(....這......有哪位教授敢簽名背書的呀.......)等一連串類似的論文發表

總之團隊合作很重要啦,但就在Andy拿到其他先進的資料時,又一個多年以來的工作議題又浮上心頭....還沒出來社會闖蕩的『博士班』弟弟也許真的只是一時不查抓錯資料也有可能為了讓後續的統計程式跑起來比較漂亮,做了一些『調整』......anyway Andy不追究真正的原因,總之拿到一些整理好的data,一時對於這些資料比較有感覺的我,馬上覺得很難接受......金鋒兄是辣妞隊不是香蕉隊啦、金錢豹旗艦店不是在台北是在台中、棒球的打擊率不能用籃球的命中率來比較的....雖說資料本就需要一些調整、篩檢、計算後才去跑,但raw data的事實,擺在眼前的荒謬讓我很受不了,why?我的反應如此迅速?因為我對那些資料有感覺,在學校裡的同學也許對這些外界的資料不是那麼清楚,他只是照著老闆的要求去哪裡哪裡抓下來然後組起來,也許資料有誤,他們也一時感覺不出來,但他們不管資料內容只重資料的來源與組成架構.....

it人員需要對系統內的資料敏感嗎?一個經驗告訴我,it人員只需要將user要的資料依據架構把報表寫好,it人員基本上是不可以看到real data,尤其是財務、人事方面的資訊,即便user可能給了錯誤的需求說明,但也只能依user的葫蘆來畫,『我只管系統、不管data』。另一個經驗告訴我it是要敏感的,對於公司的營運敏感、對於自身的系統資訊內容是了解的,是至可以主動發現異常知會公司,it了解user關心資訊可以立即幫user找到正確的資訊,而非你講你的,做出來卻不符user所要的,因為user可能沒有完全的了解,好的it人員了解系統也了解每一筆系統的資料可以提供企業內user即時、滿意的資料,並以user的角度來看系統

好像兩個原則矛盾了,是的,兩個理論Andy都遇過,有可能不同狀況下站的立場要不一樣,或是說當有機密資料出現時,it人員應具備『非禮勿看、非禮勿言』的道德感,在處理的論文中的data時這個問題有再度引起了我之前的思考。當然現在身為煙酒生的我,當然是要誠實面對每一筆record對他們負責,既然我知道真相了,就不可以隱蔽真相,但我卻有可能會因此做出『打假球與出入色情場所無關』的結果,或是『棒球選手去過色情場所後隔天球會打得更好』的大逆轉結果......在本學期即將結束的關鍵時刻,Andy就在這些真真假假的資料中找尋一條可以生存下來的路......管你上不上酒家、有沒有打假球,我只想畢業啦......

所以呢?怎麼呢?煙酒生要自己想辦法.....『打假球與出入護膚店有關』(縮小範圍)、『上色情場所容易打球失常』(換個認定方法)、『跟平頭黑衣男子一起出入色情場所容易打假球』.....反正就開始往左右兩邊都推敲看看,或是把統計軟體裡的勾勾、按鈕都點點看....這種沒有科學精神的嘗試開始出現了。做論文日子好充實,每天日子都過得好快,也對其他以外的事情越來越不感興趣了,每天也都有進度,但一週下來之後看可能只是原地打轉一場,只有倒數計時的日子一天一天很明確的在減少
....是不是能把這個題目做出來已經不重要了,只希望這群資料裡,能有一個『顯著』的結果,讓我有證據可以憑三吋不爛之舌說服口試委員.........『上酒家好呀!只要做data跑得的出來,煙酒生也可以上酒家、人人都可以去呀~』

這就是我的煙酒生活~凡收到此文者請協助祈禱佛祖、上帝、阿拉、玉皇大帝....等眾神讓Andy的data早日得到『顯著』效果讓他可以回民間去撈錢,阿彌陀佛、阿們~

arrow
arrow
    全站熱搜

    dejavugreen 發表在 痞客邦 留言(1) 人氣()