來源:中國報(bào)業(yè) 2018-06-14 10:19:43
2015年5月到12月間,我參加了哥倫比亞大學(xué)新聞學(xué)院下設(shè)的Lede項(xiàng)目。這是一個(gè)專門培訓(xùn)數(shù)據(jù)記者的項(xiàng)目,課程涵蓋了統(tǒng)計(jì)、高等數(shù)學(xué)、計(jì)算機(jī)算法、數(shù)據(jù)庫應(yīng)用以及可視化制作等方面的內(nèi)容。在這半年多的時(shí)間里,我接觸到超過20種軟件及編程語言(見下圖),以供處理不同類型的數(shù)據(jù)。
一、背景環(huán)境及課程開設(shè)初衷
作為美國歷史最悠久的新聞學(xué)院之一,哥倫比亞大學(xué)始終走在新聞教育的前沿,不僅為全球新聞行業(yè)培養(yǎng)了諸多優(yōu)秀的記者和編輯,同時(shí)也在不斷探索媒體行業(yè)的走向和發(fā)展。數(shù)據(jù)新聞起源于上世紀(jì)六十年代末,一個(gè)叫菲利普·梅耶(Philip Meyer)的記者他所供職的《底特律自由報(bào)》使用當(dāng)時(shí)的大型計(jì)算機(jī)(mainframecomputer)整理和收集政府的公開數(shù)據(jù),并嘗試在報(bào)道中加入數(shù)據(jù)調(diào)查結(jié)果。后來,做了教授的梅耶寫了本叫《精準(zhǔn)新聞》(Precision Journalism)的書,詳細(xì)記述了自己對(duì)數(shù)據(jù)的理解和經(jīng)驗(yàn),這本書已成為數(shù)據(jù)與調(diào)查新聞?lì)I(lǐng)域的經(jīng)典著作。到了八十年代末,隨著辦公電腦的普及,數(shù)據(jù)新聞扮演的角色也越來越重要,而通過電腦協(xié)助完成的報(bào)道也開始斬獲像普利策這樣重量級(jí)的獎(jiǎng)項(xiàng)。越來越多的從業(yè)者開始意識(shí)到數(shù)據(jù)新聞的價(jià)值,而全國計(jì)算機(jī)輔助報(bào)道協(xié)會(huì)(NICAR)也于1994年在密蘇里新聞學(xué)院正式建立,給業(yè)內(nèi)人士和新聞學(xué)院學(xué)生提供了更多交流和學(xué)習(xí)的機(jī)會(huì)。到了本世紀(jì)初,隨著社交媒體和手機(jī)應(yīng)用的迅速發(fā)展,傳統(tǒng)新聞行業(yè)受到嚴(yán)重打擊。老牌紙媒虧損?牟辉谏贁(shù),一大批記者不得不離開紙媒,去互聯(lián)網(wǎng)公司尋找機(jī)會(huì),網(wǎng)絡(luò)媒體的地位不斷得到提升。這些公司依賴于網(wǎng)站訂閱和社交網(wǎng)絡(luò)的傳播,大量的讀者是手機(jī)與平板用戶。此外,它們的另一特點(diǎn)是對(duì)于數(shù)據(jù)與交互可視化的重視。
正是在這樣的大環(huán)境下,哥倫比亞大學(xué)新聞學(xué)院的兩位教授艾米麗·貝爾(Emily Bell)和馬克·漢森(MarkHansen) 在聊到目前數(shù)據(jù)新聞的發(fā)展和數(shù)據(jù)記者的短缺時(shí),不謀而合地提出開設(shè)數(shù)據(jù)培訓(xùn)課程的想法,于是便有了Lede項(xiàng)目。
二、緊貼行業(yè)發(fā)展的課程設(shè)置
1. 交互可視化
雖然學(xué)習(xí)的內(nèi)容大多與計(jì)算機(jī)和編程相關(guān),但Lede的宗旨并不是培養(yǎng)程序員,而是希望學(xué)員能夠更加準(zhǔn)確地分析和運(yùn)用數(shù)據(jù)。它的課程分為四個(gè)方向:統(tǒng)計(jì)學(xué),交互可視化,數(shù)據(jù)分析和計(jì)算機(jī)語言。Python,SQL, D3.JS,這些目前在數(shù)據(jù)新聞界最流行的幾種工具對(duì)于文科出身的記者來說,可能十分陌生。但實(shí)際上,只要掌握一些基本數(shù)據(jù)結(jié)構(gòu)和編程語法,就可以開始編寫簡單的程序去整理和分析數(shù)據(jù),接下來便是抓取網(wǎng)頁信息和制作可視化新聞。
Lede課程總長度為兩學(xué)期。第一個(gè)學(xué)期從5月到8月,學(xué)習(xí)使用編程語言Python進(jìn)行處理數(shù)據(jù),抓取網(wǎng)頁,建立模型, 以及簡單的機(jī)器學(xué)習(xí)。第二個(gè)學(xué)期從9月到12月,有了一定編程基礎(chǔ)的學(xué)員可以根據(jù)自己的興趣在高等數(shù)學(xué)、數(shù)據(jù)結(jié)構(gòu)、統(tǒng)計(jì)分析、交互可視化制作、大數(shù)據(jù)挖掘等不同領(lǐng)域選擇進(jìn)修方向。
進(jìn)修之前,我有一年的數(shù)據(jù)處理和可視化制作經(jīng)驗(yàn),卻從未涉及過電腦編程。我大部分情況下都是使用軟件,比如Excel和Access,以及可視化工具Tableau,還有各種制作時(shí)間軸(Timeline)或是信息圖(Infographic)的網(wǎng)站。使用這些資源的好處是上手容易,完成的快。但缺陷是形式比較單一,缺少個(gè)性化。上課期間, JavaScript 的一個(gè)函式庫D3建立動(dòng)態(tài)數(shù)據(jù)圖,令我眼界大開:它設(shè)計(jì)出的圖像簡潔、美觀,功能豐富,交互性強(qiáng),很符合媒體的需求。
隨著線上讀者的不斷增加,新聞網(wǎng)站越來越重視在新聞中加入交互與可視化元素。目前被媒體網(wǎng)站廣泛使用的開源語言D3.js的開發(fā)者M(jìn)ike Bostock曾是紐約時(shí)報(bào)的一名圖片編輯,他開發(fā)的這款工具大大提高了數(shù)據(jù)圖的專業(yè)度和靈活性,并且兼容手機(jī)瀏覽器:
以下是幾個(gè)D3動(dòng)態(tài)圖案例:
《紐約時(shí)報(bào)》——通往白宮的512條路
《紐約客》——美國高;@球隊(duì)的預(yù)算之爭
《那些孤單的人們》—— Lede項(xiàng)目往屆學(xué)員作品
2.?dāng)?shù)據(jù)分析能力
去年獲得普利策調(diào)查新聞獎(jiǎng)的作品《揭秘聯(lián)邦醫(yī)療保險(xiǎn):數(shù)字背后的故事》(Medicare Unmasked: Behind the Numbers)(《華爾街日?qǐng)?bào)》)通過分析超過一百萬份醫(yī)療賬單,公開了聯(lián)邦醫(yī)療保險(xiǎn)系統(tǒng)中6000億美元的走向, 以及這個(gè)保險(xiǎn)給醫(yī)院和醫(yī)生帶來的收入變化情況。
專門報(bào)道體育和政治新聞的網(wǎng)站538(FiveThirtyEight)以預(yù)測比賽和大選結(jié)果見長。主編Nate Silver在12年大選期間,利用數(shù)據(jù)模型近乎完美地預(yù)測每一輪的投票結(jié)果,并寫成文字報(bào)道,廣受業(yè)界好評(píng)。自由撰稿人,博客網(wǎng)站“I Quant NYC”的作者Ben Wellington 通過分析紐約市交警一年的罰單記錄,發(fā)現(xiàn)了紐約最“掙錢”的消防栓一年的“收入”竟多達(dá)55000美元,合計(jì)33萬元人民幣。
這些獨(dú)家新聞的背后,是深度的數(shù)據(jù)分析和統(tǒng)計(jì)知識(shí),F(xiàn)在無論是政府還是企業(yè),數(shù)據(jù)越來越多地被當(dāng)做資源利用。作為記者,能夠拿到獨(dú)家數(shù)據(jù)無疑是如獲至寶。但能否用好這些寶貝,還要看記者本身的分析能力。 Excel是一個(gè)簡單又好用的軟件,可以錄入數(shù)據(jù),整理歸類,進(jìn)行計(jì)算(總和、平均數(shù)、方差等等),還可以制作簡單的數(shù)據(jù)圖表。
相關(guān)推薦:
小升初試題、期中期末題、小學(xué)奧數(shù)題
盡在奧數(shù)網(wǎng)公眾號(hào)
歡迎使用手機(jī)、平板等移動(dòng)設(shè)備訪問幼教網(wǎng),幼兒教育我們一路陪伴同行!>>點(diǎn)擊查看