林照真專欄/嚴防人工智慧破壞新聞原創性
  • Line

A A A
2023-09-01 00:00

林照真/臺灣大學新聞研究所教授

有關人工智慧(AI)的發展究竟會帶來人類光明的未來,還是無力阻擋的黑暗世界,一直都是科技界無止休的辯論。即假如此,AI股市高漲,顯見人類自我感覺渺小、與堅信科技必能帶來人類福祉的信念,從未動搖。

就在AI一片叫好聲中,幾家全球性的新聞媒體,主動採取反制措施,目的在於保護自家的新聞著作權。包括《紐約時報》、美國有線電視新聞網(CNN)、《路透社》以及澳洲公共電視(ABC)等媒體,均已封鎖ChatGPT的OpenAI,不得利用爬蟲程式,抓取網頁的新聞內容。

數位時代來臨後,新聞媒體成為眾多資訊來源之一。不同於一般民眾的自由創作,新聞媒體報導必須聘僱具有一定專業的新聞工作人員,透過採訪、資料整理等途徑,完成一篇篇求真的報導。其中的人力成本高低,也代表新聞界不同的報導品質。

數位時代從一開始,就伴隨著資訊應該開源的理想遠景。當時很多人都相信,透過中立的數位科技,資訊可以獲得更高自由度的四方傳播,文明可以更透明與平等。也因此,訊息應該透過科技無償地自由流通,數位公民應不吝於分享,共同提升全人類的資訊權。

此時此刻,檢驗上個世紀的夢想,其實是人類無私的情感表現,卻可能忽略太多現實。新聞內容先天具備高人力成本,本身又有一定的公共價值,以致外界對新聞內容的使用更無禁忌,忽略新聞實為有價的內容。

人們在想像內容應該無償時,也同時預設科技中立的前提,事實發展卻非如此。在全球新聞媒體同樣沾沾自喜,可以使用社群媒體、數位科技,讓新聞傳播得更廣、更遠時,真的完全沒有意料到,數位科技位使用演算法,成為新聞內容的主導者,並且成為廣告市場的強勢競爭者。

跨國性的科技公司首先免費提供數位工具供民眾使用,然後收集全球使用者的個人數據。過去新聞媒體提供數以百萬、千萬使用者的新聞服務時,從未收集使用者的個人資訊。如果伺服器可以發出聲響,就可以聽到自己上網時,個人喜好與收看影片等各類數據,不斷發出滴滴答答的聲響,迅速流進平台巨人的主機中。

平台科技公司掌握個人數據後,接著使用演算法等機器學習科技,進行個人化內容與廣告訊息的傳播。其中大肆利用新聞公共的性質,逕自轉為自家公司謀利的工具。像是無顧忌地使用新聞內容發展新聞引擎、入口網站、並在其中穿插廣告資訊、或是自創關鍵字廣告模式,再研發不需一秒時間,就可自動完成交易的廣告系統。

果然,新聞媒體成為市場競爭下的失敗者,科技公司成為前所未見的廣告梟雄。然而,科技公司無償且不當使用新聞內容在先,終於引發全球媒體公憤,要求科技公司如Google、Meta、Microsoft、Apple等,必須為使用新聞內容付費。

就在全球媒體新主張新聞使用權向平台索賠、尚未竟其功時,有關人工智慧(AI)的研發,已在2022年掀起股市大戰。全球熱議ChatGPT,至今熱度未減。

ChatGPT為一文字自動生成的AI人工智慧。電腦經過學習訓練後,這項AI科技可以快速生成文字,並且使用「改寫」手法避開新聞著作權的問題。只要輸入相關的關鍵字,一個個專題可以快速生成。

多快呢?十秒以內。如果對第一篇自動生成的文章不滿意,還可以再按鍵,另一個十秒內,再生成另一篇新的文章。同時,保證不會有錯字,還能立刻翻譯成不同國家的文字。

新聞界很快討論與報導ChatGPT,可以嗅出其中顯露的恐慌與畏懼,人類遭機器人取代的時代終將來臨。這期間,也會聽到專家不斷安慰,AI科技不會取代人類;只會取代不會使用AI的人類,似乎企圖創造共榮的美麗烏托邦。

Google和Meta之所以能夠成為全球兩大廣告霸主,是因為新聞媒體在應付來勢洶洶的數位轉型浪潮時,科技力量完全不敵Google和Meta而導致。加上誤以為Google和Meta可以提供中性的演算法,才會在廣告市場中敗下陣來。

在這一次AI的科技競賽中,目前全球新聞機構,正面臨人工智慧是否收集自己的新聞內容提供免費閱讀;以及AI公司是否使用爬蟲程式,抓取所有新聞內容,用來訓練AI模仿新聞生成的全球共同問題。

科技公司在第一波機器學習的平台科技創新中,在各自的平台無限制使用新聞媒體內容時,新聞界財務緊縮,媒體倒閉、新聞記者失業等問題,連續在不同國家出現。如今,AI科技同樣開始進行另一波的機器學習,新聞媒體內容再度成為AI資料庫的預想內容,新聞媒體必須正視這個問題。

新聞媒體的科技力量或許依然不如科技公司,唯一的自保之道,就是認真保護自己的智慧財產權,也就是不讓自己的內容又遭使用與複製,才可能突破科技大廠的內容剝削。

新聞媒體不能重蹈覆轍,面對這一波的AI攻勢,必須小心翼翼。