新聞排序、事實查核怎麼做? Google 新聞副總首次來台揭露

Google News 如何讓新聞工作者提升新聞品質和增進事實查核的能力呢?近日 Google News 副總裁正好來台參加活動,也利用空檔時間和台灣媒體聊聊。

Google 在新聞生態不遺餘力,提供 2500 萬美元的創新基金,協助新聞機構與出版商強化線上影音品質,在去年由 EBC 與關鍵評論網獲得獎項,也在去年成立 Google 新聞倡議計劃亞太區創新挑戰(Google News Initiative Asia Pacific Innovation Challenge)鼓勵媒體提出各種提升營收的創新商業模式,天下雜誌成為台灣唯一入選媒體。

Google News 專注在新聞生態發展,於去年 3 月宣布推出 Google News Initiative (GNI) ,挹注 3 億美元用於提升新聞品質、探索新的永續發展模式,透過科技刺激新聞編輯室的成本效益。

不過究竟從媒體識讀來看,Google News 如何讓新聞工作者提升新聞品質和增進事實查核的能力呢?近日 Google News 副總裁 Richard Gingras 正好來台參加活動,也利用空檔時間和台灣媒體聊聊。

Gingras 帶領的團隊業務範圍包含:如何在 Google 搜尋呈現新聞、Google 新聞和智慧裝置上的策略、 Accelerated Mobile Pages (AMP) 、Subscribe with Google 平台、Trust Project、提供新聞工作者所需的工具等。持續新聞在平台上持續健康與開放的生態系。

Google 觀察到內容出版商的收入穩定程度取決於從讀者方得到的收入,因此大力支持透過提供創新商業模式方式推動的出版商,以利新聞產業能正向循環,也是 Google News Initiative (GNI) 的價值所在,提升事實查核力與新聞工作者的能力,維持網路資訊的健康生態。

媒體搶排名?揭開 Google 新聞排序

Gingras 解釋 Google 新聞背後的機制,在排名部分包含兩項指標,包含關聯性、內容權威性與發布時間,除了會篩選和用戶關聯性高的內容,如同在 Google 搜尋找尋資料一樣,使用者輸入關鍵詞,該媒體的文章中有多少內容和關鍵字相關。

另外,會考量該媒體在相關領域報導的權威性,像是某出版商的內容主題集中在該領域,那麼在相對的新聞主題上就會排在較優先,和 Google 的網頁排名 PageRank 機制類似。

至於在發布時間,則會根據該篇新聞發表時間序調整,所以可能在十五分鐘內所看到的內容或是排序就會有差異。

為了讓新聞搜尋結果更可靠,Google 在世界各地招募評價員(Rater)來衡量, Gingras說明評價員經過 Google 的培訓以及測試,不過他們並不是非決定內容的排序,而是依照Google’s Quality Rater Guidelines 比較新舊演算法調整的結果,而這項就指南手冊高達 196 頁,可見得 Google 面對新聞內容的謹慎程度,Google 會根據評定員的結果, 建立精進演算法模型優化演算結果。

Google 新聞與 Google 搜尋 各司其職

Google 搜尋需要根據搜尋習慣幫你更快找到相符的結果,但是 Google 新聞需要做得事情是維持平台的公平性,把焦點聚焦在「現在正在發生哪些新聞事件」,因此在新聞內容的呈現邏輯上就會和 Google 搜尋的機制不同,舉例來說透過 Google News 訂閱特定的出版內容,不會因此改變你的結果排序,而是會顯示在訂閱內容的欄位上,讓你清楚知道呈現出的資訊來自個人訂閱。

此外,Google 新聞透過演算法尋找報導,「完整報導」則會顯示各方觀點和相關內容。除了選擇的語言和地區,以及訂閱的版面之外,報導不會採用其他個人化功能,而在 Google 新聞也將個人化的動態牆區分開來。

與地方政府、NGO 合作 落實新聞查核

讓人好奇的是,Google News 是否會在地化與更多新聞機構、政府、NGO 合作,讓新聞查核落實更加徹底,Richard Gingras 表示一直以來他們也致力和地方政府、NGO 等合作,讓組織機構來源更精準的內容可以呈現於頁面較上方的排序。

另外,Google 也致力和事實查核社群合作,透過科技的方式以框架、數據庫等,善用 Google 優勢開發更科技的實用工具,協助事實查核落實,也讓新聞工作者更易於判斷內容正確性。

Google 在台灣也落實與地方單位攜手,像是去年就爭取到舉辦新聞實驗室的機會,以基礎的方式讓新聞工作者學習提升內容品質、打擊假新聞,另外也持續和台灣事實查核中心合作舉辦培訓營,Google 推派相關人士前往推廣,讓新聞工作者認識相關工具設計、實作,未來不只是新聞工作者,也會將這些媒體識讀更廣泛推向民眾。

此外,也和新聞查核自願者像是 MyGoPen、Cofacts 網站合作,在特定的謠言內容、爭議事件的報導會出現事實查核的標籤顯示事實的正確百分比,Google 作為開放的平台,關注挑戰和機會,顯然還是要將自主權還給用戶,讓民眾能自行判斷內容可靠性,確保知識的傳播與資訊自由的流通,發揮科技力量創造更良好的新聞環境。

延伸閱讀:



最新發展:

Photo Credit: Shutterstock / 達志影像
Photo Credit: Shutterstock / 達志影像

讓每個員工都成為 AI 詠唱師!APMIC 大型語言模型與 HPE 伺服器助 AI 加速落地

APMIC 推出的「CaiGunn 開講」在地化大型語言模型,結合 HPE ProLiant DL320 Gen11 和 DL380a Gen11 伺服器,提供高效生成式 AI 應用,助企業加速 AI 專案部署。 透過強大的硬體支持,該模型在智能客服和知識管理上顯著提升效率,解決應答率低和內部文件管理問題,強化企業競爭力。

生成式 AI 持續帶動產業革命,無論是內容生成、智慧客服、程式轉寫等領域均展現出絕佳的回應能力,成企業轉型及強化競爭力的關鍵武器,企業無不將導入生成式 AI 視為最重要的下一步布局。然而,在人才不足、預算有限的狀況下,企業若單憑一己之力推動生成式 AI 相關專案,恐將陷入推動時程長、成效難以預估等困境,故導入市面上的成熟 AI 模型被認為是最佳解方。

不過,生成式 AI 市場百家爭鳴,如雨後春筍般出世的 AI 公司及解決方案令人目不暇給,彷彿「亂紀元」般讓企業無所適從。而 APMIC(亞太智能機器)指出,企業要導入生成式 AI 模型強化競爭力時,可從兩大關鍵面向下手,如讓內部更多人能夠參與並投入 AI 專案的開發;以及所選 AI 解決方案是否涵蓋完善的系統整合,減少需要做出更多選擇和評估的時間。

AI 讓溝通不可限量  APMIC 助企業強化智能客服及內部知識管理

「CaiGunn 開講」是由 APMIC 打造的在地化大型語言模型,企業人員只要將現有的文章、網站或是文件資料上傳,不須撰寫任何程式,就能打造出最聰明且接地氣的聊天機器人。此大語言模型更支援各種資料格式的訓練,包含文字檔案、表格和網站爬蟲等,並且能夠根據特定任務進行微調,以提高在特定領域的表現。

▲「CaiGunn 開講」介面示意圖
▲「CaiGunn 開講」介面示意圖

在節省人力、加速專案時程等前提下, APMIC 獨家推出資料整理自動化機制,藉由系統之間 API 串接、資料去識別化、資料自動貼標與轉換等步驟,可快速利用資料進行訓練與調校的速度。「CaiGunn 開講」內建核心引擎判斷意圖機制,可節省客服系統的 20% 回覆時間,加上產品內建的提示範例達 100 多組,助每個員工都一鍵套用、輕鬆能成為善用 AI 工具的工程師「詠唱師」。

軟硬整合是關鍵 HPE ProLiant Gen11 伺服器 專為 AI 應用而生

APMIC「CaiGunn 開講」整合專為 AI 應用所設計的 HPE ProLiant DL320 Gen11 / DL380a Gen11 伺服器,藉由內建加速器的 Intel Xeon Scalable 系列處理器與 NVIDIA GPU 晶片之間搭配,能協助企業將 AI 模型於公司內部快速落地,可實現絕佳的 AI 效能,以及最優異的應用程式可攜性。 Intel Xeon Scalable 系列處理器內建加速器,可實現更優異的核心效能和無與倫比的 AI 效能,以及最優異的應用程式可攜性。

近年來, HPE 在 AI 領域也投入大量資源,推動多項創新和應用。其中, HPE ProLiant DL320 Gen11 / DL380a Gen11 伺服器即為是專應對生成式 AI 應用的需求而生,主打可以免去開發和部署生成式 AI 基礎架構的複雜性,助企業加速完成「對話式搜尋」、「業務流程自動化」和「內容創作」等生成式 AI 模型的部署。 HPE ProLiant DL320 Gen11 伺服器是專為邊緣 AI 應用設計,最多可安裝四張 NVIDIA L4 GPU 卡,同時內建 NVIDIA Metropolis 工具;而 HPE ProLiant DL380a Gen11 伺服器則是為生成式視覺 AI、自然語言 AI 模型等應用設計,最多可安裝四張 NVIDIA H100 GPU 卡,同時亦提供 NVIDIA AI Enterprise 軟體套件。

APMIC 認為,讓 AI 模型透過系統整合真正落地的方案是這個時代所需,將與 HPE 一起持續協助客戶更加便利且深入地使用 AI 。他們也深信,讓企業內部更多人能夠參與 AI 的世界,不需要任何程式編寫或數據處理知識也能輕鬆使用,更是企業迎戰 AI 時代的關鍵思維。

因應不同企業運用場景,目前 APMIC「CaiGunn 開講」大型語言模型有 Mini、Pro、Ultra 等三種 AI 模型供選擇 ,應用場景涵蓋「GenAI 智能客服」,協助大幅解決應答率過低、或者回覆的內容與事實不符的問題,有效降低風險並強化企業形象;以及「GenAI 知識管理」,透過上傳並整理四散各處且格式不一的公司文件,員工只要透過問答形式,即可獲得想要的資訊,解決內部工作效率問題。在 APMIC 技術團隊的全方位顧問服務協助下,結合 HPE ProLiant DL320 Gen11 /DL380a Gen11 伺服器 的強大 AI 算力,企業不光可縮短推動 AI 專案執行速度,也能降低整體成本支出,強化在市場上的競爭力。 

本文章內容由「APMIC & HPE & Intel」提供。