# 新加坡開發先進語言模型測試工具，專測「新加坡主題」不良內容

URL: https://www.shicheng.news/zh-hant/v/233RV
Published: 2024-06-02
Source: 獅城新聞

新加坡通訊及新聞部長兼內政部第二部長楊莉明星期五（5月31日）上午在新加坡亞洲科技會展（Asia Tech x SG）的亞洲科技峰會（ATxSummit）活動上致辭時，宣布了新加坡推出「登月計劃」（Project Moonshot）。

作為全球首個大型語言模型測試工具之一，該工具不僅能夠識別含有暴力、煽動仇恨等不良本土化內容，還體現了新加坡國在生成式人工智慧領域前沿探索未知、拓寬邊界的勇氣和決心。

![新加坡開發先進語言模型測試工具，專測「新加坡主題」不良內容](https://www.shicheng.news/images/image/1745/17454172.avif?0)


圖源：FACEBOOK

楊莉明表示，「登月計劃」是世界上首個用於生成式人工智慧的開源工具之一。「它是一個最簡可行產品（minimum viable product），顧名思義，『登月』是一項挑戰自我的計劃。」

楊莉明指出，該計劃將新加坡首個人工智慧驗證系統AI Verify的工具，從傳統人工智慧擴展到生成式人工智慧領域，旨在應對與使用大語言模型相關的安全挑戰。

由資訊通信媒體發展局和人工智慧驗證基金會共同研發的新測試工具，能讓企業通過特定的基準測試（benchmarking）來評估其應用的表現，例如大語言模型應用是否能識別本地語言的意涵，以及文化背景下的細微差異。

楊莉明提到，新工具可用於測試人工智慧底層模型，以及基於這些底層模型構建的應用。它可以幫助企業與機構更輕鬆地測試並比較結果，從而找出可改善和修復的弱點。

![新加坡開發先進語言模型測試工具，專測「新加坡主題」不良內容](https://www.shicheng.news/images/image/1745/17454173.avif?0)


圖源：FACEBOOK

資訊通信媒體發展局商業科技組合副組長鄭鈞元在展示環節指出，新工具能組織名為「紅隊演練」（red teaming）的模擬對抗，即通過專業人士扮演駭客，對大語言模型發送含有不良信息的內容，測試它的回應。

鄭鈞元舉例說，這個測試工具能識別並評估可能出現的、具有新加坡本地特色的不雅詞彙等。

由於現行法律已可解決一些危害，新加坡在近期內沒有出台一項整體涵蓋人工智慧的法令的計劃。楊莉明以人工智慧生成的虛假新聞為例說：「無論假新聞是如何生產的，只要揭穿它有利於公共利益，法律已允許我們發布更正通知來提醒人們。」

「登月計劃」於公布當天進入公開測試階段。楊莉明強調，良好的治理不是創新的敵人，相反地，良好的治理能夠促進持續創新。

新加坡正在加強開展人工智慧測試和評估研究的數碼信任中心（Digital TrustCentre），通過隱私增強技術確保數據安全，並將其重新規劃為新加坡人工智慧安全研究所（AI Safety Institute）。

![新加坡開發先進語言模型測試工具，專測「新加坡主題」不良內容](https://www.shicheng.news/images/image/1745/17454175.avif?0)