
近幾年,人工智慧(AI)技術在各領域的應用不斷深入,人工智慧訓練師這一職業應運而生並不斷發展壯大,新加坡也有類似工種。
AI訓練師主要使用智能訓練軟體,工作面向人工智慧產品的實際使用過程,工作目標則是提升人工智慧產品的性能。
起初,人工智慧訓練師其實就是一個數據標註員,主要負責「投喂」和標記數據。
譬如將成百上千幅照片里的物體分門別類地圈出,再標註出來,如:花盆、地毯、茶几、沙發等等。
這些標好的圖片會被送進資料庫,成為人工智慧的學習素材。當機器看了幾萬個標註沙發的物體之後,它就會認識到什麼是沙發。
在最初的時候,數據標註員就像幼兒園老師一樣,需要手把手教AI學習,讓它更有「智慧」。

AI訓練師需要標記車輛和行人,讓AI學習什麼是人和車子。(https://zh-tw.shaip.com/)
AI之所以智能,是因為後端訓練師將數以萬計的圖像、資訊輸入人工智慧系統中。數據量越大,機器就越聰明。
起初AI訓練師的工作較簡單,因而薪水不高,像人工智慧大公司谷歌和OpenAI都通過承包商聘請低薪員工。
美國《時代》雜誌2023年就有一項調查發現,在訓練ChatGPT,OpenAI當時以每小時不到兩美元聘請肯亞勞工做標記。
美國舊金山初創公司Scale AI 以及Surge AI,就以短期合約的方式招聘AI訓練師,把他們所培訓的數據賣給更大的AI開發商。
AI訓練師除了標記數據,也收集、整理、清洗、存儲和更新人工智慧產品所需的數據,例如圖像、語音、文本等,以保證數據的質量和數量。
網上資料顯示,中國目前估計有近千萬名AI訓練師,俗稱「人類專家」。
美國研究人員表示,很難估計這些零工(gig work)的總人數。Scale AI指出,在某些時段看到數萬人在我們的平台上工作是挺常見的。
至於新加坡,目前還沒有這方面的數據。
不過,新加坡政府今年3月1日宣布,將在五年內,讓本地人工智慧從業人數增加兩倍至1萬5000人,以支持不斷增長的領域需求。
這些人才包括數據、機器學習科學人員和工程師,他們將在不同機構和整個經濟中開發和轉化人工智慧的使用。
紅螞蟻在領英平台(LinkedIn)上找到好幾個關於AI訓練師的招聘廣告,主要招聘訓練AI的語言功能,以英語、韓語、日語以及馬來語為主。而且這些職位都在廣招,沒有限定人數。
也有一些是以招聘實習生來當AI訓練師。

(領英平台)從教小寶寶,變「調教」大學生
隨著人工智慧的「升級換代」,漸漸具有無監督自我學習算法的能力,AI已經開始嘗試「半監督學習」了。
除了教人工智慧認字、識圖、說話,如今還要教它『思考』了。
AI訓練師現在更像是大學老師,需要為AI提供更專業的知識,讓其學習。AI訓練師也從標誌照片者,變成了文章撰寫者。
AI訓練師從技術和應用角度對AI系統進行深度訓練,以使之適應各種不同複雜程度的任務,同時他們也負責評估AI系統的性能,以探尋優化和改進的空間。
簡單來說,就是教AI變得更像人,有血有肉有感情。
居住在美國的Chelsea Becker(33歲)告訴《紐約時報》說,她在生了第二個孩子後,向公司申請無薪假期照顧小孩,目前空餘的時間會在培訓人工智慧模型公司Data Annotation Tech當兼職AI訓練師。
每天有幾個小時,她會坐在筆記本電腦前,與一個AI驅動的聊天機器人互動。
聊聊天,就能每小時進帳20美元(27新元)至40美元的酬勞。從去年12月至今年3月,她已經賺了1萬多美元,平均每月賺2500美元(3405新元)。
另一AI訓練師Alynzia Fenske自今年2月以來開始這份兼職,她的目標是每周完成15個小時的標註工作,這樣她就可以在追求寫作事業的同時養活自己。
隨著更多類似AI聊天機器人程序ChatGPT的尖端技術出現,市場上對Chelsea這樣的AI培訓師的需求也與日俱增,因為他們會說流利的英語,能夠寫出高質量的文章。
對於這些AI訓練師來說,通常有兩個任務:監督學習,即AI從人類的寫作中學習;強化學習,即AI聊天機器人從人類如何評價他們的回答中學習。

AI聊天機器人程序ChatGPT。(路透社)AI訓練師其實沒那麼「光鮮」
AI訓練師是個隨時隨地都能辦公的工種,靈活的工作時間讓不少人羨慕不已,但同也有不少挑戰。
一些員工表示,他們從未與招聘網站的管理人員交流過,還有一些人在沒有任何解釋的情況下被突然「解僱」了。
研究人員也對缺乏統一標準提出了擔憂,因為AI訓練師通常沒有接受過正統培訓。
要成為這些外包商的AI訓練師,員工必須通過一項評估,其中包括評估社交媒體上的帖子是否被視為仇恨言論,以及為什麼這麼說。
這是因為,早前ChatGPT投入公開平台使用時,很多人開始教它「講髒話」。為了避免AI「出口成髒」,訓練師須要在後端管制,拿掉性別歧視或者煽動性的種族主義言論。
有時,公司也會尋找某一領域的專家當AI訓練師。
像Scale AI就招聘了擁有印地語(Hindi)和日語的碩士或博士學位當合同撰寫人。培訓AI數據的公司Outlier也招聘有數學、化學和物理學位的AI訓練師。
這類AI訓練師已經上升到AI倫理師,通過與人工智慧互動,優化算法,負責評估和解決AI系統可能帶來的倫理道德和社會問題。
他們須要具備深入理解計算機科學、哲學、倫理學和法律等領域的知識,並在實踐中與開發團隊、企業和政府機構合作,提供建議,確保AI系統的合法性、道德性和社會責任感。
如性別認知的刻板印象。目前讓ChatGPT寫一篇關於護士的內容,出現的資料都是女性護士;如果寫公司總裁、警察之類,則搜索結果都是男性。AI訓練師的工作就是訓練系統對這些偏見更加敏感。
Scale AI的數據運營副總裁Willow Primack說,
真正讓人工智慧對用戶有用的是人類層面的數據,這真的需要由聰明的人、熟練的人、具有特定程度的專業知識和創造力的人來完成。
目前在美國阿肯色州大學(University of Arkansas)就讀電腦科學碩士學位的Ese Agboh(28歲)接下了AI編碼項目的任務,時薪40美元(54新元)至45美元。
譬如她會要求聊天機器人設計一個運動傳感器程序,幫助去健身房的人計算動作的次數,然後評估人工智慧編寫的計算機代碼。
她也會給予聊天機器人一組有關雜貨商品的數據,並要求它設定每月預算。
有時她甚至會評估其他AI訓練時的代碼,對方稱這是為了確保數據的質量。
至今她共賺了2500美元,但她的帳號因違反平台行為準則被永久封號。她沒有得到平台的任何解釋,她懷疑因為她當時在奈及利亞工作,而該網站只招聘某些國家的工人。
Ese說,這就是網絡零工的根本挑戰:你的工作會隨時消失。
隨著AI技術的發展,人工智慧越變越聰明,肯定會需要更厲害的「老師」,相信日後對AI訓練師的要求還會不斷提高。