這些年,人工智慧成為了人類主要研究發展的對象。
在去年年底,一款新型人工智慧機器人程序ChatGPT橫空出世,顛覆人類的認知,橫掃人類社會!

在推出兩個月後,ChatGPT的用戶數量就突破1億,堪稱人類科技史上的又一新貴。
上至深刻的哲學探討,下至代碼編程,它幾乎有求必應,有問必答。很多人用過ChatGPT之後,都對其出色的算法嘖嘖稱奇。

不過,在新加坡ChatGPT似乎持續遇冷中,社會對它的討論相當寥寥。
究其原因,可能還是它真的「不太好用」,連新加坡小六會考PSLE的數學題都不能做對!
最火AI敗給新加坡小學題 它真的有傳說中那麼神嗎?
眾所周知,在新加坡多次集中會考里,小六會考的重要性可以算是最高的。畢竟,這個考試幾乎決定了孩子未來的教育走向(當然O水準後也還有機會)。
因此,小六會考對於很多學生來說都相當難,甚至在媒體上都能時不時看到類似報告。

在所有考試科目中,數學被認為是最難的學科。
2021年的PSLE數學考試就非常難,據報道一些學生在考完後因為擔憂,甚至還在考場外哭得泣不成聲。

『無話可說』:一些家長和孩子對艱難的PSLE數學考試感到沮喪,來源:海峽時報
本體媒體Coconuts Singapore利用ChatGPT,嘗試用人工智慧解決新加坡PSLE里的數學難題。結果發現,圖樣圖森破!
難題一: Ivan and Helen’s coins

題目翻譯: 已知Ivan和Helen有同樣數目的硬幣。Ivan有104枚兩角錢硬幣及一些五角錢硬幣。Helen有64枚兩角錢硬幣及一些五角錢硬幣。Helen擁有硬幣重量加起來為1.134千克。
求a)誰擁有的硬幣更值錢,又多了多少錢? b)如果每一枚五角錢硬幣比兩角錢硬幣重2.7克,以千克為單位計算Ivan擁有硬幣的重量。
仔細一看,這個問題似乎對於小六學生來說可能有些困難。就有人利用ChatGPT求解,結果顯示如下:

ChatCPT得出的答案是:
a)Ivan比Helen擁有的硬幣數量更多,且總值多了8新幣;
b)Ivan所擁有的硬幣總重量為1.83768千克;
很明顯的,ChatCPT在兩個問題上都回答錯誤。 針對第一問,ChatGPT忽略了已知信息里的「Ivan和Helen擁有同樣數目的硬幣」這個關鍵信息,因此計算失誤。實際上,根據下圖可以清楚算出,Helen所持有的硬幣總價值,比Ivan多了足足12新幣!

圖源:FB@Ming Hui
至於第二問,因為在第一問中ChatCPT計算出Ivan擁有硬幣數量比Helen更多,並運用這個邏輯做出了回答,因此也是錯誤的。
正確答案和推導邏輯可參照下圖:

圖源:FB@Ming Hui
兩個問題無一個答對,且解題基本邏輯有誤,可以說ChatGPT在2021新加坡小六會考「最難」數學題上翻了大車......
即使是換成相對簡單的數學題,ChatCPT也不一定能做對,不然我們就看看2021年新加坡小六會考這道數學題
「難題」二: Yellow Bean Percentage

題目翻譯:一個盒子裡裝著一些棕色和綠色珠子,綠色珠子占據總數目的40%。再加入一些黃色珠子後,綠色珠子的占比降到了26%。那黃色珠子的占比是多少?
ChatGPT在略微「思索」了片刻後,給出了黃色珠子占比33.33%的答案:

不過根據Cocnut Singapore的計算,這一次ChatGPT又錯了。它在推導過程中逐漸忘記了棕色珠子的存在。
實際上,通過棕色與綠色珠子的原始比例,可以輕易地得出棕色珠子對比綠色珠子的數量比為3:2,因此再加入黃色珠子後,棕色珠子的占比應為26 x (3/2) = 39%。
100% – (39% 棕色珠子 +26% 綠色珠子) = 35%,因此這道題的正確答案是35%。
不過,雖然在新加坡,ChatGPT目前似乎並沒有引起太大反響,但其席捲全球之勢似乎還是無法阻擋,更是吸引了眾多投資者的目光。新聞網站Semafor上個月報道稱,微軟將向製作出ChatCPT的OpenAI投資100億美元(82 億英鎊),為旗下搜尋引擎提供新新動力。

此外,另一科技巨頭谷歌也因感到ChatGPT的威脅而全力開發自己的人工智慧,以保持自己市場領頭羊的地位。
另一方面,ChatGPT也帶動了各類AI股票的上漲。英偉達和安霸(Ambarella)等提供半導體的供應商股票也在1月飆升。不僅僅局限於美國股市,它也在A股中大放異彩。

甚至,「股神」巴菲特還利用它做出下一步的投資提供建議。值得一提的是,它建議的微軟、輝瑞和聯合利華等公司股票,都曾經在巴菲特的意向清單或已投資名單中......
不過,雖然ChatGPT已經看起來是下一個將廣泛運用到人類社會的新科技,但其本身的開放性,卻對學術界帶來了劇烈衝擊,讓很多學者都難以接受。
ChatGPT讓大學教授崩潰!
學生用它寫論文、參加考試
自從ChatGPT橫空出世以來,它就讓很多大學教授「飽受摧殘」。
用它摸出門道寫一篇論文,居然還能拿到A+的成績。關鍵是,很多教授根本看不出來!

不久前,美國北密西根大學的哲學教授Antony Aumann在為自己任教的一門世界宗教課程評分時,驚喜地讀到了一篇「全班最好的論文」。
論文作者以簡潔的段落、恰當的舉例和嚴謹的論據,探討了罩袍禁令的道德意義,讓自己這名大學教授都讀得如痴如醉......
不過,或許是對學生的水平有個基本判斷,因此他還是就這篇論文質問了學生,得到的回答是:這是用ChatGPT寫出來的文章。

Antony Aumann本人 倍感震驚之餘,這名教授在思索如何擺脫ChatGPT對學術上帶來的麻煩。
最終他決定,在自己的這門課上,所有的學生都必須在監控下,且在限制上網的瀏覽器中,撰寫論文初稿。並且,論文草稿中今後如有改動,學生也必須解釋理由。
在以後的教學中,他考慮可能拋棄論文考核的方式,而是選用其他方式進行評分。

圖源:鳳凰網
ChatGPT對學術界和教育界的顛覆,也不單單是在高等教育方面。
不少人用它來寫情書、詩歌、同人小說,只要稍微給點提示,原本思路阻滯的自己就能妙筆生花地「寫出」一篇「傳世經典」。

利用ChatGPT寫出的一封情書 在歐美的學校里,老師們現在除了日常教學外還有了個大工作:仔細辨別學生上交的作業是否是由ChatGPTT完成的。
這給老師增加了很多額外的負擔及煩惱,因此,紐約和西雅圖的公立學校系統,學校的Wi-Fi網絡和設備上已經全面禁止了ChatGPT。
然而,總有人能繞過這項禁令。很多人對此憂心忡忡,Nature上也收錄了一名作者對於ChatGPTCPT的討論,警告其可能帶來的副作用。

當然,製造出ChatCPT的的OpenAI對這些批評和擔憂也不是完全無動於衷。
一位發言人稱,實驗室已經認識到ChatGPT可能會被用來造成誤導。對此,他們正在開發新的技術,幫人們識別ChatGPT生成的文本。
不過,屆時會不會有其他繞過審查的方式,也沒人可以知道。ChatCPT給學術圈帶來的顛覆性衝擊還要持續多久,至今仍是個謎團。

圖源:shutterstock 雖然ChatCPT的這股「改革風」還沒完全吹到新加坡,但已經有一些學者對此表示出了關注。