「AI會有慾望、希望、恐懼和目標嗎? 」
人工智能哲學領域的權威之一,Herman Cappelen教授是香港大學人工智能、倫理與社會學碩士課程的主任,也是AI&Humanity-Lab的主任和ConceptLab的共同主任。他撰寫了多篇在該領域中具影響力的論文,也出版了多本關於人工智能哲學的書籍。在與我們的科研主編Pavel Toropov博士的深入訪談中,Cappelen教授闡述了人工智能如何改變我們,以及人類如何在人工智能的發展中生存。
❓Pavel Toropov博士:您是一位哲學家。當談到人工智能時,電腦科學家、工程師或數學家的重要性顯然可見,但哲學家的角色是什麼?
💬 Herman Cappelen教授:我們哲學家多個世紀以來一直試圖理解思想、慾望、目標、恐懼和愛是甚麼。現在我們運用這些理論來探討人工智能是否可以擁有思想、慾望、希望、恐懼和愛。電腦科學家則沒有就回答這些問題接受訓練。
隨著我們構建越來越強大的人工智能,我們想了解它的能力範圍。例如,如果你創造了一個擁有慾望、意識、覺知和情感的東西,那麼你可能創造了一個行動體。你可能對它有道德和倫理上的責任。這些道德問題,並不是電腦科學家專長的領域,也不是他們受訓去思考的問題。
如果你創造了一個有自己目標和慾望,非常聰明的東西,並且它掌控我們的經濟、電力系統和軍事,你就面對着風險。因此我們需要討論人工智能帶來的風險,並制定策略來使我們免受潛在危險的人工智能的威脅。
❓那麼,哲學家是否充當了「心理學家」的角色,通過提供演算法和數學以外的分析來幫助我們理解人工智能的「頭腦」中發生了什麼?
💬 心理學家主要接受過針對人類、人的恐懼、人的焦慮、人的發展等問題的訓練。他們的專長不在於思考有關電腦的問題,或是對電腦進行實驗。隨著人工智能的發展,出現了一個全新的領域,迫使我們將描述人類心靈的概念應用到一種新事物之上。從討論人類認知到人工智能認知的橋樑,大多由哲學家構建。
我們可能需要為人工智能的「心理學」創造一整套新的術語。也許人工智能擁有訴求的方式與人類不相同,也許它擁有希望或恐懼的方式與人類不相同,可能它擁有其他與人類不同的(心理上的)狀態。
❓您的人工智能研究涉及哪些方面?
💬 我的一部分工作是了解像Chat GPT這樣的人工智能如何理解語言,人工智能如何溝通或不能溝通,以及它在語言的掌握和構建上與人類相似或不同的方式。我們想知道它們是否像我們一樣是能進行溝通的行動體,還是完全不同的存在。
❓您所說的「完全不同的存在」是什麼意思?
一些理論家認為,人工智能系統對語言毫無理解。按照這種觀點,它們像鸚鵡學舌,但並不理解它們所說的內容。有如將信息輸入系統,然後再輸出某些信息,但當中什麼都沒有。
在Chat GPT出現之前,我已經長期研究語言的本質和溝通的本質。當Chat GPT問世時,從我的研究角度來看,我覺得這非常有趣,因為我們可能已經創造出有溝通能力,但與人類完全不同的系統。這為我們提供了關於語言和溝通的本質的新見解。
❓是什麼樣的見解呢?
💬 幾乎我們所有關於語言和交流的認知都來自於對人類的研究,但現在事實證明,還有很多非人類的交流方式,例如Chat GPT 就是以非人類的方式去溝通,並且可能溝通得比我們還好!我寫了一本關於這個主題的書:《讓人工智能變得可理解》(Making AI Intelligible)。
(《Making AI Intelligible》可在此查閱:https://arxiv.org/pdf/2406.08134)
❓ Chat GPT在哪些方面的溝通能力優於人類?
💬 它不會感到疲倦。它不會因為有其他會議要參加而離開。它能夠記住你說的每件事。它總是談論你想討論的話題。它處理和產生對話的能力比我們強得多也快得多。Chat GPT可以在十秒鐘內生成我在接下來半小時內會說的所有內容,並且它可以在兩秒內理解整個對話。
❓除了語言,作為一名哲學家,人工智能的哪些其他方面引起了您的興趣?
💬 人工智能是否擁有信念、慾望、計劃甚至情感?它想要什麼嗎?它是否希望回答我們的問題?它有能力擁有慾望和目標嗎?它能否承擔道德責任?我們是否對人工智能有道德義務?它們是否可能在智力上超越我們,如果它可能,我們應該如何應對?我即將出版的人工智能新書《人工智能的哲學:一個有見地的方法論指南》(The Philosophy of AI: An Opinionated Methodological Guide)大部分討論的就是這些問題。
❓那麼,人工智能有目標嗎?
💬 我認為有。
❓為什麼呢?
💬 因為人工智能表現出我們認為人類有目標的那種結構性行為。它的行為結構上似乎有目標和計劃,並擁有某些信念,然後根據這些信念採取行動。
❓您能闡明一下嗎?
💬 例如,如果你向它提問,並想——為什麼它會回答我呢?一種解釋是說,人工智能希望回答你的問題,它理解了你的問題,並認為答案是「bla bla bla」,於是它就說出來「bla bla bla」。這相近於我們對人類行為的解釋。
反對者會說:「是的,但這並不是它真正做的事情,因為它只是在處理符號,並預測下一個詞是什麼。」我認為這是一個糟糕的論點,因為你也可以這樣形容人類:「真正發生的只是在大腦內部某些脂肪組織中進行的處理。」這將是對人類缺乏目標導向行為的錯誤論點。在人工智能的情況下,這也是一個同樣糟糕的論點。
❓那麼,您認為人工智能可以擁有心理生命嗎?
💬 我認為「人工智能不能說語言,它不能擁有心理生活」的想法是建基於錯誤的論點。總體而言,我認為在我們解決一些極其困難的哲學問題之前,我們無法確定這些問題的答案。
例如,我們曾經認為非人類的動物不能思考、計劃或擁有情感。現在,我們更容易接受大象和海豚,貓和狗可以溝通,並擁有豐富的認知、情感和社交生活。這些東西並非人類獨有。心理和認知可以存在於與我們完全不同的事物中。但是這裡有一個巨大的跳躍——它是否也可以存在於非生物中?我不接受那些否定的論點,因為現存有強力的論據證明是可以的。
❓人們對人工智能的主要擔憂之一是它將取代所有工作。您對此有何看法?
💬 部份工作將會迅速消失。目前有許多人工智能無法勝任的技能,但這些將會迅速改變。人們說人工智能會犯錯,但這並不能打動我。人類犯錯的頻率遠遠高於人工智能,而且人工智能進步的速度令人難以置信。這些缺陷很可能會很快消失。
然而,令人驚訝的是,同時許多工作會保留下來,因為我們希望保留人與人之間的互動。這在許多你意想不到的領域中發生!讓我們來看看國際象棋。人類在象棋上的表現比便宜的電腦還差得多。頂級象棋選手Magnus Carlsen永遠無法擊敗最高性能的電腦。
重要的是,沒有人想看兩台電腦互相對弈。棋手想和人對弈,並觀看其他人進行相同的活動。
我問我13歲的女兒:你會聽一個虛擬形象的音樂家創作你喜歡的音樂嗎?她回答:「當然不會!」我們關心的是人,很多我們做的事情都是與人有關的。如果你是一個坐在我面前的虛擬形象,我也不會這麼投入地進行這次訪談。
❓讓我們談談人工智能對人類的威脅,這也是您研究的另一個領域,對嗎?
💬 超級智能會反過來對付我們嗎?我不知道它是否會這樣做,但這是有可能的。
我與Simon Goldstein共同撰寫了一篇新論文,名為《人工智能生存故事》(AI Survival Stories)。它探討了我們如何在人工智能中生存的方式。
我們的生存方式分為兩大類——一種可稱為「停滯期故事」,另一種是「非停滯期故事」。
其中一個停滯期故事較技術性。試想像我們在接下來的幾年裡不斷發展人工智能,但並沒有出現重大進展。由於某些我們無法預見的原因,技術不再繼續發展,停滯不前。
另一種停滯期故事是文化性的。這個版本中,我們最終會像對待生物或化學武器一樣對待危險的人工智能。這種情況的發生方式之一是有人以非常危險的方式使用人工智能,導致可怕的後果。隨後,人工智能被視為對人類的威脅,全球範圍內努力阻止危險人工智能的出現。
另一種情況是沒有停滯期,人工智能變得超級智能和超級強大。這情況下,我們有兩種生存的可能性。一種是確保人工智能與我們的價值觀一致,並且永遠對我們友好。另一種選擇是我們能夠控制人工智能系統,並以某種方式確保它們不會傷害我們。
技術性停滯期的可能性不大,文化性停滯期的可能性也不大。對齊價值觀是極其困難的。試圖控制超級智能的人工智能,亦似乎幾乎不可能。你對人類在人工智能中生存的概率的看法,取決於你認為這些各種生存故事的可能性有多大。
❓撇開取代人類工作和威脅人類生存不談,人工智能正在影響我們的日常生活和情感生活。在2013年的電影《她》(Her)中,一個男人愛上了一個人工智能聊天機器人。這當時看起來像是純粹的虛構故事,但現在我們不那麼確定了。人工智能能改變我們嗎?
💬 人工智能可以以非常不可預測的方式改變我們。它改變了我們的語言,改變了我們分類世界的方式,改變了我們認為世界上什麼是重要的,改變了我們對彼此的看法。這一切都很新,只有兩年歷史,但變化的速度令人難以置信。我從未見過如此快速的變化。
現在浪漫聊天機器人的市場十分龐大——為男友、女友、伴侶等設計的各種機器人。人們現在可以與聊天機器人發展出極具情感和浪漫的關係。
我最近參加了一個在德國舉辦的會議,其中一位演講者創建了一個人工智能機器人,幫助與患有癡呆症的人互動。令人驚訝的是,比起疲累和肩負沉重壓力的護士,患者更喜歡與人工智能互動。
❓這些聊天機器人朋友有一些優點。它們永遠不會感到疲倦,也不會有壞脾氣。它們不要求任何回報。如果我們將這種模式視為友誼和親密關係的典範,那我們是否也會對人類抱有這樣的期望:為什麼他或她不像聊天機器人?
💬 因此,我認為改變已經發生了,像「友善」、「同理心」、「關係」這些詞語的含義正在改變。我們對情感和認知狀態的分類,正在隨著我們與人工智能系統的互動而發生變化。
我們在香港大學的ConceptLab研究語言如何改變。而這些語言的變化在我們面對新情境時發生。現在我們正面對一個新情境中——一個我們可以與人工智能系統對話和互動的情境。
❓回到有關人工智能的電影的題目,您認為哪部關於人工智能的電影最接近現實?
💬 《22世紀殺人網絡》(The Matrix)是一部驚人的電影,巧妙地呈現了一個非常重要的哲學問題。
在電影當中,人工智能創造了生命的幻象,你並非一個真實的人,而是大型電腦系統中的虛構存在。這是哲學家們思考的問題,而《黑客帝國》巧妙地呈現了這種可能性。哲學家Nick Bostrom撰寫了一篇非常著名的論文,論證我們身處矩陣中的概率相當高。
這是一個非常簡單的計算——人工智能系統生成完全逼真世界的概率是多少?相當高。這樣的世界會有多少?可能很多。真實世界有多少?一個。因此,你身處真實世界的概率是多少?相當小。
❓最後一條問題,人工智能會取代哲學家嗎?
💬 我不確定。很可能會出現比任何人都更快、更好地生成哲學論點的人工智能系統。然而,我更不確定的是,人們會否想要與這個系統交談和互動。
回想之前的觀點:很多人想關注Magnus Carlson下國際象棋,而沒有人關心電腦對弈的棋局。也許哲學也會如此?我認為我們將比其他專業,例如電腦科學家更難被取代。他們的職能是產生既定的輸出,而如果有某種東西可以更便宜、更快、更好地產生它,取代就有可能發生。
然而,哲學的核心是人與人之間的連接,因此更難被取代,但並非不可能。
👏 感謝您,Cappelen教授!
🔍 這次訪談中討論的許多問題都屬於香港大學人工智能、倫理與社會學碩士課程的內容。了解更多信息:https://admissions.hku.hk/tpg/programme/master-arts-field-ai-ethics-and-society
「過去難以實現的,如今已不再困難 」
孔令鵬教授在港大計算機科學系的研究聚焦於自然語言處理(NLP)。在加入港大前,孔教授曾在倫敦的人工智能公司Google DeepMind任職。在科學編輯Pavel Toropov博士的采訪中,孔教授闡述了人工智能在理解和生成語言方面取得的進展。
❓Pavel Toropov博士:您的研究簡介中提到「利用語言結構,設計表征學習算法來解決自然語言處理中的核心問題。」用簡單的話講,這是什麽意思?
💬孔令鵬教授:意思是我們教計算機理解人類語言並像人類一樣說話。
❓計算機在這方面的主要挑戰是什麽?
💬是人類語言的歧義性。人類的語言中充滿了歧義,比如以下英文句子: 「the man is looking at a the woman with a telescope」——是女人拿著望遠鏡,還是男人拿著望遠鏡看女人?
這被稱為命題附加問題。現代語言處理基於統計方法構建,但總有很多邊緣情況難以被完整有效地建模。
❓人類能輕易地從語境中識別出這些邊緣情況,為什麽計算機做不到?
💬因為計算機需要搜索的空間呈指數級增長。我們必須在計算資源和內存範圍內找到有效的空間。這是最困難的部分,需要建立一個統計方法來對這些情況進行建模。
此外,資源匱乏的語言也面臨同樣的挑戰。比如史瓦希利語——我們沒有足夠的數據資源來訓練系統相應地高效工作。
好消息是,隨著深度學習的發展,我們可以建立規模龐大的模型,解決許多過去難以想象的問題,這正是人們對人工智能振奮的原因。
不斷學習,並學會將其概括為以前從未想過的事物。然而,核心問題在於從有限數據和計算資源中概括出最佳模型與算法。當前,訓練系統需要龐大的數據,幾乎要涵蓋整個互聯網的信息量。
❓您也研究機器翻譯領域。如今,機器翻譯的質量顯著提升,遠超數年前的水平。
💬我覺得機器翻譯的難題已被解決!其發展速度之快令人咋舌。十年前,翻譯中的歧義處理仍是一大難關,而今,得益於大語言模型的應用,這一難題已大有改善。
特別是像ChatGPT這樣的工具,在中譯英的翻譯上,無論是技術文檔還是日常郵件,其表現都令人贊嘆,甚至超越了我。現在,當我用中文撰寫郵件再翻譯成英文時,幾乎無需做修改。
❓這是否意味著翻譯人員將被人工智能取代呢?
💬我發覺這一轉變已經悄然發生。技術的進步讓許多曾經棘手的問題變得不再那麽難以解決。
機器翻譯本質上是一種條件語言生成,即根據中文內容生成對應的英文表達,保持意義一致。這種條件生成的應用廣泛,不僅僅是翻譯,還包括根據提示生成後續內容等。
如今,一切都在一個模型之中——大語言模型。在過去,問答、機器翻譯、創意寫作等各自擁有獨立的系統,而現在,它們都是同一個系統,只是輸入的提示不同而已。
❓什麽阻礙了機器理解人類?
💬我認為沒有阻礙。但是至於機器是否能真正理解人類,這始終是一個充滿爭議的哲學話題。
你覺得ChatGPT或Microsoft Copilot在某種程度上能理解你嗎?答案是肯定的,這在三年前是難以想象的,但如今已成為現實。然而,這是否意味著真正的理解?我對此持保留意見。
我喜歡通過一些測試來探究這個問題,比如給人工智能一段歌詞,然後問它:這個的意思是什麼?雖然它能給出諸如「有時日子會很艱難,但總會好起來」的解釋,但我仍然覺得這種交流缺乏人性的溫度。這可能是因為我知道這些回答來自於復雜的計算。
但如果進行圖靈測試,即試圖區分與ChatGPT的對話和與人的對話,那就非常困難。我也很難以超過60%或70%的準確率做出判斷。
❓是什麽讓人工智能可以這般交流?
💬在人類發展的長河中,我們從未訓練過如此大規模的模型。在 COVID 疫情爆發之前,最大的語言模型也只有大約6億個參數。而今天,我們已經擁有了擁有4050億個參數的開放源模型。以前,我們從未有機會將如此龐大的數據和計算資源轉化為計算機內部的知識,但現在,這一切已成為可能。
❓您目前的研究方向是什麽呢?
💬我們小組主要致力於探索新的機器學習架構。在與ChatGPT交談時,您可能會發現,大約4000個單詞後,它就會開始遺忘。交談時間越長,它就越容易忘記之前的內容。這些問題是當前機器學習架構所面臨的基本挑戰,也是我們正在努力解決的關鍵問題之一。
ChatGPT背後的機器學習模型被稱為Transformer。它是一個神經網絡,能夠構建各種序列,例如在與蛋白質相關的人工智能程序 AlphaFold中工作。
我們的研究方向之一,就是提升Transformer的效率和建模能力,讓它能夠處理更長的序列,並且不再遺忘。
另一個研究方向是突破當前語言模型的推理極限。我有一個團隊正在研究國際數學奧林匹克競賽的問題,現在我們已經能夠利用大語言模型來解決這些問題,它完成得真的很棒!
👏感謝孔教授的分享!
「從腦部圖像中,AI可以讀取出這個人當下的情緒。 」
Benjamin Becker教授研究人類大腦。他的創新和前沿研究已發表在《自然人類行為》(《Nature Human Behaviour》)和《美國精神病學雜誌》(《the American Journal of Psychiatry》)等頂級期刊上。在與我們的科學內容編輯Pavel Toropov博士的采訪中,Becker教授談到了人工智能所帶來的突破。
❓ Pavel Toropov博士:您的研究主要方向是什麽?
💬 Benjamin Becker教授:我試圖找出人類大腦如何產生情緒,在有精神障礙的人群中這些過程會發生什麽變化,以及我們如何改善這些情況。
❓ 您如何使用人工智能?
💬 人工智讓我們在分析腦圖像方面取得了非常大的進展。大腦是一個高度復雜的結構,可能是宇宙中最復雜的結構。我們正在研究由數十億神經元包含了數十億連接組成的大腦生物學結構。由於我們的認知能力非常有限,使得很難理解這些復雜的模式。
人工智能可以極大地幫助我們在這些數據中發現規律。我們最近發現,我們可以使用人工智能啟發的技術,從大腦中讀取情緒。例如,人工智能可以判斷某人是否感到害怕或厭惡。使用人類的腦力來做到這一點幾乎是不可能的。我們需要復雜的算法來幫助我們理解這些復雜的數據。
❓ 這是如何實現的?
💬 我們讓實驗對象進入MRI掃描儀,在他們體驗特定情緒時對他們的大腦活動進行成像。我們人類(從腦掃描圖像中)只能看到某些特定的大腦區域變得活躍。但這看上去還是太簡單了,人工智則能使我們能夠看到更復雜的模式並讀取個體所體驗的情緒。
❓ 能具體說明嗎?
💬 我們人類看到的是大腦的特定區域變得活躍,但這些區域相對較大,而人工智能可以在比人類更精細的水平上篩選這些結構,然後使用數據生成復雜的模式——就像特定情緒在大腦上留下的指紋一樣。
最令人驚奇的是,基於它從大腦中發現的這些規律,人工智能可以讀取出某個人在某一時刻的感受。對於人類來說,這些數據過於嘈雜和復雜,試圖讓人類解釋是不可能的。人工智能給了我們尖端的優勢。
❓ 所以,對人類來說,基本上腦掃描圖像太嘈雜——模糊、混亂,難以看到其中的規律。但人工智能可以查看一系列這樣的腦掃描圖像,透過這些噪聲看到模式,並識別出這些都是相同的,這些人都感受到的,比如——恐懼?
💬 是的。人工智能甚至可以利用這些噪聲做出非常好的預測。
❓ 這有多尖端?幾年前還不可能實現,對吧?
💬 是的。我認為在以下三個方面都有進展。MRI成像技術方面的進展。然後是我們對人類情緒的了解方面的進展,第三是機器學習和人工智能方面的進展。
❓ 這將在未來帶來什麽?
💬 當MRI在30年前被開發出來時,人們說:十年內我們將理解整個大腦。然而,這並沒有發生,這太樂觀了。大腦仍然是宇宙中最復雜的結構,所以理解它還需要一些時間。
我認為人工智能在應用方面會有更多的進展。在基礎研究中,我們研究大腦如何加工情緒,研究精神障礙,因為這是情緒失調導致的。例如,抑郁癥、成癮癥患者,他們在控製情緒方面有一些問題,他們感受這些負面情緒非常強烈。
我們希望可以繪製出健康大腦中的這些情緒圖譜,然後應用人工智能來診斷精神障礙。我們現在看到的進展是人工智能可以幫助我們做出好的診斷。對於一位醫生來說,很難決定這個病人是抑郁癥、焦慮癥還是其他什麽問題。
人工智能可以給我們提供一個概率值——例如,這個病人對某種治療的反應概率是80%,而對另一種治療的反應概率較低。我們將能夠取得巨大的進展,減少患者的痛苦時間,同時也減少醫療系統的成本。
第二點是——使用人工智能,你可以進行患者亞組分型,並為他們的治療提供更好的建議。
❓ 你所說的患者亞組是什麽意思?
💬 作為大型合作的一部分,我們最近發現了抑郁癥青少年在癥狀和大腦改變方面存在很大的差異。利用這些發現,我們可以針對不同的大腦區域,或根據不同的亞組提供不同的治療。例如,一些患者可能對行為療法反應更好,另一些對藥物治療反應更好,還有一些對腦刺激治療反應更好。
❓ 這項技術能在臨床上、現實世界中使用嗎?
💬 我們看到了一些積極的進展,但目前AI還沒法精確到臨床診斷的水平。這關乎性命。也許很快我們就能使用AI來提供一些建議,但現在的預測還不夠精確,我們需要很高的準確性才能進入臨床實踐。
❓ 人們非常擔心AI會取代很多人的工作。你認為未來AI能取代心理學家嗎?
💬 我認為在未來10年內我還能繼續從事這個職業!我對心理學並不擔心,我會建議對心理學感興趣的學生繼續探索這個領域。
❓ 你為什麽如此自信?
💬 AI無法超越我們的一點就是理解其他人、與其他人溝通、將人們聚集在一起並進行心理治療。
❓ 這有科學依據嗎?
💬 是的。我們註意到越來越多的研究關註AI與人類的互動。我們最近做了一項關於我們對其他人類和對AI信任(度)的研究。
從我們很小的時候開始,我們就非常敏感於我們可以信任誰。這在(人類)進化過程中是非常重要的。如果你沒有這種技能,你的祖先可能不會存活很久,因為他們信任了錯誤的人或者因為他們不信任任何人。
我們發現人們對其他人類的信任有明確的腦基礎。同時我們評估了人們對AI的信任。我們問他們——你信任AI嗎?我們發現這兩種「信任」是不相關的!而且,對人類的信任與特定的腦系統相關,但對AI的信任沒有與之相關的腦基礎。
我們作為一個物種已經學會了互相信任。這深深植根於我們的生物學中。但對於AI,即使它在某種程度上像人類,但它只存在了幾年。我們怎麽知道是否應該信任它呢?
👏 謝謝你, Becker教授。
「生成式人工智能將重塑電影中現實的呈現方式」
Ulrich Gaulke是一位屢獲殊榮的紀錄片製片人,他曾在世界各地教授他的藝術,從波斯尼亞到玻利維亞。去年,他在香港大學新聞及傳媒研究中心擔任高級講師。他教授的課程之一是“Generative AI for Media Applications”(生成式人工智能在媒體中的應用)並因此獲得了社會科學傑出教學獎。在這次與我們的科學主编Dr. Pavel Toropov的採訪中, Ulrich Gaulke談到了這門新課程、AI在電影製作中的作用以及為何AI尚不能取代人類敘事者。
❓這門課程—— “Generative AI for Media Applications” 是如何產生的?
💬我很久以前學習過計算機科學!我對技術性的東西很感興趣,比如AI。我有一個想法——如何開發一門新的、開創性的課程,讓學生成為敘述者,但他們通過使用所有最新的生成式人工人工智能(Gen AI)應用來發展敘事技巧?
❓在您的課程中,學生們做些什麼?
💬首先,我們介紹AI——大型語言模型如何工作,生成圖像的擴散模型如何工作……對神經網絡的基本理解。學生們學習AI模型內部的數據處理過程以及模型如何生成合適的結果。
然後,學生們構建並用數據——圖片來訓練他們自己的AI模型。學生們用手機拍攝香港的照片來訓練自己的擴散AI模型。基於這個AI模型,我們可以創建更多與香港相關的內容。
這些只是開始。然後,我們逐步學習如何應用Gen AI:文本到文本、文本到圖像、文本到視頻、文本到動畫、文本到語音和文本到音樂。之後,學生們可以創建故事和視頻片段,並開始著手最終項目。
最終項目是一個3-5分鐘的短片,使用不同的AI應用程序。他們將所有的AI技能結合起來,組裝出一些複雜的東西,使用文本提示和參考圖像來創建視頻片段。我們主要使用的Gen AI應用是ChatGPT、Midjourney和RUNWAY Gen3 Alpha。
但首先,學生必須創建一個合適的故事,然後將其分成不同的部分——就像在虛構電影中的故事板一樣。每一章、每個地點、每個角色,一切都必須可視化。只有當我認可他們的故事時,我才讓學生開始最終項目。如果他們的故事有詩意、揭示性或感人之處,我才允許他們創建角色、場景和視覺效果。
我們每週也有創造一些小東西的作業。我們還討論AI的倫理方面和技術背景。我希望能邀請使用AI的人,將他們的經驗與我作為敘事者的視角結合起來。所以,我邀請了計算機科學系的客座演講者。
我還邀請了在AI和媒體領域的領先人物作為客座演講者,例如德國慕尼黑電視與電影大學的人工智能主席Sylvia Rothe教授。
我們建立了一門開創性的課程,暂时沒有其他人做过類似的工作。
❓這門課程有多受歡迎?
💬一開始就被訂滿了。但有更多學生希望參加!新聞和傳媒專業的學生可以優先报名,所以我們在六月開設了一個夏季課程。內容相同,但對其他系和學院的學生開放。
❓您在香港大學新聞及傳媒研究中心教授這門課程。這門課程是面向電影製作者還是記者的?
💬這門課程對新聞專業學生和電影製作專業學生都開放,但我們的工作重點是創作虛構作品,而不是新聞作品。
新聞是基於事實的。如果你是記者,你必須非常負責地使用Gen AI。AI模型不是像Google那樣的研究工具。我們教導學生,不能完全信任AI的結果——AI模型會根據自己的模式生成內容。結果看起來可能非常詳細,但仍需驗證。
❓那麼,AI在電影製作中的主要用途是什麼?
💬電影製作人可以將其作為一種創造性的可視化工具——用於可視化無法拍攝的內容,例如過去發生的事情,或者你沒有視頻素材的情景。
動畫傳統上一直被用於這個目的,並與強有力的真實故事結合。例如,關於一個阿富汗家庭逃往歐洲的動畫電影《無處安心》(FLEE),就獲得了三項奧斯卡提名。這部電影基於真實故事,但完全是動畫的。
❓您在自己的電影製作工作中使用AI嗎?
💬我目前正在使用AI來進行最新紀錄片中的歷史重演,這部紀錄片講述了五位百歲老奶奶的故事。她們談論過去,但那時只有靜態照片。所以我可以根據這些靜態圖片創建視頻片段。
❓講故事是製作電影的關鍵。你認為這將來會由AI完成嗎?
💬是但也不是,這取決於你的期望。ChatGPT可以幫助你寫一個故事,但主要的構思——情節、角色,這必須來自你!如果你讓AI自己創作一切,那麼你會發現它只是在模仿已經存在的東西。故事是人類用來相互交流的方式。一個好故事必須包括一些獨特的、令人驚訝的,與你自己的生活有關的東西。
AI基於模式,這些模式來自學習材料,而學習材料基於已經做過的東西……電視連續劇的劇本基於非常簡單的元素,編劇每年都在寫同樣的東西,所以這是AI可以做到的。
不久前,當文本轉視頻應用程序問世時,有人說AI現在將為我們製作電影,不再需要演員、導演……但這似乎並沒有發生。
很多人已經放棄了這個想法。
❓為什麼?
💬期望太高了。試著讓AI做一個簡單的故事。例如,一位老師對一個女學生生氣。試著保持兩個角色的一致性,試著讓他們進行一次嚴肅的對話——例如,生氣的老師告訴學生她的作業有問題。這是一個非常簡單的故事,但試著用AI創造它——結果變得非常複雜!
試著在YouTube上找一個能讓你忘記是AI創造的視頻。大多數情況下你都能看出視頻是由AI創造的——一個角色消失,另一個隨機出現,有很多隨機動作,甚至還有外星人……
❓所以,你認為AI是一個用來為人類創作的故事創造視覺效果的工具嗎?
💬如果你讓AI自行創作,那麼結果會變得怪異和隨機。AI創作的作品與我們對創造力的理解完全不同。更像是一場夢。
如果你想使用AI應用程序作為工具來創造基於我們對敘事、角色創造和情感表達的理解的東西,那就非常困難。問題在於一致性——角色的動作和面部表情不一致。
用AI模型創造一個角色非常困難。你可以使用Midjourney創造一張真實的照片——例如一個看起來悲傷的老頭。AI模型會創造出一個看起來悲傷的老頭的圖像,但這是你想在故事中使用的老頭嗎?還是和你想的完全不同?
❓AI是否允許你微調這些不一致之處?
💬Gen AI可以做非常令人印象深刻的事情,但它不像Photoshop或After Effects這樣的應用程序,你可以通過改變參數直接控制結果。
當時你使用Gen AI時,如果結果是你完全無法使用的東西,那麼試著改變一些參數也無濟於事!你可以創建一些其他的東西,一些新的東西,但它可能再次與你的期望不同。你可能會變得越來越沮喪,因為你無法直接控制結果。
你可以做的是寫另一個提示。但你不能確定AI模型會呈現給你真正想要的。
❓操作AI工具的技能是什麼?我們知道一個擅長使用Photoshop的人可以做什麼,AI的操作技能是什麼?
💬AI的操作技能在與撰寫提示方面非常有經驗。與AI模型的交流需要AI交流技能,這意味著提示設計:我如何設計提示使得AI模型滿足我的期望?
❓你在課程中教授提示設計嗎?
💬我嘗試在每次講座中談論提示設計。但是,結果越複雜,編寫提示所需的技能就越多。
有提示設計工具:你可以寫一些不太好的提示,這個工具可以將你的想法變成一個合適的提示。我也教這個。
學生們必須記住,設計提示需要很多工作。所以,他們必須做好準備——準備好一個合適的故事,然後花時間使用AI為這個故事創造合適的視覺效果。
❓這門課程的未來計劃是什麼?
💬AI應用程序不斷改進。去年我們主要專注於管理所有AI應用程序的挑戰和困難。今年我們可以對它們有更多期待。Runway這個視頻應用程序更加先進,所以現在我們可以在敘事方面做更多。
我希望確保學生們發展更好的敘事技巧。然後,他們可以使用現在更加先進的AI應用程序,這意味著我們可以創造更複雜的視覺效果。
👏謝謝你,Ulrich!
「人工智慧的突破取決於你的數學有多好」
袁曉明教授目前就職於港大數學系,他是一位在學術界享有盛譽的數學家與科學家,憑借其卓越的貢獻,曾三次獲得科睿唯安「高被引科學家」的殊榮。袁教授深耕優化領域,並將這一專業知識應用於人工智能中。在與科研主編Pavel Toropov的訪談中,袁曉明教授解釋了數學在人工智能中的重要性
❓Pavel Toropov 博士:數學家在人工智能領域扮演著怎樣的角色?
💬袁曉明教授: 我們扮演的是最為基礎且不可或缺的角色。我來證明吧——當大眾探討人工智能時,話題往往聚焦於工程、編程及產品落地等方面。然而,真正推動人工智能實現突破的,卻是數學的力量!人工智能,本質上是人類創造的智慧,那麽這份智慧從何而來?一個答案就是數學!
❓如何進一步解釋呢?
💬人工智能是人造的,是模擬的智能、機器中的智慧。當然,我們不能說它是虛假的,因為它的確具備強大的計算能力。但關鍵在於,是誰賦予了計算機這種智能——是人類。所以,我們需要擁有人腦中的智慧,才能更好地發展人工智能。而數學正是提高智力、思維水平和邏輯能力的最佳方式。
❓那麽數學就像去健身房訓練,不過是針對的大腦,對嗎?
💬是的。數學就是大腦的訓練。
❓您在人工智能中的主要研究領域是什麽?
💬優化(算法)。人工智能行業有很多優化問題。例如,我們希望將直播業務中的帶寬成本降至最低,這就是一個(複雜的)優化問題。
我們便致力於研究這些純粹的數學問題,從數學的角度理解分析,並設計快速、高效、穩健的算法解決它們。
❓您與業界進行了很多合作,為商業應用設計算法。那您是如何將數學應用其中的?
💬舉個例子,現在大家都在談論的大語言模型(LLM),比如 Chat GPT 及其變體。LLM涉及幾個階段——預訓練、後訓練及微調,每個階段都有很多優化問題。
LLM 的不同神經元之間有很多關聯,在後訓練階段,必須選擇性地剪斷其中一些連接以節省內存等硬件資源。而哪些神經元的連接可以切斷呢?我們設計了數學模型來輔助判斷,這可以大幅減少計算資源的消耗,也就是節省成本。
❓您還從事人工智能芯片方面的工作,什麽是人工智能芯片?
💬傳統意義上,計算機芯片的概念只是硬件。但現在人們將算法集成到芯片中,以便它工作得更快。我們就是設計算法嵌入芯片中,來加速芯片的計算。
其中標準和有代表性的工作就是加速矩陣的分解及矩陣和向量乘法。我們設計特定的算法,試圖令向量和矩陣的計算更有效率。
有時我們必須在芯片中引入結構。例如,最流行的芯片Nvidia A100和 H100,它們工作得如此高效的原因就是具有特定的結構,其中之一就係稀疏張量核心——旨在加速矩陣運算,我們必須設計算法以適應這種硬件結構。
❓在人工智能和數學領域的創新方面,港大與其他大學相較如何?
💬港大為研究人工智能相關課題提供了絕佳的環境。作為一名數學教授,在人工智能方面需要做大量的數學工作。而理論上我們的人力非常強大,因為港大吸引了許多優秀的研究生,很高興能與如此優秀的學生一起工作。我還與統計系和計算機科學系合作啟動了一個人工智能碩士項目,這為我們的研究計劃提供了新的資源與人力。
❓像軟件工程師、程序員之類的技術工作非常熱門,因為它們高薪而且需求量大。數學家有什麼職業機會呢?
💬數學和商業價值之間有很直接的聯繫。我知道很多人對此一無所知,大家覺得數學只是紙上的公式,與商業無關。但我作為一名數學家,就可以作爲為工業界節省資金的例子。
比如最近,我用我的算法幫助華為在不到三年的時間內節省了1.08 億美元,這就是商業價值!我設計的算法幫助他們節省了直播業務的成本。直播業務正是商科教授們常提及的數字經濟的最重要部分之一。
那麽,數字經濟的具體含義是什麽?“數字”意味著數,即電腦裏的數。而從這些數字中生成有價值的知識或者信息需要仰仗於數值算法,也就是數學知識。
因此,人工智能的數學基礎非常重要。我們數學家並非一點點逐步地推進人工智能,而是可以用突破性的概念推動行業!數學家在人工智能中的關鍵作用需要被重視。
❓最後一個問題,您會推薦把數學作為職業嗎?
💬當然!
👏謝謝袁教授!
「我們的模型可以預測癌症治療效果 」
于樂全教授是香港大學Medical AI Lab (醫療人工智能實驗室) 的主任。他的研究與人工智能及醫療保健息息相關。在加入香港大學之前,于教授曾是史丹福大學的博士後研究員。在這次訪談中,他向我們的科研主編Pavel Toropov博士解釋了人工智能如何革新醫療保健。
❓Pavel Toropov博士:你如何在研究中使用人工智能?
💬于樂全教授:我們使用人工智能技術和算法來解決與醫療保健和醫學相關的問題。我們依賴多模態人工智能模型,使用人工智能來分析和整合不同的醫療數據,如醫學影像、醫學報告、實驗室測試結果和基因數據。我們的目標是解釋並將這些數據整合在一起,幫助醫生做出決策。
❓可否舉例說明?
💬舉例說,我們使用演算法從電腦斷層掃描(CT)圖像中判斷患者是否患有癌症。這可以減輕醫生的工作負擔。此外,我們希望可以進行精準醫療,特別是對癌症患者。目前,治療策略並非為每個患者度身而設。我們希望使用人工智能算法,能有助整合每個患者病例廣範的信息,然後以人工智能為醫生提供建議。
❓人工智能整合哪些數據?
💬人工智能整合的數據包括放射學數據,如CT掃描、磁力共振掃描(MRI)以及病理圖像——顯微鏡圖像。最近,我們一直在探索如何整合基因數據。
❓您所說的「基因數據」是什麼意思?💬「基因數據」廣義上是指DNA、RNA或蛋白質數據。例如,我們研究胃癌。我們從癌變組織中取樣,進行基因測序或分子測試以獲取分子層面信息,例如癌症類型等等。
然後,人工智能算法將這些信息與其他信息,如影像信息和一般實驗室測試信息,整合在一起,從而對患者的病情做出更全面的預測。
以胃癌為例,治療策略眾多,例如最近的免疫療法。但是,我們不知道這些策略和治療是否對這個特定患者有益,因為某些策略可能無效。有見及此,我們的人工智能算法可以預測這個特定患者的治療反應,並提供生存機率分析。
❓在醫療保健中,使用人工智能允許人類做什麼他們單獨無法完成的事情?
💬有兩個例子。一個是胸肺科X光片。醫生可以很好地進行分析,例如檢測肺炎。人工智能也能做到,使用人工智能能幫助減輕醫生的工作量。
然而,對於癌症影像分析,情況略有不同。醫生可以從影像中估計潛在的生存期或潛在的治療反應,但這是基於醫生的經驗的主觀判斷。人工智能有潛力以更量化和客觀的方式進行評估。
❓這項技術現在可以在臨床實踐中使用嗎?
💬目前對於腫瘤學來說,這是前瞻性的研究。在用於臨床實踐前還有很長的一段路。然而,在我們整合基因數據後,我們認為可行性將大大提高。也許在5到10年內,這將應用於臨床實踐。
❓除了癌症之外,人工智能還能幫助治療哪些其他病症?
💬其中一例為心血管疾病。在這方面,人工智能可以發揮重要作用。與癌症相比,對某些心臟風險疾病的預測挑戰較小。此外,在整合和分析胸肺科X光片圖像方面,人工智能的準確率非常高,超過90%。
話雖如此,在應用於臨床實踐之前,我們仍然面臨隱私、倫理和醫療法規方面的問題。
多方合作非常重要——我們必須與醫生、醫院和醫學院合作。這是將人工智能技術應用於解決現實世界問題、滿足現實世界需求,並幫助我們的社會、醫療和經濟的最佳途徑。
👏謝謝于樂全教授!
「我們創造了一個新的現實」
齊曉娟教授在香港大學機電及電子工程系工作,同時也是 Deep Vision實驗室的成員。她的研究涵蓋深度學習、計算機視覺和人工智能。在這次與我們的科學主編 Pavel Toropov博士的訪談中,齊教授談到了自動駕駛汽車和構建虛擬世界。
❓ Pavel Toropov博士:您的主要研究方向是什麼?
💬 齊曉娟教授:計算機視覺和人工智能。簡單來說,計算機視覺是賦予機器看見的能力。人類可以看到三維世界——物體的形状、它們之間的關係以及許多語義。然後这些信息为会帮助我們在三維世界中做出決策。
為了讓一個機器人、一個機器在這個世界上穿梭,它也必須能夠看見。它必須識別不同的物體,估計它們的幾何形狀。這有很多應用,其中之一就是自動駕駛汽車。為了讓車輛能夠自動駕駛,它必須具備看見前方物體、障礙物、預測其他代理的行為並制定安全駕駛計劃的能力。
另一個應用是醫療。我們開發的人工智慧能自動分析醫學影像,以便做出更精確的診斷,減少誤診的可能性。
另一個令人興奮的領域是AI服务于基础学科的发展。我與化學系有一些合作,我們開發了一種人工智能算法來提高電子顯微鏡圖像的清晰度和分辨率。這可以幫助生物學家進行發現。
❓自動駕駛和人工智慧不是新事物,您的研究對這個領域有何貢獻?您的優勢是什麼?
💬 為了測試自動駕駛車輛是否能夠安全駕駛,我們需要一個模擬平台。我們目前正在做的是構建一個模擬環境,以便我們可以幫助訓練模型並評估車輛在真實環境中的安全性。你知道(非常受歡迎的電腦遊戲)《黑神話悟空》嗎?
❓當然!
💬 這個遊戲中的場景看起來非常真實,原因是開發者使用激光雷達掃描了物體,特別是山西省的歷史建築。他們對它們進行了重建並導入虛擬環境,即電腦遊戲中。
這與我正在做的非常相似——使用這些掃描,但不依賴昂貴的激光雷達掃描技術,我們使用數碼相機拍攝的圖像,在虛擬空間中重建世界。我們創造了一個全新的現實。
另一個優勢是我們正在努力使算法能夠在隨意捕捉的數據上運行。例如,在《黑神話悟空》中,他們需要專家來掃描物體並進行重建,但我們正在做的是讓任何人,不僅僅是專家,都可以用手機來掃描。然後我們可以製作算法來重建場景。
❓所以您重建或構建了一個新的現實,一個虛擬世界,用來測試自動車輛和機器人?
💬 是的。我們可以使用激光雷達或數碼相機掃描的城市,並使用算法將現實世界轉化為數碼空間。此外,我們還創建了可以生成三維物體的模型,例如桌子和椅子,類似於現實中的。在這個重建或重新創建的數碼世界中,我們可以訓練和測試我們的算法,看它是否會犯錯。
❓在虛擬世界中訓練和評估算法的優勢是什麼?
💬 我們可以從交互中獲取數據——例如,清潔機器人必須移動桌子,在虛擬世界中,這可以用來訓練機器人,與真實的物理世界互動。在現實世界中訓練是昂貴的,而且不安全——機器人可能會破壞物體,傷害人類。但在虛擬世界中,我們可以產生無限量的數據和交互。
此外,我們可以創建所謂的極端情況並提高安全性。這些是現實中很少發生但很關鍵的情況,例如兩輛車相撞。我們可以創建這些場景,讓車輛學習該怎麼做。
❓您有與業界的合作嗎?
💬 我們與香港汽車科技研發中心(由香港特別行政區政府設立)合作,我們有一個自動駕駛的合作項目。還有滴滴出行。我們與谷歌、騰訊和字节跳动也有很多溝通交流。
❓機器在嘗試看世界時的主要困難是什麼?
💬 環境中數據的多樣性和多變性。例如,我們在這個房間裡,現在很亮,但當光線變暗或天氣不同時,這會給模型帶來很多挑戰,使機器難以識別相同的物體。
(汽車的)攝像頭會捕捉不同的視頻點,加上不同的光照條件……所有這些變化使這個問題對機器來說非常複雜,儘管對人類來說在不同條件下解釋物體很容易。
因此,為了讓機器正確識別物體,我們必須將這個物體納入其訓練數據中,並且為了強化模型,我們必須有大量的訓練數據來涵蓋所有潛在情景。如果有一種情景沒有被涵蓋,在部署階段會出現很多錯誤。
例如,在美國和歐洲,車輛的尺寸不同。這也會造成麻煩。如果模型是在美國收集的數據上訓練的,然後應用於歐洲,它可能會出錯。這也就是為什麼公司會有基礎模型,設計來處理大量數據,假設這些數據可以涵蓋現實世界的多樣性。Chat GPT是一個擁有數千億參數的巨大模型。它是在几乎整個互聯網數據上訓練的,但它也會犯錯。
❓無人駕駛汽車已經在中國大陸上路了,對嗎?
💬 是的。這種汽車已經上路了。百度在中國已經有無人駕駛汽車——我與百度有合作。在武漢市,百度有一個叫做蘿蔔快跑的汽車服務。沒有人工駕駛員,但有一個人類遠程控制員可以在遇到挑戰性情景時接管。一個人類控制員可以控制很多輛車。
❓您認為無人駕駛汽車會在什麼時候像「普通」汽車一樣普遍?
💬 這即將到來。我認為在未來幾年內會實現。主要問題是人類不能容忍AI模型的任何錯誤。如果無人駕駛汽車出錯,這是一個大新聞,但人類也會犯錯。我們需要接受機器也會犯錯。人類會,而且他們犯很多錯誤!問題是——如何讓人們信任機器?我們需要人機合作。
👏 謝謝您,齊教授。
「我們曾經需要花費一天時間的工作,AI幾分鐘就能做完」
安原盛明教授就職於香港大學生物科學院的太古海洋科學研究所。他的主要研究興趣之一是古生態學,即古代生物與其環境的相互作用。在這次與我們的科研主編Pavel Toropov博士的采訪中,安原盛明教授及其博士生胡加勉解釋了人工智能深度學習工具如何改變了他們的研究。
❓ Pavel Toropov博士:您能解釋一下您實驗室的研究方向嗎?
💬 安原盛明教授:我們想了解氣候和環境對地球,特別是對海洋生態系統和生物多樣性的影響。我們對氣候變化、全球變暖、酸化、氧氣減少如何影響海洋動物很感興趣。
我們實驗室專注於海洋古生物學——基於化石記錄的長時間尺度的海洋生物學研究。在現代生物學中,科學家往往在意識到問題後才開始監測。比如,他們發現污染後才開始監測。然而,我們並不了解污染發生前的自然環境狀況。
但是通過研究沉積物岩芯和深時化石記錄,我們可以獲得一個完整的長時間序列——包括污染前後的情況。我們能夠追溯到幾十萬年、幾千萬年,甚至數億年前。
❓ Pavel Toropov博士:您使用哪些動物的化石記錄?
💬安原盛明教授:大多數動物如魚、水母、蠕蟲、海洋哺乳動物沒有良好的化石記錄,因為它們沒有貝殼這樣的硬質部分,無法很好地保存為化石,或者因它們體型太大,無法在少量沈積物中沉積物中大量保存為化石。因此,我們需要尋找一個具有代表性的替代物種,以此來推斷全球海洋生態系統的狀況。
一個代表物種是介形蟲(ostracods)。介形蟲是微型甲殼類動物,具有非常漂亮的碳酸鈣質外殼,是所有甲殼類動物、節肢動物和後生動物中擁有最好化石記錄之一。
通過研究介形蟲,我們不僅可以了解介形蟲本身,還可以以它們為代表,探索整個(海洋)生態系統的多樣性。
❓ Pavel Toropov博士:您的介形蟲樣本來自哪裏?
💬安原盛明教授:主要來自新生代(Cenozoic Era),從6600萬年前到現在。我的一些學生正在研究奧陶紀(Ordovician)時期的樣本——至今已經超過4億年了。我的研究地點包括北極、南極、大西洋、印度洋、太平洋、紅海、地中海……香港、非洲。
❓ Pavel Toropov博士:讓我用簡單的話概括一下您的工作:首先,您從海底獲取沈積物岩芯樣本,取出所有介形蟲微化石,將它們放在顯微鏡載玻片上。接著,您識別它們的物種。由於不同物種適應不同的環境,通過了解不同種類介形蟲數量隨時間的變化,您可以得出整個海洋生態系統變化的結論,對嗎?
💬安原盛明教授:是的。
❓ Pavel Toropov博士:您如何應用人工智能?
💬安原盛明教授:(在研究介形蟲時)有幾個挑戰。首先,整個過程非常耗時:包含挑選、識別、分類。其次,這項工作需要深厚的專業知識。要培養一個能熟練識別介形蟲的人往往需要需要很多年的時間,甚至可能要一整個博士學位課程。
最近我和我的博士生胡加勉合作,通過應用人工智能深度學習來自動化上述過程。他做得非常好,現在我們可以使用我們的數字顯微鏡自動掃描整個載玻片。
胡加勉使用了至少20萬個介形蟲標本來訓練我們的人工智能,目前人工智能已經可以做到自動識別了。識別速度大幅度提升,同時可以讓我們可以獲取更多的數據。
💬胡加勉: 沒錯,擁有海量數據確實意義重大!我們積累了20萬個經專家鑑定的研究級樣本,這龐大的數據庫為我們的深度神經網絡提供了充足的學習素材,使其能夠有效掌握介形蟲識別的各種模式。
❓ Pavel Toropov博士:使用人工智能能為您節省多少時間?
💬胡加勉:我們有一個博士生,她有大約一百個來自巴拿馬的介形蟲樣本。在使用人工智能之前,手工識別,一個個地處理,一個樣本可能需要幾天時間。現在使用人工智能來做,不用一個小時就能完成。
(展示一張帶有介形蟲的顯微鏡載玻片):一只介形蟲是載玻片上的一個白點。人工智能在一秒鐘內可以識別20個。這個載玻片上有幾百個介形蟲。人工智能識別只需幾分鐘,但用肉眼識別,取決於個人,可能需要幾個小時到一天的時間。
另外,安原教授并不總是有空,但我們開發的人工智能系統卻能夠全天候運作。這意味著,無論何時學生在鑑定方面遇到疑難,這個智能系統都能及時提供協助。
❓ Pavel Toropov博士:你是自己編寫這個深度學習程序的嗎?
💬胡佳勉:我是用PyTorch從頭開始構建的,它是專門為識別介形蟲訂製的。我以前是計算機專業的學生。
💬安原教授:人工智能不僅在時間效率上更高,通過使用人工智能和深度學習,我們做出了令人興奮的發現,學到了新東西。人工智能可以發現我們忽略的識別錯誤。人工智能可以給你帶來新的問題去思考。
👏 Pavel Toropov博士:謝謝你們兩位!
「我們曾經要等上1年才能拿到結果,有了AI--只需一週」
孟子楊教授是一位知名的計算凝聚态物理學家,也是將人工智能技術應用於計算物理學的先驅者之一。他的研究重點是開發大規模數值算法和機器學習模擬,以研究量子材料。 孟教授已在《Nature》、《Nature Physics》和《PNAS》等頂尖期刊上發表了100多篇論文。在本次與我們的科研主編Pavel Toropov博士的訪談中,孟教授解釋了人工智能如何革新量子和計算物理研究。他還談到了古希臘和麻將。
❓ Pavel Toropov博士:您如何在您的工作中使用人工智能?
💬 孟子楊教授:量子材料非常複雜。現有的方法通常面臨指數牆。
(註:在量子系統中,每個粒子可以存在於多種狀態。隨著粒子數量的增加,可能的狀態數量指數增加,因此描述系統所需的信息量和計算容量也隨之增加。這種增加被稱為指數牆。)
這道牆難以人類的計算能力跨越!所以,我們使用人工智能方法來提取量子材料中的量子信息,以之來設計更好的演算法,幫助我們越過指數牆,以研究新材料、新特性。
例如,我們開發了一種稱為「自學習蒙特卡洛算法」的技術。這是首批在量子多體系統中使用可解釋人工智能技術的例子之一。它有助於開創一個人工智能演算法領域,能減低量子材料計算中的數值複雜性。
我開發這些與人工智能相關的算法的靈感來自古希臘德爾菲神諭的箴言「認識你自己」。
❓ 以上有很多術語!在我們進入古希臘部分之前,您能解釋一下為什麼量子材料如此複雜嗎?
💬 量子材料的基本成分——數以十億計的電子,它們受到相互之間的量子力學作用以及它們所處的複雜化學、物理和拓撲環境的影響。如此多電子,完整地作出量子計算遠超紙筆所能及。所以我們需要現代電腦計算技術和先進的理論分析。因為有指數牆的關係,暴力計算(指計算所有可能的候選項)無法解決這些難題,所以必須以更深入的理解來處理它們:要麼應用人工智能,要麼應用人類智慧。現在有了人工智能,許多之前因需要大量計算能力而無法進行的模擬變得可能。
❓ 您能舉個例子嗎?
💬 例如「自學習蒙特卡洛算法」。使用這個算法,我們首先使用人工智能方法從小規模——少量電子的模擬中提取更好的模型參數,這些參數可以更準確地呈現材料內部數十億電子之間的相互作用,以及它們如何對實驗條件如溫度、電子或磁場做出反應。(註:蒙地卡羅模擬法是一個建模並解決涉及隨機性和大數據問題的方法。它通過測試多種可能的情景來處理這些難題。)然後我們可以在超級電腦上開始大規模的量子蒙地卡羅模擬。比起使用傳統蒙地卡羅模擬,加了自我學習的模擬法速度更快。
自我學習步驟至關重要。它為我們提供了更好、更準確的模型參數,這意味著我們可以更好地了解材料的特性。這就是我所說的德爾菲箴言「認識你自己」的含義。「認識你自己」意味著我們必須找出這些相互作用的電子之間最重要的相互作用。因此,自我學習一方面切合現代如人工智能和量子物理學,又古老如人類文明的開始——古希臘。
❓ 您指的是德爾菲箴言——那些刻在古希臘阿波羅神廟上的道德準則嗎?
💬 是的,我甚至寫了一篇關於這個主題的科普文章——「從德爾菲神諭到自學習蒙特卡洛」。這篇文章是用中文寫的,發表在《物理》——中國物理學會的期刊上。http://www.wuli.ac.cn/cn/article/doi/10.7693/wl20170406。
❓ 所以,人工智能通過減少大量的數據處理時間來加快進程?
💬 在量子物理研究中,人工智能不僅僅意味著我們可以更快地計算。人工智能幫助我們找到更好、更準確的量子材料模型。這使我們能更好地理解材料,並且——更好地理解理解的過程:這樣我們就能發現新的物理規律。
❓ 量子物理並不是大多數人在日常生活中經歷的東西。對於非專業人士來說,這樣的研究可能聽起來非常抽象,完全是理論性的。您的研究在「現實世界」中意味著什麼?您的工作有什麼實際應用嗎?
💬 我們的動量空間蒙特卡洛自學習方法處理的是量子材料中的一個新謎團:魔角扭曲雙層石墨烯中最近發現的超導性。石墨烯就是我們在鉛筆中有的材料!如果我們能將超導溫度從零下270攝氏度提升到,比如說,室溫,我們可以解決全球能源危機。我們最近關於這個問題的論文獲得了2024年度中國物理學高被引論文獎。
❓ 這怎麼能解決能源危機呢?
💬 使用超導電纜和導線,電力一旦從發電站產生,就不會以熱量的形式散失到空氣中,這是因為在超導狀態下的電子不會像在常用的導體如銅、鐵和其他金屬中那樣受到電阻。沒有電阻意味著電子運動不會減速,轉化為熱量並丟失,產生能量可以100%用於預定用途。
❓ 您的辦公室裡有一副物理主題的麻將。為什麼?
💬 麻將是一個策略遊戲。在量子物理中,人工智能幫助物理學家制定策略,使物理學家能夠更好地理解問題。我認為人工智能是一個非常好的夥伴,可以幫助物理學家解開大自然的謎團。大自然與我們玩遊戲,將她的秘密隱藏在複雜的現象背後,我們需要一個好的夥伴——如人工智能,來玩這個遊戲,尋找解決方案。我正在香港大學物理系教授一門新本科課程——PHYS3151:物理中的機器學習,在這裡你可以學習如何使用人工智能技術來解決問題——從牛頓力學和電磁學到量子現象。歡迎大家報讀!https://quantummc.xyz/hku-phys3151-machine-learning-in-physics-2024/
👏 謝謝您,孟教授!
「AI讓不可能變為了可能 」
蒋海波教授就職與香港大學化學系,同時也跨學科擔任賽馬會分子影像創科實驗室的主任。他於2021年加入香港大學,並在牛津大學獲得博士學位。在這次與我們的科研主編Pavel Toropov博士的訪談中,蒋教授解釋了人工智能在他研究中的重要性。
❓ Pavel Toropov博士:你的實驗室的研究重點是什麼?
💬 蒋海波教授:我的實驗室專注於開發新的成像技術,以便在非常小的尺度上觀察生物系統內部。例如,觀察單個細胞或單個細胞器內部的情況。
我們的分子成像技術結合了不同類型的顯微成像技術——包括光學、電子和离子顯微成像。通過結合這些技術,我們可以從一個樣本中提取信息,從而理解其生物,結構和化學上的變化。
❓這些圖像有什麼用途?
💬 例如,可以使用圖像追踪藥物在生物系統中的分布。我們使用高解析度和高靈敏度的技術,可以觀察到藥物在生物體內的分佈,以及它如何到達目標並發揮治療效果。
我們將來自電子顯微鏡的結構信息與質譜顯微成像的化學信息結合起來,這樣我們就能夠可靠地確定藥物的位置——在哪個細胞器、哪個細胞、哪個組織中的哪個器官。我們還可以了解為什麼藥物有效或無效,以及為什麼會引起副作用。
❓你正在研究哪些藥物?
💬 我們的方法適合多種藥物的研究。我們已經應用它來了解抗生素的流向。一旦進入人體,抗生素需要到達細菌處才能將其殺死。我們可以追踪各種不同的抗生素,看看它們是否到達感染部位的正確細胞。我們也將我們的方法應用於研究癌症藥物,以了解藥物進入細胞的位置,因為這對其療效非常重要。
❓ AI的作用是什麼?
💬 對我們來說,AI使不可能變為可能!通過AI,我們可以疾速生成高質量圖像。
❓你能解釋一下嗎?
💬 成像最大的問題在於圖像質量和成像速度之間的折衷。AI可以加快速度,並提供更好的解析度。
我們方法的一個主要限制是速度慢。這是我們所使用的顯微技術的本質。我們逐像素掃描,圖像質量和成像速度之間存在折衷。如果我們快速掃描,會有噪點,信號會很低。如果我們掃描一個像素十次,我們可以獲得更高的信號和更少的噪點,質量會高得多,但這需要更長的時間。
但使用AI,我們可以將電子顯微鏡的速度提高超過10倍,不僅更快,而且更高效。通過AI,我們可以使用較低解析度的圖像來加快速度,並且可以覆蓋較大區域的樣本,從一個生物樣本中提取更多信息。
❓你的下一步計畫是什麼?
生命是三維的,但我們之前的工作大部分是二維上的研究。當我們進入三維成像時,挑戰會更大!
目前有技術可以讓我們觀察細胞器的高分辨的三維結構,但現在最大能做到的體積對於一個組織樣本來說真的太小了。
但科學家夢想能夠在三維中看到一個大樣本,例如,人類大腦中神經元如何連接起來。這在現有技術下是不可能的。我們的夢想是擁有算法技術,以實現對大型生物樣本的高速三維成像。
❓ AI在你們領域的未來是什麼?
我認為,在生物成像領域,AI將無處不在。從成像本身到數據分析。我是在來到香港大學後才開始與AI專家合作,但我認為AI將是未來的趨勢。
我們需要學會如何在研究中運用AI——做我們所做的事情,但做得更好。
「AI幫助我們解碼細菌的化學語言並利用它們的武器 」
香港大學化學系的李泳新教授專門研究化學生物學及藥物研發,主要研究方向是以生物資訊引導的藥物研發和生物合成。 在這次與我們的科學主編Pavel Toropov博士的訪談中,李教授談到了他的團隊如何使用人工智能來創造新的抗生素。
❓ Pavel Toropov博士:你主要在哪些工作中使用人工智能?
💬李泳新教授:我們致力於發現新抗生素,以應對抗生素耐藥性問題——超級細菌。 長期過度使用抗生素,導致抗生素耐藥性的超級細菌出現,使得現有抗生素失去了效力,這迫切需要我們開發新的抗生素。
我們的工作是向自然學習。在自然環境中,細菌使用化學物質作為防禦武器,與其他細菌進行非常激烈化學競爭!
我們致力於解碼並利用這種化學語言,將它們用於疾病治療,開發成抗生素來殺死人體中的病原體。
但是,我們並不是遵循傳統的方法——培養細菌,分離它們並識別它們所產生的化學化合物,這既耗時又費力。 我們查看細菌的基因潛力,從大型數據集中挖掘細菌基因組中的化學物質。
我們不是通過化學合成來合成新抗生素,而是使用合成生物學來挖掘細菌的基因潛力進行藥物研發。 我們使用細胞工廠、細胞生產線為我們生產活性化學物。 我們克隆生物合成基因簇(注意:生物合成基因簇是編碼複雜化學物質的基因簇),將它們導入細胞工廠,讓細胞工廠為我們製造抗生素。
❓ 您在工作中如何運用AI?
💬我們使用AI來解碼細菌的化學語言及挖掘其基因潛能。 現在基因組信息已經在線上可用——已有超過一百萬個細菌基因組可供挖掘!
我們開發了多種稱為基因組挖掘的新方法。 藉助AI及大數據分析,分析一百萬個基因組並評估它們編碼抗生素的基因潛力。
傳統方法是逐一分析單個細菌基因組。 這樣做效率不高,發現新抗生素的機會也很低。 因此,我們訓練AI從一百萬個基因組中分析獲取上千萬生物合成基因簇。 通過使用AI,我們還可以預測抗生素的結構和生物活性潛力,從而挖掘並篩選可能編碼抗生素的基因簇。
❓ AI能節省多少時間?
💬使用傳統的方法,in silico篩選過程(注意:in silico指的是在計算機上或通過計算機模擬進行的生物實驗,用於預測不同化合物特性)可以篩選數千個生物合成基因,並將其縮小到約數十個進行實驗驗證。 使用AI,我們可以從兩千萬到三千萬個基因開始,評估它們的抗生素編碼潛力,從中優選可能編碼抗生素的基因簇。
傳統的方法可能需要數年時間。 但使用AI,我們可以在幾天甚至幾小時內完成in silico的篩選。 然而要驗證結果,仍然需要基因簇克隆及異源表達等合成生物學策略,這部分是速控步驟仍然需要很長時間。
❓ 你們距離創造新抗生素還有多遠?
💬藥物研發是一個非常漫長的過程。 我們近期發現一新的抗生素先導化合物,我們已經完成了臨牀前測試、體內抗感染應用和初期毒性評估,它已經準備好進入下一步測試。
👏謝謝你,李教授
大學生方程式汽車大賽2023
項目團隊Dr Match Wai Lun Ko香港大學賽車隊(HKU Racing)現帶著他們設計和製造的賽車,出戰「大學生方程式汽車大賽」,在英國傳奇的銀石賽道與來自世界各地不同大學的車隊一較高下!🏎️在這場國際賽事上,各個大學的賽車隊不僅要在賽道上馳騁競速,亦會在汽車設計和商業規劃方面較競。 2019年,香港大學車隊曾榮獲兩項獎項,其中包括設計組第一名。 ㊗️港大車隊今年再創佳績!
布氏鯨
最近,在香港近海竟然發現了布氏鯨的影蹤!很多人擔心它是迷路至此,但香港大學太古海洋科學研究所的研究人員認為,鯨魚本來就生活在香港海域。來自該研究所的最新研究亦揭示了香港的海洋生物多樣性可能居全球之首——科學家已經在香港發現了超過6,000種海洋物種,而這個數字仍在不斷增長。
海洋生物學家的一天
項目團隊Dr Shelby Mcllroy / Emily Chei / Róisín Hayden香港大學海洋生物學家的一天:跟隨港大太古海洋科學研究所的年輕研究人員出海,體驗他們有趣的工作!研究員最近出海潛水,取回放置於海底的自主礁檢測器,這是監測海洋生物多樣性全球項目(MarineGEO)的一部分。研究驚人地發現,在香港極小的海域內,竟有超過 6,000 種海洋物種。這些魚類、藻類、珊瑚和軟體動物與數百萬人類共同生活,人類的活動如何影響海洋生物多樣性,是我們需要關注的議題。🐠🐡🐬
環境DNA
項目團隊Dr Shelby Mcllroy / Dr Mathew Seymour / Coşkun Güçlü / Elaine Chan Tsz Ying🌎環境DNA是從土壤、海水等各種環境中收集的DNA,香港大學的科學家透過採集少量的水或土壤樣本,再利用這些微觀的eDNA線索來識別哪些動物曾經到此一遊。來看看研究助理教授Shelby McIlroy及助理教授Matthew Seymour如何解釋這項技術。
實驗室雙胞胎
項目團隊Emily Chei / Róisín Hayden來自愛爾蘭的Róisín Hayden和美國的Emily Chei從事珊瑚研究,她們同時開始攻讀博士學位,自此形影不離,故稱自己是「實驗室雙胞胎」。不過,在實驗室之外,兩個人的愛好卻截然不同——羅伊辛打橄欖球,艾米莉則是舞者。
關於海洋生物學家的生活(Róisín Hayden):「我考察生活在珊瑚內的藻類如何爭奪碳和氮。 2018 年,我在泰國第一次看到珊瑚礁,意識到這就是我想做的事!每一天都不一樣:我可以潛水、在實驗室工作或寫作。 但珊瑚的死亡速度比我們瞭解和拯救它們的速度更快。」
(Emily Chei):「我研究不同的珊瑚物種如何獲取營養,以及這如何影響它們對環境壓力的適應能力。 我喜歡這些經歷——住在考察船上,探索水下石油鑽井平台,與海豚一起浮潛。 我不僅學到了實驗室技能,還學到了可轉移的技能,比如溝通。」
關於科學領域的女性 (Róisín Hayden):「在職業生涯的早期,從事科學工作的女性有很多,但有話語權的女性卻很少,這讓我很困擾! 在科學領域實現平等還有很長的路要走。」
(Emily Chei):「在科學領域,女性很難晉升到更高的職位,我們需要女性導師來領導其他女性。」
裂唇魚
項目團隊Dr Celia Schunter / Debora Desantis / Daniele Romeo全球暖化正在改變並破壞海洋生態系統,海洋溫度更不斷破紀綠地上升,首當其衝受到影響的就是海洋動物。港大生物科學學院Celia Schutner博士的團隊追踪魚類大腦及基因的變化,從而了解較高的海水溫度如何改變一種名叫裂唇魚的行為。
裂唇魚是非常聰明的魚類,可以在鏡子中識別自己,牠們會吃掉其他魚類身上的寄生蟲及死亡組織,對珊瑚礁的健康十分重要。不過,海水溫度升高,裂唇魚就會減少時間在其他魚類身上,影響珊瑚生態健康。
數碼雙胞胎
項目團隊Dr H.H. Cheung【數碼雙胞胎】香港大學工業及製造系統工程系張凱凱博士領導的團隊開發了一種網路物理系統——這網路物理系統能將現實與它的「數碼版」聯繫起來,允許電腦遠程操控現實世界中的物件。這項技術有潛力改變許多專業及行業,如醫藥、農業、物流、建築和工程,張博士趣稱它為「數碼雙胞胎」。
智能老年助行器
項目團隊Dr Wen Rongwei / Zhao Chongyu創新科技服務社群。香港是世界上人均壽命最長的地區。 超過四分之一的香港人年齡在 60 歲至 80 歲之間,80 歲以上的更超過 30 萬人 。能夠獨立行動、保有尊嚴,對許多老人來說尤其重要。
為此,香港大學計算機科學系吳川博士領導的團隊開發了一款「智能老年助行器」。 這款助行器針對香港的實際情況而設計——由於許多長者居住的單位細小,因此它設計成可折疊的;此外,香港人喜歡在露天街市購物,這助行器也適宜在戶外環境中使用。
智能老年助行器可說是科技先驅,它不需手動,而是使用LiDAR光學來感應用戶的移動,其「前向跟隨」的獨特功能會保持在使用者的前方。在緊急情況下,特殊感測器會立即啟動剎停功能,使用者便可以抓住助行器,防止跌倒。 助行器還可以通過人工智能的語音識別功能,使用者呼叫時能識別用戶的聲音。
今年,港大的設計團隊,博士後研究員聞榮偉及博士生趙崇彧帶同智能老年助行器參加了日內瓦國際發明展,並榮獲銅獎。
系統機器人
項目團隊Department of Industrial and Manufacturing Systems Engineering港大工業與製造系統工程系學生製造的機器人,功能越來越厲害,從協助圖書館分類圖書、消毒空氣、街道巡邏到山中救人,現在,它們還有節奏感! 和機械器人一起參加電視才藝比賽,很快不是夢啦!