當前位置：首頁 > 新聞資訊 > 機器人開發 > 由主動學習和AI驅動的智能自主實驗[Nature Reviews Materials評論文章]

由主動學習和AI驅動的智能自主實驗[Nature Reviews Materials評論文章]

來源：CAAI認知系統與信息處理專委會編輯：創澤時間：2023/9/11 主題：其他 [加盟]

近日，MIT材料科學與工程系李巨、Tonio Buonassisi、任之初等人在Nature Reviews Materials的Comment欄目發表題為“Autonomous experiments using active learning and AI”的文章，介紹了由主動學習和AI驅動的智能自主實驗。

主動學習和自動化并不能讓人類輕松地擺脫實驗室的工作。在它們對新材料研究產生實質性的影響之前，我們必須非常仔細地部署人工智能系統，確保它們能夠穩定地運行，并且能夠應對各種偏差，包括隨機噪聲（stochastic errors）和因人類對所研究的問題認知不足而導致的認知性偏差（epistemic errors）。如今，隨著自動化和AI逐漸普及，我們需要認真考慮自主實驗室的可重復性、可重配置性和實驗互通性這些關鍵因素。

探索新材料是一個勞動密集型過程。愛迪生為了發明白熾燈泡，測試了數千種燈絲。現如今，便宜的自動化設備讓結合機器人和主動學習算法的新研究方法成為可能。雖然在預算和空間有限的情況下，構建完全自動化的實驗平臺是非常具有挑戰性的，但是在半自動化的工作流上也可以取得不錯的進展。例如，在儀器之間完全可以保留傳統的手動轉移樣品，并不一定要使用機械臂或者是傳送帶之類的自動化。只要實驗結果高度可重復，即使使用一些基本的機器學習方法，比如高斯過程回歸和貝葉斯優化，就已經能很好地解決許多材料優化問題。

就像把孩子養大需要幾十年時間，并且在這過程中需要教他們各種各樣的東西一樣，人們不應該期望在知識基礎比較有限的情況下，由主動學習（active learning）驅動的實驗一開始就非常有效。這個學習過程在開始時往往是非常脆弱的。教一個小孩子走路需要很多手把手的引導，同樣地，驅動實驗的人工智能在一開始也需要很多指導，即使其調用的自動化平臺看似十分“穩定高效”。

01 認知性偏差的挑戰

能夠獲得長期可復現的數據集是自動化平臺有能力開展主動學習的衡量標準。當一個實驗重復兩次產生不同的結果時，差異主要來自兩個方面：偶然性偏差和認知性偏差。偶然性偏差源于隨機性，可以通過提升自動化占比和在模型中引入高斯過程噪聲核來有效緩解，因此相對容易處理。相比之下，認知性偏差則可能會影響自主化實驗的成功，尤其是在主動學習算法還未經過優化調整的情況下。認知性誤差，從本質上講，就是由于我們科研工作者的“知識偏見”——我們認為一些變量在多次試驗中是恒定的，但實際上它們在“悄悄”地變化。

以我們實驗室的自動化滴涂碳基底樣品過程為例，有段時間我們發現即便是重復同樣的實驗，樣品的性能差異也很大。直到有一天，我們注意到碳基底可能是各向異性的，也就是說我們切割它的方式（從市場上買來的片狀切成條狀）是一個重要的變量，直接決定了滴涂后樣品擴散的方向和最終面積。而在此之前，我們一直很自信地默認這個基底是各向同性的。諸如此類的知識偏見，很可能將直接導致整個機器學習項目失敗。

為什么可復現性對主動學習特別關鍵？手動實驗不也面臨這個問題嗎？答案是肯定的，但人類的經驗和靈活性大大緩解了這個問題。想象一個學生發現了一種合成方法，重復了10次，其中2次得到了非常令人興奮的結果。學生會怎么做？誤差區間太大，無法發表，所以學生和導師會討論、調整設置，最終找出統計異常背后的原因（例如，中間反應產品的外來水分含量）。

統計上的異常源于我們沒能找齊決定了實驗結果的變量全集。如果我們選擇忽略而不是去深入調查和試圖理解我們漏了哪個隱藏變量，其結果就是，我們發現自己的實驗難以復現。《自然》雜志的一項調查顯示，文獻中不可復現性的主要原因是選擇性報告，其本質也是類似的——文獻只披露了實驗變量全集的一個子集（也許作者自身也未意識到）。如果我們還沒搞清楚誤差來源就輕率地啟動一個主動學習項目，這可能會浪費大量時間和金錢。算法會錯誤地將特殊的噪聲視為信號，從而給出糟糕的建議，正所謂“garbage in, garbage out”。

另一方面，如果我們仔細地去排除認知性偏差，找出隱藏變量，可能會有意想不到的科學發現，就像青霉素是由于意外真菌污染而未能培養細菌培養物所發現的。人類非常擅長扭轉“實驗失敗”，因為我們有著出色的因果推理能力（用福爾摩斯的話說，“一旦排除了所有可能性，無論剩下的是多么看似不現實的推論，必定就是事實”）。可惜的是，樸素的主動學習方法并做不到這些，因為它們被設定了過于簡化的世界觀，而且沒有太多先驗的物理知識。

與傳統機器學習技術不同，大型語言模型如ChatGPT能生成科學上合理的猜想。未來，我們有望利用更先進和全面的自主實驗室來驗證這些由大模型生成的假說。比如，我們可以在受控的氣氛反應室內自動重復合成程序，以探究實驗結果對不同氣體分壓的依賴性。隨著自動實驗引入計算機視覺（在某些方面已超過人類視覺），以及借助于龐大的先驗知識庫，AI系統將能更精確地跟蹤實驗室條件（例如濕度、背景輻射、前體材料的紋理和不均勻性）。因此，隨著AI系統逐漸整合多模態傳感器，弄清認知誤差的可能原因并針對性地調整工作流程只是時間問題。大型語言模型結合具有通用感覺運動功能的強化學習，以及下文所述的“新控制論”，很可能是實驗室自動化革命的下一個步驟。

02 AI驅動的自主實驗室網絡

隨著AI系統變得更加復雜和強大，預算和空間的限制，模塊化的云實驗室設施將變得有必要。這類新型實驗室不僅需要能重新編譯和鏈接各種實驗設備，還需要確保多個自動實驗室之間的互通性。一個包括實驗和理論兩個方面的龐大的AI網絡將被建立，以實現實驗室級的勞動分工、規模經濟和互相制衡。例如，當某個AI實驗室制備出了具有突破性性能的樣品后，AI網絡會負責將（i）該制備方案發送至負責理論研究的AI實驗室進行分析，（ii）在該實驗室本地復制多份物理樣品并傳送至多個專門負責測試的AI實驗室，（iii）制備方案本身分發至負責制備同類型材料的AI實驗室以進行對抗性的復現測試。

今天的材料合成、表征和性能測試的設備主要是為人類用戶設計的。未來，自主實驗室每臺設備都需要具有兩個接口，一個主接口服務于物聯網上的AI系統，另一個用于人類操作。每個設備模塊將更像是軟件庫中的子程序，其物理樣品輸入/輸出規范將被明確且嚴格地定義。設備鏈將具備快速和自動的重配置能力，以滿足不同科研項目的需求。值得注意的是，重新配置并不意味著需要將設備物理移動以組成一條流水線，因為輪式機器人和小型無人機將負責模塊之間的樣品傳送。

雖然自主材料研究實驗室的概念早在1950年代就已經出現，但至今成功的案例仍然較少。目前在學術界，實驗室大多還是以人為核心，且每個實驗室的建設預算僅限于幾百萬美元或更少。這通常意味著單個實驗室只有自家“一招鮮”或“幾招鮮”的手段，這使得它們在識別認知誤差或迅速適應工作流變化方面表現不佳。當懷疑有些不尋常的情況發生時，人類研究員會向校園內從事不同領域的同事尋求幫助，請他們進行補充測量。這種靈活性在科研探索過程中是非常重要的，反觀我們今天的以機器和AI為核心的自主實驗室案例，由于規模太小，還無法做到類似的靈活性。

為了解決這個問題，不同的自主實驗室需要實現更好的協同工作。例如，讓AI有能力將一個物理樣品及其對應的元數據從一個實驗室傳送到另一個實驗室。這樣的任務需要我們建立標準化的數據和樣品傳輸協議，比如規定用于傳輸液體、粉末、凝膠、顆粒和單晶材料的膠囊，它們需要與易于稱重、尺寸測量以及光學和化學表征設備相兼容，還需要能有效防止外界污染。此外，我們可能還需要重新考量設計建筑和基礎設施，例如無人或者是機器人和人類研究人員共同工作的全新的建筑架構。

AI時代已經來臨。為了在實驗研究和材料發現中充分釋放AI的潛力，為硅基智慧提供“手”（材料合成加工/樣品轉移/設備模塊重組）和“眼睛”（材料表征/多模態感測）至關重要。建立一個穩健的AI對于現實世界的感知反饋系統絕非易事。但是，隨著AI實驗室的正確配置和相互鏈接（核心是標準化接口和模塊化設備），以及全球廣泛共享的專業知識，強大的AI自主實驗室可能會徹底改變材料研究。