機器學習驅動的電池電極高級表徵

編輯 | 白菜葉

材料表徵,即通過各種物理、化學等測試方法,揭示和確定材料的結構特徵,是科學家理解鋰離子電池電極及其性能限制的基礎方式。基於實驗室的表徵技術地進步,科學家們已經對電極的結構和功能關係產生了許多強有力的見解,但還有更多未知情況等待探索。該技術的進一步地改進,取決於對材料中複雜的物理異質性的更深入理解。

然而,表徵技術的實際侷限性,限制了科學家直接組合資料的能力。例如,某些表徵技術會對材料造成破壞,因此無法對同一區域進行其他參數的分析。幸運的是,人工智慧技術擁有巨大潛力,可以整合傳統表徵技術所收集的資料,從而構建具有代表性的 3D 多模式資料集。

從以上觀點出發,美國國家可再生能源實驗室(National Renewable Energy Laboratory,NREL)以及英國帝國理工學院(Imperial College London)的研究團隊發表綜述,概述了基於實驗室的鋰離子電極表徵技術的最新進展。同時,他們也討論了人工智慧方法如何結合和增強這些技術,例如風格遷移、生成、超解析度和多模態融合。

該綜述以「Machine-Learning-Driven Advanced Characterization of Battery Electrodes」為題,於 2022 年 11 月 9 日發佈在《ACS Energy Letters》。

「你無法衡量的東西,你便無法管理它。」這是一句管理學格言。這句格言同樣適用於鋰離子電池技術領域。鋰離子電池的性能與許多材料特性有關,涉及空間和時間變化相關的化學、晶體學和形態學等。

自鋰離子電池首次商業化以來,管理和調整這些特性從而獲得良好的電池性能,已經使鋰離子電池有了相當大的改進。通常,材料特性的確定,需要使用先進的表徵技術來完成,但由於分析設備的實際限制,仍有很多參數無法測量。

在過去十年中,人工智慧技術在增強、合併、預測、分類以及人工生成資料方面均取得了長足進步。與此同時,現在的材料表徵設備比以前具有更高的解析度、更短的資料採集時間以及簡化的多模態資料處理路線。許多商業資料分析軟體包已開始包含人工智慧技術,例如,增強空間解析度、跨多模態技術關聯資料,以及識別和量化資料中的特徵。並且,每年都會有應用 AI 進一步增強資料的新方法誕生。重要的是,現在通過使用人工智慧技術,所生成資料集的細節超出了任何單一表徵技術所能達到的範圍,從而超越了設備限制。

儘管到目前為止,這些領域取得了不錯的進展,但應用 AI 技術仍然可以進一步提高我們的表徵能力,且潛力巨大。這可以使研究人員能夠測量並管理電池材料眾多傳統技術無法獲得的特性。

電極性能的重要特性

如今,鋰離子電池中使用了各種各樣的電極材料和電解質化學物質。為了方便討論,綜述主要關注具有石墨陽極、LiNixMnyCozO2(NMC)陰極、多孔聚合物隔膜和液體電解質的傳統鋰離子電池材料方面。

從數百微米到奈米的長度尺度,化學、晶體學和形態學特性決定了電池在其整個循環壽命期間的電化學性能。研究人員對這些結構和功能關係的理解,關係到如何定義操作限制和降解途徑,也關係到如何提高電池性能。

圖:影響電極在其整個循環壽命中的電化學行為的多長度尺度形態、化學和晶體學特性的示例。(來源:論文)

跨長度尺度的表徵和技術限制

跨長度尺度的形態學、晶體學和化學性質的表徵,對於解釋鋰離子電極的結構和功能關係至關重要。獲取這類資訊的技術選擇和順序選擇非常重要,但由於每種技術都有特定的優勢和系統侷限性,所以這一過程可能會很複雜。

雖然同步加速器技術的應用,在多長度尺度和多模態表徵方面取得了巨大進步,但在這裡,研究人員主要專注於學界應用更廣泛、更容易獲得的基於實驗室的技術。

為了在電極的材料特性與其電化學性能之間建立直接聯繫,需要從同一材料樣本中獲取來自多種不同技術的資料資訊。理想的表徵工具應當可以提供一個高維資料集,資料集應包含跨越空間和時間長度尺度的形態學、化學和晶體學全部細節。

圖3:多模態實驗室技術示例及其功能。(來源:論文)

圖:近期鋰離子電極在整個長度尺度上的形態、結構和化學表徵成果的示例。(來源:論文)

然而,由於存在系統限制,所以無法從同一樣本中獲取多模態細節。首先,許多技術都是破壞性的,因此本質上會阻止樣品在不同的系統中成像以進行相關顯微鏡檢查。另外,對於許多技術而言,樣品製備是另一個相當大的挑戰。鋰離子電極樣品通常對空氣敏感,準備用於成像的樣品,既繁瑣又耗時。如果樣品製備不達標,可能使該技術統計置信度極低,或者無法使用多種技術和長度尺度進行相關計量。

由於表徵技術的侷限性,使研究人員想到將多模態資料流混合到單個資料集中的方法;利用每種成像模式的優勢來生成新的代表性資料集,其細節超出了單獨使用每種技術的細節。雖然這些技術已被證明是有效的,但它們構建起來相當複雜,並且往往是專門為特定材料設計的,不利於普遍推廣。

因此,研究人員將注意力轉移到了新的機器學習(ML)技術,這些技術可以實現更廣泛的應用,同時減少了對專家參與的依賴性。

實現下一代材料表徵的機器學習方法

隨著 ML 演算法的快速發展,以及計算能力的不斷提高,材料設計、發現、最佳化和表徵方法正逐漸形成新正規化。特別是針對基於圖像任務的現有計算機視覺研究,其中許多技術可以應用於鋰離子微結構資料集。

這些方法的核心一般是卷積神經網路(CNN),這一直是圖像分類的關鍵,同時它們也構成了對象檢測、圖像增強和圖像生成中眾多開創性方法的基礎。

雖然這些 ML 方法已經適當解決了一些表徵技術的侷限性,如增強解析度和自動分割圖像的結構特徵,但其仍有進一步發展的巨大潛力。在多數情況下,當期已經建立的 ML 方法可以直接應用於材料表徵分析。

圖:用於實現下一代材料表徵的機器學習方法示例。(來源:論文)

分割(Segmentation)

分割(Segmentation),即為每個像素/體素分配一個相位標籤的過程,是一個常見的材料科學任務示例,適當使用人工智慧可以極大地提高它的完成度。

在材料科學中,執行定量表徵或模擬之前,需要進行語義分割。「閾值化」是常見的分割方法,其中僅根據像素相對於固定截止值的灰度值將像素分配給類別。然而,閾值顯示在不同材料之間的邊界處具有高可變性和較差的性能,這會導致對電池電極微觀結構圖像的誤導性分析,因此應避免使用。

而另一方面,從圖像中量化多尺度形態特徵對於創建電池材料的結構和功能關係極為重要。形態資訊的量化幾乎總是涉及灰度圖像的分割。CNN 方法可以提高分割的準確性,從而提高量化的形態學特性,這有望顯著提高科學家在該領域的表徵能力。

風格遷移(Style transfer)

風格遷移(Style transfer)是另一種常見的 ML 技術,可應用於材料科學。此方法生成的資料集採用另一種資料集的外觀或風格細節,同時保持原始資料的結構特徵。比如,它可以修改藝術品,採用另一位畫家的繪畫風格。

如前所述,不同的成像技術提供不同的解析度、保真度和資訊。風格遷移可以將兩種或多種捕獲不同材料特性的互補技術的資料進行遷移,融合不同的成像技術,為多模態資料集提供超越傳統實驗室能力表徵的途徑。

修復(Inpainting)

圖像缺失或損壞的區域可以使用稱為修復(Inpainting)的技術來填充。深度卷積模型,特別是生成對抗網路(Generative Adversarial Networks,GANs)和自動編碼器(Autoencoders),在修復方面非常成功。許多材料表徵技術包含偽影或損壞的區域,需要這類技術的加持。

從廣義上講,材料科學中有兩種修復方法。首先,使用經典的統計重建方法,例如基於樣本的修復,其中最著名的例子是 PatchMatch 演算法。其次,基於 ML 的方法開始出現,它們使用 GAN 和自動編碼器來檢測和修復受損區域。

值得注意的是,隨機修復方法並不旨在準確地重建地面真值缺失資料。相反,丟失的資料被具有匹配邊的統計相似的生成資料替換。修復可以將低質量資料集轉換為高質量資料集,從而可以去除不需要的成像偽影,避免重複實驗。

雖然這些 ML 技術已經存在,但進一步利用前沿 ML 研究來提高修復質量是可能的,並且需要做更多的工作將這些工具集成到現有的工作流程中,並使它們更廣泛地為社區所用。

生成(Generation)

ML 資料生成(Generation)技術有很多種,但最廣泛採用的兩種是 GAN 和擴散模型(Diffusion Models)。這些方法可以應用於資料可用性有限的資料增強任務,這使它們成為材料科學中的強大工具。在材料科學中收集宏觀均質材料的大視野圖像,既費時又昂貴。科學家使用 GAN 在對相對較小的訓練資料進行訓練,然後生成大量任意體積的 3D 微結構(包括電池材料),從而可以生成物理範圍超出實驗室能力的資料集。

維度擴展(Dimensionality expansion)

近期,科學家已經開發出針對特定表徵的定製解決方案。2D 圖像通常可以提供比 3D CT 衍生圖像更高的解析度和更好的相位識別,同時通常更快更容易獲得。然而,許多關鍵指標本質上是 3D 的。

維度擴展(Dimensionality expansion)是使用低維資料集生成高維版本的過程。這類方法使用同質 2D 微結構訓練資料,來訓練輸出 3D 微結構的 GAN;從而可以非破壞性地生成 3D 資料集,為比較研究提供了可能。如果應用於無法進行 3D 模擬的 2D 成像技術,此方法還可以生成以前無法獲得的 3D 資料集。

超解析度(Super-resolution,SR)

超解析度(Super-resolution,SR)方法,即從低解析度圖像生成高解析度圖像,深度學習是完成這一任務的最有效的方法之一。低解析度資料更容易獲得,高解析度資料不易獲取時,使用少量高解析度資料訓練超解析度模型,可以提供收集具有代表性的高解析度資料的捷徑。

當不存在真實實驗資料參考時,驗證生成合成資料的方法具有挑戰性,許多 ML 工具都存在這種問題。通過將訓練期間未約束的各種微觀結構指標與基本事實進行比較,來評估合成資料的質量,是一種有用的驗證技術;這至少可以斷言所生成的資料是否保留了資料集的一些隱式統計資料。所以,在開發這些技術時,必須首先在有基本事實的研究中探索驗證,然後再擴展到沒有基本事實參考的領域。

此外,隨著新技術和方法的開發和調整以解決材料表徵挑戰,確定可以構建到 AI 演算法中並由其強制執行的新假設非常重要。

最佳化和資料融合:展望人工智慧和多模式表徵的未來

ML 有可能克服現有表徵技術的許多侷限性,將人工智慧和多模式表徵結合起來可能會更加強大。

形態最佳化與製造參數關聯

人工智慧的一個強大的潛在應用是最佳化電極形態(微觀結構、細觀結構和電池幾何形狀),這將通過最大限度地減少各種電化學過程造成的損失,來提高能量密度和縮短充電時間。但這一過程應當考慮實際的物理限制,所以形態最佳化需要與相關製造參數相關聯。

關聯製造參數無形之中又提出了一個新挑戰。解決這一問題的一種方法是使用基於物理的模擬來直接模擬製造過程。然而,這在計算方面非常昂貴,且極其複雜,除非使用高度簡化的系統。雖然基於物理的模型不適用於最佳化複雜的製造條件和供應鏈,但它們在解釋特定材料特性對電池性能的影響和最佳化方面,具有巨大的實用性。

ML 可以提供資料驅動的方法,避免直接模擬的成本和複雜性。特別是,條件 GAN 可以學習生成與一組指定參數相對應的樣本族,在這種情況下,這些參數可以是「製造參數」。這意味著可以僅使用有關輸入和結果輸出的資訊,來了解制造參數和微觀結構特徵之間的關係。

儘管條件 GAN 能夠快速生成新穎的微觀結構,但這確實涉及在參數空間中進行插值並生成之前未曾有過的示例。插值過程基於標籤和資料之間的隱式關係,而不是基於物理的關係。這是基於 GAN 的方法的潛在弱點,必須小心驗證任何插值結果。

此外,訓練這樣的條件 GAN 需要仔細收集具有固定制造參數的微觀結構資料。這非常重要,資料中的任何問題都會反映在 GAN 的輸出中。儘管 GAN 是非常有潛力的方法,但仍然需要探索用於高通量、資料驅動的製造參數最佳化的其他方法。

資料融合

除了最佳化之外,前文描述的 ML 方法的靈活運用,可以形成一種通過資料融合獲取多模態資料集的新方法。作為示例工作流程,從高解析度 SEM 圖像開始,分割可以首先用於生成相圖。然後可以應用維度擴展來生成大的 3D 體積。使用它作為基礎體積,風格轉移和超解析度方法可用於將來自其他表徵技術的特徵投射到每個階段。因此,結果資料集中的單個元素可能包含多種屬性,包括化學、晶體學、電子、機械等等。

將多模式資料集融合到電池電極的統一表示中是一個非常有價值的應用前景,特別是用於表徵和建模目的。這類方法可以輕鬆應對前文所述的各類挑戰;同時,也可利用人工智慧技術來改變電池材料設計和最佳化的歷史正規化。

端到端

神經網路不依賴於人類可讀或人類可解釋的資料集。如果將成像資料與其他資料流相結合,則可以構建更抽象的模型;這些模型使用電池從製造到報廢過程中的端到端資料,可繞過模型中的假設和簡化以及輸出人類可讀結果所帶來的約束。這種深度設計方法將完全由資料驅動,可以幫助科學家發現新的對應關係並提出新問題。為了實現這一目標,需要為相關變數和資料的收集、組織、處理,進行大量思考和規劃。

圖:使用機器學習技術進行資料融合的想象中的未來工作流程。(來源:論文)

展望

鋰離子電池的性能取決於多個長度尺度的大量組成元素的材料特性。這使得在鋰離子電池材料的結構和功能之間建立定量聯繫的任務極具挑戰性,需要多模態和多尺度資料集。想要在沒有任何假設的情況下,對特定材料特性與電池性能的對應關係進行建模和量化,需要對所有影響材料特性的參數進行完整詳細的空間描述,由於各種表徵技術的系統限制,目前無法實現。

人工智慧增強的表徵可以彌合系統限制,同時可收集眾多影響性能的材料特性資訊。基於 CNN 的方法尤其可以生成比其他實驗可實現的更高解析度和更高維度的資料集。此外,來自所有表徵技術的資料可用於生成電極微結構的統一代表性體積模型。這些統一的體積模型與電化學資料相結合,可以實現詳細的多物理模擬和高通量最佳化。同樣,這些方法也廣泛適用於能源材料研究的其他領域。這些方法為材料表徵提供了一種新的範例,而收集高質量的資料將對其成功至關重要。

論文連結:https://pubs.acs.org/doi/full/10.1021/acsenergylett.2c01996