90 後學霸博士 8 年進擊戰:用機器學習為化學研究疊 BUFF

內容一覽:ScienceAI 作為近兩年的技術熱點,引起了業界廣泛關注和討論。本文將圍繞 ScienceAdvances 的一篇論文,介紹如何利用機器學習,對燃煤電廠的胺排放量進行預測。

關鍵詞:AI for Science 化學工程 胺排放

國際能源署公佈的報告顯示,2021 年全球能源相關的CO2排放量較 2020 年增長 6%,達到 363 億噸,創歷史新高。

其中 CO2排放量增幅最大的是發電和供熱行業,增幅超過 9 億噸,佔全球 CO2排放量增幅的 46%。控制並減少發電及供熱行業 CO2排放量刻不容緩。

2021 年各行業 CO

2021 年各行業 CO2排放量的年度變化

藍色表示年度變化,紅點表示淨變化

查看 2021 全球 CO2排放完整報告:

https://www.iea.org/reports/global-energy-review-co2-emissions-in-2021-2

碳捕捉:減少溫室氣體排放、實現變廢為寶

在《中國電力行業碳達峰、碳中和的發展路徑研究》中,行業專家給出了降低電力行業 CO2排放量的三種改變措施:

1、大力發展風電、水電、核電等低碳電源,拋棄煤電、油電等高碳電源

2、對於燃煤電廠,用天然氣、秸稈、生物質等低碳燃料,代替煤炭進行發電

3、利用碳捕捉技術,對燃煤電廠排放的 CO2進行捕捉利用

其中,碳捕捉因為改造幅度小、想象空間大、具備變廢為寶的能力,備受商業公司、能源公司以及電力行業科研院所的關注。

電廠中的碳捕捉設備

電廠中的碳捕捉設備

碳捕捉是指利用 CO2和胺類物質發生反應,捕捉電廠釋放到大氣中的 CO2並進行壓縮,封存至枯竭的油田、天然氣領域,或其他安全的地下場所,供後續石油開採、冶煉、汽車等產業利用。

然而,CO2在與胺類物質發生反應的過程中,也會產生危害公共健康和生態系統的胺排放,有效監控並預測不同電廠的胺排放,成為碳捕捉的一大難點。

近日,由洛桑聯邦理工學院和赫瑞瓦特大學組成的研究小組,開發出了一種機器學習方法,可依據電廠過往資料,更準確地預測碳捕捉過程中胺類有害氣體的排放量。目前該論文已發表在 ScienceAdvances 上。

完整論文請訪問

完整論文請訪問:

https://www.science.org/doi/10.1126/sciadv.adc9576#sec-2

論文詳解:用機器學習技術解決化學問題

1、先導工場試驗

碳捕捉工場非常複雜,因為過程模型 (process model) 通常側重於捕捉 steady-state 運行。然而,當前和未來發電廠的設計和運行,需要考慮到可再生能源發電份額的增加,這種增加是間歇性的、不規律的,因此還需要考慮到 steady-state 之外運行的動態和多變數行為。

為了模擬未來電廠運行的間歇性,科研人員對德國 Niederaußem 發電廠先導工場 (pilot plant) 的捕獲裝置,進行了一系列壓力測試,試圖發現電廠間歇性運行與胺排放量的關係。

Niederaußem 燃燒後碳捕捉先導工場的簡化流程示意圖

實驗雖然積累了大量捕捉工場行為的資料,但無法利用這些資料定性預測未來的胺排放,因為除壓力測試外,實驗過程中還存在另一變數–電廠專業人員的干預,以確保實驗期間工場的安全運行。

2、獲取資料集

先導工場實驗中,科研人員每 5 分鐘進行一次資料採集,積累了龐大的資料量,如何把這些資料轉化成可供機器學習模型使用的資料集,成為研究重點。

科研人員的方法是把 time-dependent 過程及排放資料,表示成圖像(資料矩陣),基於此創建預測模型,然後藉助機器學習技術進行模式識別,預測胺排放。

在這種表示法中,工場在給定時間 t 定義了一個 state 特徵向量 x(t),其中 p 元素表示過程變數(如煙氣溫度和水洗溫度)。

取 t 個時間戳的工場 state 向量,得到一個 t × p 的矩陣。這個矩陣可以被看作是一個「圖像」,與未來的排放曲線 y(t) 相連。

資料表示示意圖

資料表示示意圖

本實驗中用到的資料可以看作一張「圖像」,其中:

寬度=輸入序列 (T) 的長度

高度=參數數量 p

顏色=參數 xj 在某個時間 ti 的值

接下來,將工場歷史圖像中的 pattern,與特定的未來排放進行聯繫。為此,科研人員採用了梯度增強的決策樹模型,將描述不同參數和排放量的行 (row) 合併為一個長向量。用分位數損失 (quantile loss) 訓練模型,以獲得不確定性評估 (uncertainty estimate)。

評估不確定性時,科研人員採用了支持蒙特卡洛 dropout 的時間卷積神經網路 (temporal convolutional neural network) ,並在 note S8 中展示用這個模型獲得的結果。

有了這個資料集,就可以藉助資料科學方法,開發一個機器學習模型進行資料分析。

3、從機器學習中洞悉胺排放

接下來,就可以用機器學習模型進行以下預測:

1、未來排放量(實時):基於歷史 & 當前的運行和排放,預測未來 x 小時的排放量是多少

2、資料的 Causal impact 分析:測量特定壓力測試對胺排放的影響,需要一個 baseline,提供在沒有壓力測試情況下的胺排放

3、減少胺排放:用模型預測「假設」情況下的排放量,如降低水洗溫度是否會對排放量產生影響

利用機器學習模型預測

利用機器學習模型預測

未來 2 分鐘、1 小時、2 小時的胺排放量

90 後學霸博士,深耕化學 8 年

本篇論文由洛桑聯邦理工學院基礎科學學院的 Berend Smit 教授和蘇格蘭赫瑞瓦特大學碳解決方案研究中心教授 Susana Garcia 共同領導的科研小組發佈。

其中,開發機器學習方法,將胺排放問題轉化為模式識別問題的學生,正是 Smit 教授小組的 90 後博士生 Kevin Maik Jablonka。

該論文的一作 Kevin Maik Jablonka

Kevin 本科就讀於德國慕尼黑工業大學化學專業,2017 年本科畢業後,Kevin 進入瑞士洛桑聯邦理工學院繼續碩士和博士學習,在化學領域繼續深造。

從 2014 年至 2022 年,Kevin 用了 8 年時間建立了對化學及化學工程的深刻理解,期間還通過對應用資料科學、機器學習的學習,將化學研究與人工智慧進行融合,提升了化學工程領域研究的效率和準確度,是一位妥妥的 90 後學霸。

誠如多位化學領域的資深人士所說,機器學習在化學及過程工程 (process engineering) 領域,可能產生比計算機視覺領域更大的影響。

在 CV 應用場景中,模型學習的圖像基本特徵,往往與人類大腦感知圖像的方式密切相關,如目標檢測、臉部辨識。

然而在工業場景中,人類往往缺乏對基本機制的了解,但通過機器學習,科研人員發現了從參數到目標觀察物對映的基本規則,並對迄今無法預測的現象進行了預測。

在預測電廠胺排放這一案例中,機器學習超越傳統方法,被認為是提供了一種觀察複雜化學過程的全新視角,極有可能徹底改變未來燃煤電廠的運行方式。

人工智慧將更多地應用於基礎科學研究,為其提供動力、提升效率、加速科研成果落地。你如何看待 AI for Science 下半場的發展?它將帶來哪些突破,又會面臨怎樣的挑戰?歡迎留言分享你的觀點和看法~

相關文章

靴子落地:ChatGPT 國內發展或被「拉手剎」

靴子落地:ChatGPT 國內發展或被「拉手剎」

內容一覽:深度合成服務在滿足使用者需求、改進使用者體驗的同時,也被一些不法人員用於製作、複製、發佈、傳播違法資訊,詆譭、貶損他人名譽、榮譽,...

使用 TVMC 編譯和最佳化模型

使用 TVMC 編譯和最佳化模型

內容一覽:本節講解使用 TVMC 編譯和最佳化模型。TVMC 是 TVM 的命令驅動程序,通過命令列執行 TVM 功能。本節是了解 TVM ...