如何用隨機森林演算法,在深海養肥一群魚

內容一覽:分析並識別魚類行為,對於養殖業具有重要意義,福林德斯大學博士生 Thomas Clarke 研發了一個機器學習模型,可以藉助隨機森林演算法識別魚類動作。

關鍵詞:隨機森林演算法 機器視覺

愛吃生魚片的朋友們對黃尾鰤魚 (Yellowtail Kingfish) 肯定有所耳聞。在餐館裡,黃尾鰤魚也常被寫作黃師魚、黃條鰤。

這種大型深海魚肉質綿密、富含 Omega-3 且沒有腥味,口感一流,被視為刺身極品。野生黃尾鰤魚由於捕撈、釣期較短,捕撈困難等因素,價格也一直高居不下。

如何養肥、養好海洋生物

黃尾鰤魚生長速度較快,但是野生種群數量不多,所以很難形成商業化捕撈。隨著海洋養殖技術的發展,也可通過養殖黃尾鰤魚,供應日益增長的消費需求。

對於海洋養殖業,如何全面掌握黃尾鰤魚的生活習性及產卵繁殖特點,有針對地保護成熟期的黃尾鰤魚,成為提高養殖生產效率和盈利水平的關鍵。

黃尾鰤魚最大可長到 60kg

黃尾鰤魚最大可長到 60kg

它們智力超群,海釣、捕撈難度很高

黃尾鰤魚是一種隨季節和溫度變化做週期性洄游的魚類,主要分佈在我國各大沿海、日本、朝鮮半島和澳大利亞周邊遠離岸邊的外海岩礁區水域。

過去十年中,得益於觀測設備的發展,生物追蹤領域有了顯著發展,對物種的遠端監測也獲得了諸多突破,越來越多針對海洋生物行為的觀測和資料收集,開始大規模採用三軸加速器。

科研人員通過給黑鰭鯊魚鰭配備最新加速器

科研人員通過給黑鰭鯊魚鰭配備最新加速器

監測黑鰭鯊運動行為

三軸加速器通過測量三個軸的加速度,可以產生描述生物運動、活動的時間序列,進而根據環境中加速度的特徵,推演出動物行為。

此外加速器資料可以與時空資料(深度、地理位置、季節等)結合分析,以確定產卵、進食等生態學上的重要行為。

三軸加速器收集的資料量巨大,甚至多達數百萬行(包括加速度、身體位置等),因此需要藉助半自動分析系統,來對生物行為進行分類。

黃尾鰤魚的移動行為也很複雜,平均時速在三四十公里,瞬間加速追捕獵物甚至能超過時速 100 公里。這類突然的高振福「爆發」行為,使得自動化分析技術的發展受到阻礙。

複雜生物資料,機器學習派上用場

面對包含運動速度、時間、深度、地理位置等多維度、數量龐雜的時空資料,機器學習成為科研人員的首選。

福林德斯大學科學與工程學院的博士生 Thomas Clarke,基於 6 條養殖黃尾鰤魚在產卵期 624 個小時的加速器資料,訓練了一個隨機森林機器學習演算法,確定了黃尾鰤魚五種不同的行為(游泳、進食、受傷、逃跑和求偶) 。

Thomas Clarke 與同實驗室的研究員合影

右一為 Thomas Clarke

這是第一個用機器學習技術,識別野生黃尾鰤魚產卵行為的研究,對利用 AI 更好地理解深海魚類的生殖模式,具有重要意義。

Thomas Clarke 和同事在這項研究中,通過描述和量化養殖黃尾鰤魚的行為,在基準真相加速器資料的基礎上,研發了一個有監督機器學習演算法(RF 模型)。

隨後這一模型被用於分析野生黃尾鰤魚資料,進而預測自然發生的產卵行為。

養殖野生兩頭抓,試驗方法詳解

1、養殖黃尾鰤魚試驗

將性成熟的黃尾鰤魚(於南澳捕獲的野生黃尾鰤魚)在大型容器中放養,持續觀察其產卵行為。

2018 年 8 月至 2019 年 2 月期間,分別進行兩次追蹤任務,每次追蹤 1 條雌魚、2 條雄魚。用三軸加速器資料記錄儀,記錄 6 條養殖黃尾鰤魚的行為資料。

6 條養殖黃尾鰤魚的相關描述

把容器中的黃尾鰤魚取出放入含有 AQUI-S (10ppm) 的設備中標記。把記錄儀固定在 黃尾鰤魚背部,為了區別不同個體,加速器的按鈕、夜間模式等都做了區分。標記完成 3 小時後,開始記錄黃尾鰤魚行為資料。

2、野生黃尾鰤魚試驗

2015 年 10 月至 2019 年 11 月期間,科研人員捕獲並標記了 8 條與養殖黃尾鰤魚體型相近的野生黃尾鰤魚,並用加速器記錄了 2-3 天的資料。

野生黃尾鰤魚按照養殖黃尾鰤魚相同的規格,固定加速器,區別是野生黃尾鰤魚的加速器是可自行分離的可恢復安裝包,包括一個加速器、電波發送器 (radio transmitter)、以及智慧定位和溫度傳輸標籤,2-3 天后可自行脫落。

野生黃尾鰤魚的記錄儀可保持 2-3 天

野生黃尾鰤魚的記錄儀可保持 2-3 天

3、資料分析

加速器資料可通過 IGOR Pro 進行下載,並用 Ethographer 軟體進行視覺化分析。

首先刪除由於光線不足或攝像機沒捕捉到目標的無效資料。

計算 3 個加速軸上的靜態加速度和動態加速度,過濾掉由尾部拍打和身體姿態引起的主導信號,並隔離高振幅加速度的行為。

觀察時間序列加速度資料,可以確定黃尾鰤魚潛在的爆發行為。從視訊中可以觀察到黃尾鰤魚的五個行為類別:進食、游泳、逃跑、求偶或受傷。

4、機器學習分類演算法開發

基於隨機森林分類法進行預測。用所有預測變數的值組成單一資料集,然後隨機分成兩部分:70% 用於模型訓練,30% 作為驗證集評估模型性能。

ntree 值從 500 開始,逐漸增加到 2000。此外,還測試了每個 mtry 隨機抽樣的變數數量,用於評估對模型錯誤率的影響。

在模型構建過程中,作者使用了 64 個預測變數,進一步保證了模型的準確性。

5、模型性能評估

分類模型的性能指標,由 RF 混淆矩陣計算得出。混淆矩陣確定了 true positive (TP)、false positive (FP) 以及 false negative (FN),並且還提供了黃尾鰤魚所有行為類別的實際觀察值,與模型預測值的對比表。

6、預測野生黃尾鰤魚的行為

用 RF 演算法預測 8 條野生黃尾鰤魚的行為資料,發現模型總體準確率達到 94% 。

用 RF 模型預測野生黃尾鰤魚產卵事件 (n=16,粉標記)

和繁殖行為 (n=1,橙色箭頭)

游泳和進食的識別準確率最高,超過 84%,其次是求偶,逃跑和受傷的分類準確度得分較低。

測試集上用 RF 演算法計算出的養殖黃尾鰤魚行為類別性能指標

灰色方框代表測試集中分類正確的數量

理解海洋,任重道遠

海洋,是地球的資源寶庫。

海洋生物除了具有經濟價值外,也是海域生態平衡的關鍵。研究海洋,可以幫助我們更了解海洋生物、能源等資源,也是合理開發和保護海洋資源的重要課題。

參考

參考:

https://phys.org/news/2021-06-artificial-intelligence-fishy-behavior.html

https://movementecologyjournal.biomedcentral.com/articles/10.1186/s40462-021-00248-8

相關文章

AI 加碼,超光學進入狂飆時代

AI 加碼,超光學進入狂飆時代

內容一覽:近年來,為了突破傳統光學研究的侷限性,光學與物理學交叉領域的一個新興技術超光學出現,並且展現出巨大的市場前景。在這門技術高速發展的...