2025年10月3日金曜日

データの精度と使いやすさの向上

A Comprehensive Database of Expert-Curated Occurrences for the Genus Carex L. (Cyperaceae)

https://doi.org/10.1111/geb.70123

María Sanz-Arnal1,2 | Pablo García-Moro1 | Carmen Benítez-Benítez3 | Marina Coca-de-la-Iglesia4 |
Angélica Gallego-Narbón4,5 | Consolación Barciela1 | Fabrizio Bartolucci6 | Prabin Bhandari7,8,9 | Matthew Bradley10 |Asunción Cano11 | Antoine Derouaux12 | Sabina Donadío13 | Marcial Escudero3 | Mariela Fabbroni14 |Kerry A. Ford15 | Gabriele Galasso16 | Sebastian Gebauer17,18,19 | M. Socorro González-Elizondo20 |David Hamon21 | Matthias H. Hoffmann22 | Xiao-Feng Jin23 | Jacob Koopman24 | Bangze Li7,8,9 |Raúl Lois1,25 | Yi-Fei Lu21,26 | Modesto Luceño1 | José Ignacio Márquez-Corro1 | Santiago Martín-Bravo1 |Attila Mesterházy27 | Mónica Míguez1 | Ana Morales-Alonso1,2 | A. Muthama Muasya28 |Paulo Muñoz-Schüler1,29 | Robert F. C. Naczi30 | Nora Oleas31 | Luciana Pereira-Silva32 | Radomír Řepka33 |Anton A. Reznicek34 | Katie K. Sanbonmatsu7 | Enmily Sánchez31 | Daniel Spalink7 | Arne Strid35 |Pieter Vanormelingen36 | Filip Verloove37 | Karen L. Wilson38 | Okihito Yano39 | Shuren Zhang8,9 |Pedro Jiménez-Mejías1

Global Ecology and Biogeography (2025).

データの品質
種の分布、生態、そして保全や管理に関する科学的な結論そのものを直接的に変えてしまう

>>ゴミからはゴミしか生まれない

→専門家による地道なデータ検証・修正作業が必要
 (キュレーション)データの大掃除

問題
1.学名の不一致
2.不正確な採集記録
3.サンプリングの空白域(特に東南アジア)

具体的な作業
1.データ収集(オンライン、標本データ)
2.データ選択(1950年以前の記録は自動削除) 
3.データ検証(Rの利用~目視)

本研究で用いたアルゴリズム
1.GAM(一般化加法モデル)
2.GBM(一般化ブースト回帰モデル)
3.GLM(一般化線形モデル)
4. RF(ランダムフォレスト)
5.SDM(種分布モデル)