Original Article

Ecology and Resilient Infrastructure. 31 December 2024. 165-176
https://doi.org/10.17820/eri.2024.11.4.165

ABSTRACT


MAIN

  • 1. 서 론

  •   1.1 연구배경

  •   1.2 연구목적

  •   1.3 전통적인 생태계 모니터링 방법의 한계

  •   1.4 오픈 소스 소프트웨어 기반의 생태계 모니터링

  • 2. 연구 방법

  •   2.1 통합 프레임워크 설계 개요

  •   2.2 표본 설계 및 데이터베이스 구축

  •   2.3 QGIS 프로젝트 생성

  •   2.4 QField로 현장 데이터 수집

  •   2.5 실시간 분석 및 시각화

  •   2.6 사례 연구: 생태계교란 식물 분포 조사

  • 3. 결 과

  •   3.1 사례 연구 1: 서울대학교 관악캠퍼스 생태계교란 식물 분포 조사

  •   3.2 사례 연구 2: 한강·남한강변 가시박 분포 조사

  • 4. 고 찰

  •   4.1 데이터 정확성 및 효율성

  •   4.2 기존 방식과의 비교

  •   4.3 한계점

  • 5. 결 론

1. 서 론

1.1 연구배경

생태계 모니터링은 종의 분포, 개체수, 서식 환경 등을 조사하여 장기적인 생태계 변화를 감시하고 관리하는 데 필수적인 역할을 한다. 그러나 전통적인 생태계 모니터링 방법은 종이 기록을 기반으로 하여 수작업으로 데이터를 취합하고 분석하는데, 이러한 과정에서 다수의 오류가 발생하고 이를 디지털화 하는데 비용이 많이 드는 문제가 있다(Campbell et al. 2005, Vollmar et al. 2010, Morrison 2021). 특히, GPS 장비를 활용한 데이터 수집이 이루어지더라도 고가의 상용 소프트웨어와 장비가 필요하기 때문에 광범위하게 적용하기 어렵고, 조사된 데이터는 기관별로 분리되어 데이터의 상호운용성이 떨어지는 문제가 발생한다.

특히 생태계 모니터링은 각 수행 기관/모니터링 목적/조사 분류군에 따라 독립적이고 독자적인 방법을 사용하고 있다. 예를 들어 국립생태원의 자연환경조사 내에서도 식물상 조사는 미리 설정한 조사경로를 따라 선조사를 수행해 종목록을 작성하지만 식생 조사는 방형구를 설치하여 식생조사표를 작성하는 차이가 있다(National Institute of Ecology 2024a). 그 외에도 각 분류군별로 조사방법이 상이한 까닭에 공개되는 데이터는 방형구 정보 없이 단순 종목록 및 좌표정보로 한정되고 있다(National Institute of Ecology 2024b). 국립수목원의 경우 식물 분포 지역 정보를 제공하고 있으나 좌표가 없어 분석에 한계가 있고 컬럼명이 분포식물학명과 분포식물국명으로 국립생태원이 사용하는 학명과 한글보통명과 상이하다(Korea National Aboretum 2024). 국립산림과학원의 한국 산림의 식물사회학적 분류에 사용된 식생조사표 자료의 경우, 조사표를 스캔한 이미지파일만을 제공하고 있다(National Institute of Forest Science 2021). 국립공원 관리공단의 국립공원 생물자원 현황 데이터는 컬럼명으로 학명 대신 종명, 종소명 대신 학명이 입력되어 있고 한글보통명은 분류명으로 기입되어 있다. 또한 여러 날짜에 걸쳐 동일 좌표로 기록되어 있으나 현장조사 결과인지 무인카메라 결과인지 별도 구분되어 있지 않는다(Korea National Park Service 2024). 그 외 다수의 데이터에서 한글 인코딩 방식으로 여전히 UTF-8 대신 EUC-KR이나 CP949를 사용하고 있는 문제가 있다.

이로 인해 발생하는 데이터의 상호운용성과 재현성의 문제는 연구의 통합성과 연속성을 떨어뜨리고 데이터의 재사용성을 떨어뜨려 중복된 비용을 발생시키게 된다. 따라서, 생태계 모니터링 시 수집하는 데이터는 데이터의 FAIR 원칙 - 검색성(Findability), 접근성(Accessibility), 상호운용성(Interoperability), 재사용성(Reusability) - 을기반으로 설계되어야 한다(Wilkinson et al. 2016, Kim 2021). FAIR 원칙에 기반해 디지털 아카이브에 데이터를 저장하면 기계가 데이터와 메타데이터를 읽고 검색을 가능하게 하고 표준화되고 개방된 프로토콜로 접근이 가능하며, 합의된 표준 어휘를 사용하여 기술되어 여러 시스템에서 상호운용이 가능하고, 이들을 바탕으로 궁극적으로는 데이터의 재사용이 가능해야 한다(Wilkinson et al. 2016, Kim 2021).

필드 데이터를 수집할 때, 데이터모델에 기반한 관계형데이터베이스를 구축하고 이를 이용해 입력하여 입력단계에서부터 FAIR 원칙을 최대한 따르도록 구성할 수 있다. 관계형데이터베이스는 표준화된 프로토콜인 구조화된 질의(SQL)를 통해 필요한 데이터에 접근하고 검색할 수 있다. 또한 여러 시스템에서 상호운용 가능한 표준화된 데이터 형식을 사용한다. 사용한 데이터 스키마 구조와 각 테이블에 입력하는 객체 정보와 객체의 속성 정보에 대해 상세한 문서를 작성하면 재사용성을 높일 수 있다(National Information Society Agency 2018). 무엇보다 데이터를 분석하는데 가장 표준화된 tidy 데이터 형태로 데이터를 저장하기 때문에 분석을 위해 데이터 구조를 변경해야 하는 노력을 최소화할 수 있다(Wickham 2014).

1.2 연구목적

본 연구는 이러한 문제를 해결하기 위해 자유 오픈 소스 소프트웨어(Free and Open-Source Software, FOSS)를 기반으로 생태계 모니터링의 전 과정(데이터 수집, 저장, 분석)을 하나로 통합하는 프레임워크를 제안한다. FOSS는 일반적으로 라이선스 비용이 없어 도입 및 유지 비용을 절감할 수 있고, 소스 코드가 공개되어 있어 자유롭게 수정 및 배포할 수 있으며, 보안이나 성능 문제를 직접 확인하고 개선할 수 있다(Raymond 2001, Weber 2004). 이를 통해 생태계 모니터링 데이터를 신속하고 정확하게 수집, 저장, 분석함으로써 연구자, 이해관계자가 실시간으로 데이터에 접근하고 이를 활용할 수 있는 환경을 제공하고자 한다. 또한, 본 연구에서는 실제 현장 적용을 통해 제안된 프레임워크의 성능과 효용성을 평가한다.

1.3 전통적인 생태계 모니터링 방법의 한계

기존의 생태계 모니터링은 보통 2인 1조로 현장에서 생물종과 환경 정보를 기록하고, 이를 종이 야장에 작성한 후 전산 시스템에 입력하여 분석하는 방식으로 이루어져 왔다. 이러한 방식은 다음과 같은 문제점들을 가지고 있다: 먼저 공간 정보 취득의 어려움이 있다. 수작업으로 기록하는 방식에서는 공간 정보(좌표 데이터 등)의 정확성이 떨어지며, 종이 야장을 스캔하여 디지털화 하는 과정에서 위치 정보가 왜곡될 수 있다(Campbell et al. 2005). 두 번째로 데이터 입력 오류가 있다. 수작업으로 데이터를 전산화하는 과정에서 데이터 누락, 잘못된 입력 등의 오류가 발생할 가능성이 높다(Morrison 2021). 세 번째로 데이터 통합 및 분석의 비효율성이 있다. 현장에서 수집된 데이터가 전산화되어 분석에 활용되기까지 오랜 시간과 비용이 소요되며(Vollmar et al. 2010), 기관별로 데이터가 상호 운용되지 않아 중복된 조사가 발생할 수 있다.

종이 야장이 여러 문제점에도 불구하고 현장에서 여전히 널리 사용되고 있는 이유에 대해서는 현재까지 구체적으로 조사된 사례가 없는 상황이다. 그러나 현장 경험을 바탕으로 다음과 같은 점들이 주요 요인으로 작용할 가능성이 있다. 첫째, 전기와 통신이 제한된 환경에서도 사용이 가능하다는 점, 둘째, 기술적 문제 발생 가능성이 없다는 점, 셋째, 작성 방법이 직관적이고 그림과 글자 등 다양한 형식의 기록이 가능하다는 점, 넷째, 비용이 저렴하며 별도의 추가 기기가 필요하지 않다는 점 등이 종이 야장의 지속적 사용을 뒷받침하는 주요 요인으로 추정된다.

다음으로 데이터의 보관과 관리의 측면에서 기관별로 데이터가 분산적으로 저장되거나 중앙화된 저장소 없이 관리될 경우, 데이터 유실의 가능성이 높아지는 문제가 있다. 이를 방지하고 데이터를 효율적으로 공유하기 위해 중앙화된 데이터 공유 플랫폼의 필요성이 대두된다. 현재 공공데이터포털, 환경 빅데이터 플랫폼 등의 여러 아카이빙 플랫폼이 존재하지만, 가장 큰 문제는 데이터가 데이터 모델에 근거하여 분석에 적합한 형태로 정리되어 있는가, 그리고 데이터 객체와 속성에 대한 정보를 포함하는 메타데이터가 잘 기술되어 있는가에 있다. 공공기관에서 발행하는 데이터의 경우 공공데이터 공통표준용어를 따르는 방식으로 해결할 수 있다(National Information Society Agency 2018). 학문적 맥락에서는 각 학회별로 표준화된 용어집을 활용하고, Zenodo, Figshare, Dryad와 같은 중앙화된 오픈 소스 아카이브를 적극적으로 활용하여 데이터를 영구적으로 보존하고 공유할 수 있는 체계를 구축할 필요가 있다.

1.4 오픈 소스 소프트웨어 기반의 생태계 모니터링

최근에는 상용 소프트웨어 대신 자유 오픈 소스 소프트웨어를 활용하여 생태계 모니터링을 디지털화 하려는 시도가 증가하고 있다. 특히 오픈 소스 데스크톱 지리 정보 시스템(Geographical Information System, GIS) 소프트웨어인 QGIS와 이에 대응되는 모바일 GIS 애플리케이션 QField를 이용하여 현장조사에 적용하는 여러 연구들이 있는데, 예를 들어 해안 해양쓰레기의 분포 조사(Schattschneider et al. 2020), 기후변화와 환경파괴에 의해 경관 서비스의 위협을 받는 피지와 통가에서의 사람-기후-환경 상호작용을 모니터링하기 위한 플랫폼 구축(Davies et al. 2019), 통가에서 바닐라 플랜테이션 등의 농장 지도 작성 연구(Duncan et al. 2022), 바덴해에서의 번식 조류 지도 작성 연구(Gnep 2019) 등이 있다.

QGIS와 같은 오픈 소스 GIS 프로그램을 통해 현장에서 수집한 데이터를 효율적으로 처리할 수 있으며, PostgreSQL과 같은 데이터베이스 관리 시스템을 통해 데이터를 구조적으로 저장하고 분석할 수 있다(QGIS Development Team 2024). 이러한 오픈 소스 기반의 시스템은 비용을 크게 절감할 수 있을 뿐만 아니라, 연구자가 필요한 데이터를 기록하는 폼을 구축하기 용이하다. 또한, 오픈 포맷의 데이터 파일을 사용하므로 데이터의 상호운용성을 높일 수 있는 장점이 있다.

2. 연구 방법

2.1 통합 프레임워크 설계 개요

본 연구에서 제안하는 생태계 모니터링 통합 프레임워크는 FOSS를 기반으로 하여 QGIS, QField, PostgreSQL/PostGIS, 그리고 R Shiny로 구성된다. 먼저, QGIS 프로그램은 오픈 소스 GIS 프로그램으로, 현장에서 수집할 데이터의 표본 설계를 바탕으로 데이터 입력 폼을 생성하고 지리 정보 프로젝트 파일을 생성하는 데 사용된다(QGIS Development Team 2024). 두 번째로 QField는 QGIS와 연동되는 모바일 GIS 수집기로, 현장에서 모바일 장치를 통해 공간 데이터를 실시간으로 수집할 수 있다(OPENGIS.ch 2024a). 다음으로 PostgreSQL/PostGIS가 있다. PostgreSQL은 관계형 데이터베이스 관리 시스템으로 PostGIS 확장 프로그램을 설치하면 공간 데이터를 처리할 수 있다(PostgreSQL Global Development Group 2024, PostGIS Project Steering Committee 2024). 현장에서 수집된 데이터는 PostgreSQL에 실시간으로 저장된다. 마지막으로 분석을 위해 사용하는 R Shiny가 있다. R Shiny는 R 기반의 웹 애플리케이션 프레임워크로, 수집된 데이터를 실시간으로 분석하고 시각화하는데 사용된다(Chang et al. 2024). 이들 프로그램을 이용하여 크게 표본 설계 및 데이터베이스 구축, QGIS 프로젝트 생성, QField로 현장 데이터 수집, R Shiny로 실시간 분석 및 시각화의 네 단계의 프레임워크로 구성하였다(Fig. 1).

https://cdn.apub.kr/journalsite/sites/kseie/2024-011-04/N0190110405/images/kseie_2024_114_165_F1.jpg
Fig. 1.

Workflow of the unified framework.

2.2 표본 설계 및 데이터베이스 구축

우선 조사 대상지에 대해 조사 목적에 맞는 모니터링 조사계획을 수립한다. 조사 목적에 따라 조사 계획은 크게 달라지기 때문에 일반화하기 어려운 점이 있으나, Magurran and McGill (2011)이 서술한 조사 계획 수립 시 고려할 점들을 바탕으로 전국자연환경조사 지침서(National Institute of Ecology 2024a)와 같은 일반적인 조사 방법을 참고할 수 있다. 이를 바탕으로 PostgreSQL/PostGIS 데이터베이스를 설계한다(Fig. 1a). 공간 정보와 생태계 데이터를 저장할 수 있도록 테이블 구조를 정의하며, 관계형 데이터베이스의 제약조건을 통해 데이터의 무결성을 보장한다. 별도의 서버 구축이 필요한 PostgreSQL 대신 오프라인 기반의 데이터베이스 파일인 GeoPackage를 사용해 데이터를 저장하는 경우에는 QFieldCloud를 통해 GeoPackage 파일을 스마트폰 QField와 동기화할 수 있다. 일반적인 생태계 모니터링을 위한 데이터베이스 설계 구조와 관련 정보는 Supporting information 1에 서술하였다(https://doi.org/10.6084/m9.figshare.27914217).

2.3 QGIS 프로젝트 생성

조사 대상지에 대한 표본 설계가 완료되면, QGIS를 이용해 현장에서 사용할 GIS 프로젝트 파일을 생성한다(Fig. 1b). 프로젝트에는 PostgreSQL/PostGIS 데이터베이스에 생성한 각 테이블을 레이어로 추가하고 QGIS 내에서 테이블 간의 참조관계를 인식시킨다. 다음으로 현장에서 QField를 통해 데이터를 입력할 때 사용할 입력 폼을 생성한다. 입력 폼은 모니터링 조사 계획에 따라 현장에서 측정할 변수들을 모두 포함해야 하며, 각 입력 값에 데이터베이스에서 설정한 제한 조건과 별개로 추가 제한을 설정할 수 있다. 전체 레이어 중 일부 레이어 집합에 대한 표시 여부와 각 레이어의 객체 스타일 정보를 묶어 맵 테마로 저장할 수 있다. 조사의 필요에 따라 여러 개의 맵 테마를 저장해두면 현장에서 빠르게 맵 테마를 전환할 수 있다. QGIS 프로젝트 생성과 관련된 구체적인 정보는 Supporting information 2에 서술하였다(https://doi.org/10.6084/m9.figshare.27914217).

2.4 QField로 현장 데이터 수집

생성한 QGIS 파일은 QField Sync 플러그인을 통해 스마트폰의 QField 애플리케이션으로 불러올 수 있다(Fig. 1c). 현장에서 조사원은 QGIS에서 생성한 입력 폼을 QField를 통해 확인할 수 있고, 이를 이용해 공간 정보를 포함한 여러 종류의 데이터를 입력할 수 있다(Fig. 2).

https://cdn.apub.kr/journalsite/sites/kseie/2024-011-04/N0190110405/images/kseie_2024_114_165_F2.jpg
Fig. 2.

Data collection by QField.

공간 정보의 경우에는 스마트폰 자체의 GNSS 측위를 이용하여 입력할 수 있다. 수 센티미터 단위의 정밀도가 요구되는 경우에는 스마트폰에 네트워크 실시간 이동 측위 위성항법시스템(Real-time Kinematic Global Navigation Satellite System, RTK GNSS) 수신기를 연결하여 보정된 측위 정보를 입력할 수 있다. RTK GNSS 수신기에 대해 공개되어 있는 가격을 기준으로 시장조사를 한 결과, Trimble, Leica, Topcon와 같은 제조사 브랜드는 가격대가 약 15000-25,000 USD였다. 이와 같이 비용의 문제로 인하여 대부분의 연구자에게는 사용이 어려웠다(Koo et al. 2017). 이를 극복하기 위해 측위 정확도와 정밀도가 높은 저가 RTK GNSS 수신기를 연구 분야에서 활용하려는 시도가 있었다(Koo et al. 2017, Valente et al. 2020, Stopar et al. 2024). 최근에는 Carlson, Spectra Precision, Pentax Surveying 등의 제조사 브랜드에서 약 2,000-10,000 USD의 중저가 모델을 판매하고 있으며, ComNav Technology, CHCNAV, FOIF, Emlid 등의 경우에는 2,000 USD 이하의 스마트안테나도 판매하고 있어 RTK GNSS에 대한 접근성이 개선되었다. 본 연구에서는 Navspark의 RTK GNSS 수신기인 PX1122R-RTK-EVB를 사용하여 측위를 수행하였다.

PostgreSQL 데이터베이스를 사용하는 경우, QField를 통해 입력한 데이터는 실시간으로 PostgreSQL 데이터베이스에 저장된다. 만약 현장에서 네트워크 연결이 불가능한 경우에는 QFieldCloud를 이용하여 QField에 데이터를 저장해두고 네트워크가 연결되었을 때 데이터베이스 서버에 데이터를 동기화할 수 있다. GeoPackage 파일을 사용해 데이터베이스를 구축한 경우에는 네트워크가 연결되었을 때 QFieldCloud에 저장된 GeoPackage 파일과 동기화한다. QField를 이용한 조사데이터 입력 방법에 대해서는 Supporting information 3에 서술하였다(https://doi.org/10.6084/m9.figshare.27914217).

2.5 실시간 분석 및 시각화

현장에서 수집된 데이터는 R Shiny 서버를 통해 실시간으로 분석되고 시각화된다(Fig. 1d). R Shiny 애플리케이션은 로컬 파일 또는 데이터베이스에서 데이터를 불러온 후 이를 기반으로 R에서 필요한 계산을 수행하고 반응형 웹 대시보드 형태로 결과를 표시하므로 연구자와 이해관계자가 실시간으로 모니터링 결과를 확인할 수 있는 장점을 가지고 있다. R Shiny의 사용 방법과 사례연구에 사용된 코드 설명은 Supporting information 4에 서술하였고 R Shiny app 파일은 Supporting information 5로 첨부하였다(https://doi.org/10.6084/m9.figshare.27914217).

2.6 사례 연구: 생태계교란 식물 분포 조사

본 연구에서는 제안된 통합 프레임워크의 성능과 효용성을 평가하기 위해 서울대학교 관악캠퍼스와 한강·남한강변에서 생태계교란 식물의 분포를 조사하였다. 두 사례 모두 QGIS, QField, R Shiny를 활용하여 데이터를 수집하고 분석을 진행하였다.

2.6.1 사례 연구 1: 서울대학교 관악캠퍼스 생태계교란 식물 분포 조사

먼저, 서울대학교 관악캠퍼스 생태계교란 식물 분포 조사는 2021년 6월부터 7월까지 서울대학교 관악캠퍼스 내에서 진행하였다. 3인으로 구성된 조사팀은 캠퍼스 내 833,948 m2의 면적을 QField를 사용하여 조사하면서 생태계교란 식물의 이름과 위치를 Navspark의 RTK GNSS 수신기인 PX1122R-RTK-EVB를 이용하여 정밀 측량하여 기록하였다. 개체가 2미터 이내의 거리로 밀집되어 분포하는 지역은 군락으로 보고 폴리곤으로 군락의 범위를 기록하였다. 수집한 데이터는 QGIS에서 재가공한 이후 R Shiny를 이용해 분석하고 시각화하였다.

2.6.2 사례 연구 2: 한강·남한강변 가시박 분포 조사

다음으로 한강·남한강변 가시박(Sicyos angulatus L.) 분포 조사는 2021년 9월부터 10월까지 진행하였다. 강변 자전거도로를 따라 랜덤하게 추출한 52개의 지점에서 반경 500 미터의 범위내 가시박의 분포를 조사하고 현장에서 QField를 사용하여 군락을 폴리곤으로 기록하였으며, 데이터는 PostgreSQL에 저장하였다(Appendix 1-2). 분포가 광범위하고 접근이 어려운 이유로 Navspark의 RTK GNSS 수신기인 PX1122R-RTK-EVB를 이용하여 현재 위치를 정확히 파악하고 브이월드 지도를 기반으로 목측을 통해 군락 경계를 설정하였다. R Shiny를 통해 실시간으로 분석된 데이터를 바탕으로 가시박의 분포 지역을 시각화하고, 관리 방안에 대한 피드백을 제공하였다. 본 조사 방법과 데이터는 Oh (2024)에 사용되었다.

3. 결 과

제안된 통합 프레임워크는 두 사례 모두에서 신속하고 정확한 데이터 수집과 분석을 가능하게 하였다. 현장에서 수집된 데이터는 실시간으로 데이터베이스에 저장되었으며, R Shiny를 통해 즉시 분석되어 결과를 시각화하였다. 이는 기존의 전통적인 수작업 기록 방식과 비교했을 때, 데이터의 입력과정에서 입력 값의 제한 조건을 통해 입력 오류를 최소화할 수 있는 점, 별도의 디지털화 하는데 소요되는 시간이 없는 점, 디지털화 하는 중에 생길 수 있는 오류를 원천 차단할 수 있는 점, 공간좌표를 기록할 때 실시간으로 지도상의 현재 위치를 파악할 수 있어 식생도를 작성하기 용이한 점, R Shiny를 통해 실시간으로 데이터를 종합 분석하고 시각화하므로 데이터를 분석하고 공유하는데 별도의 시간이 소요되지 않는 점이 장점으로 부각되었다.

3.1 사례 연구 1: 서울대학교 관악캠퍼스 생태계교란 식물 분포 조사

먼저, 서울대학교 관악캠퍼스에서 진행한 생태계교란 식물의 분포 조사 결과, 돼지풀(Ambrosia artemisiifolia L.), 미국쑥부쟁이(Aster pilosus Willd.), 서양등골나물(Ageratina altissima (L.) R. M. King & H. Rob.), 애기수영(Rumex acetosella L.), 환삼덩굴(Humulus japonicus Siebold & Zucc.)의 총 5종의 생태계교란 식물이 발견되었다. R Shiny를 통해 분포 결과를 점 좌표와 열지도, 군락의 경우 폴리곤으로 나타내었다(Fig. 3a-b). 각 종의 분포지점의 밀집도 수준을 파악하기 위해 R Shiny 애플리케이션에서 드롭다운 메뉴를 통해 종을 선택하면 Ripley의 K함수를 도식하게 하였다. 모든 종이 랜덤프로세스에 의한 K 함수 값보다 관측한 K함수 값이 유의미하게 높게 나타났고 이는 종의 분포가 밀집되어 있음을 의미한다(Fig. 3c). 단일 개체가 가장 널리 퍼져 있는 종은 서양등골나물로 581개의 지점을 기록하였다(Fig. 3d). 군락을 형성하고 있는 종 중 가장 군락이 많고 군락 면적이 넓은 종은 애기수영으로 총 면적 2,251 m2의 58개의 군락을 발견하였다. 상세한 결과는 R Shiny 웹 애플리케이션에서 확인할 수 있다.

https://cdn.apub.kr/journalsite/sites/kseie/2024-011-04/N0190110405/images/kseie_2024_114_165_F3.jpg
Fig. 3.

Survey results of invasive plant distribution at Gwanak campus of Seoul national university based on open-source software-based unified framework. All the results are in the R Shiny web application (https://minwoo-oh.shinyapps.io/campus_IAP/).

3.2 사례 연구 2: 한강·남한강변 가시박 분포 조사

한강·남한강변의 가시박 분포를 조사한 결과, 총 552개의 가시박 군락을 기록하였다(Fig. 4). 현장 조사 결과를 바로 파악할 수 있도록 R Shiny에 지도화하여 나타내었다. 총 군락 면적은 290,917 m2이었다. 원자료 또한 쉽게 공유할 수 있도록 원자료표를 공유하고 이를 다운로드할 수 있게 하였다. 상세한 결과는 R Shiny 웹 애플리케이션에서 확인할 수 있다.

https://cdn.apub.kr/journalsite/sites/kseie/2024-011-04/N0190110405/images/kseie_2024_114_165_F4.jpg
Fig. 4.

Survey results of the distribution of Sicyos angulatus L. along the Hangang River and Namhangang River based on open-source software-based unified framework. All the results are in the R Shiny web application (https://minwoo- oh.shinyapps.io/river_IAP/).

4. 고 찰

4.1 데이터 정확성 및 효율성

네트워크 RTK와 QField를 사용하여 수집된 공간 데이터는 수 센티미터 수준의 정확성을 가진다. 이는 기존 GPS 장비만을 사용할 때 발생할 수 있는 수 미터 단위의 오차를 크게 줄여 좌표의 정확성을 현저하게 개선하고 추후 공간 데이터를 분석할 때 생기는 불확실성을 감소시킨다. 또한, PostgreSQL을 통해 데이터를 저장하고 관리하면서 데이터베이스 설계 수준에서 데이터의 무결성을 보장할 수 있다. QGIS와 QField에서도 입력 데이터에 제한 조건을 설정할 수 있어 데이터 입력과정에서 생기는 오류를 미연에 방지할 수 있다. 또한, 데이터베이스는 기본적으로 데이터를 tidy 데이터 형태로 저장하기 때문에 분석자가 전처리에 들이는 노력을 최소화할 수 있다(Wickham 2014). Tidy 데이터는 R을 통해 실시간으로 분석할 수 있는 형태이기 때문에 R Shiny를 이용해 데이터 입력 후 실시간으로 분석 결과를 확인할 수 있었다.

4.2 기존 방식과의 비교

기존의 수작업 기반 모니터링 방식에서는 종이 야장에 기록하는 과정에서 발생하는 기입 오류, 기록된 데이터를 스캔하고 전산화하는 과정에서 발생하는 오류 등으로 인하여 데이터 질에 문제가 발생하고(Morrison 2021), 데이터의 기록과 분석 사이에 컴퓨터에 입력 및 표준화 작업으로 발생하는 시간적 간격이 존재하여 실시간으로 데이터를 활용하기 어려웠다. 반면, 본 연구에서 제안한 통합 프레임워크는 모든 데이터를 현장에서 디지털 방식으로 즉시 수집 및 분석함으로써 이러한 문제를 해결하였다. 데이터 입력 단계에서의 오류를 입력 데이터의 제한 조건을 통해 방지하고, R Shiny를 통한 실시간 분석을 통해 관련자와 데이터를 손쉽게 공유하고 활용하며 필요한 경우 즉각적인 피드백을 통해 조사방식을 변경할 수 있게 하였다. QGIS와 QField를 활용한 다른 사례 들과의 차이점은 PostgreSQL 데이터베이스를 활용하여 실시간으로 데이터를 서버에 저장하고 R Shiny를 활용해 실시간으로 분석까지 수행하는 부분이다. Schattschneider et al. (2020)에서 제시한 프레임워크는 로컬 파일을 이용하여 데이터를 기록하였기 때문에 QField에서 기록한 데이터를 컴퓨터로 전송하는 과정이 필요하고 분석 시 별도로 R로 분석 코드를 실행해야 한다. Davies et al. (2019)에서는 PostGIS와 Google Earth Engine을 활용하여 필요한 지도 데이터를 저장 및 로드하고 이를 QGIS와 QField로 연동하였지만, 수집한 데이터의 분석에 대해서는 다루고 있지 않다. 따라서 이 논문에서 제시하는 프레임워크는 데이터의 취득부터 분석까지 유기적으로 연결되는 부분에서 차별점을 가지고 있으며, 단계 사이에 연구자의 관리 요소를 최소화함으로써 비용을 최소화하고 즉각적인 결과를 얻을 수 있도록 하였다.

4.3 한계점

본 연구에서 제안한 프레임워크는 네트워크 연결이 가능한 지역에서 효과적으로 작동하였다. 그러나 고산지대와 같이 통신망을 이용하기 어려운 지역에서는 먼저 네트워크 RTK를 사용할 수 없고, 원격 데이터베이스 서버에 접속하기 어려운 한계가 있다. 이와 같은 경우, 스마트폰 내장 GNSS 수신기를 사용하여 데이터를 수집하거나 두 개의 RTK GNSS 수신기를 하나는 이동국, 하나는 고정국으로 사용하여 인근 측량 기준점을 토대로 측량하는 방법을 사용해야한다. 또한, 네트워크 연결이 불가한 경우 수집된 데이터를 현장에서 데이터베이스에 기록할 수 없기 때문에 오프라인 데이터베이스인 SQLite 기반의 GeoPackage 파일을 이용하여 프로젝트를 구축하거나 OPENGIS.ch에서 제공하는 클라우드 서버인 QFieldCloud를 통해 데이터를 동기화하는 방식으로 보완해야한다(OPENGIS.ch 2024b).

연구에서 제시한 두가지 사례 연구에서는 각 출현종의 분포를 좌표와 폴리곤으로 기록하였다. 그러나 일반적인 식생조사의 경우에는 방형구 조사법을 통해 방형구 내 출현하는 모든 식물의 이름과 피도 등을 기록하게 되며, 이를 바탕으로 종풍부도 등의 종다양성 지수를 계산할 수 있다. 방형구 조사 데이터를 기록하기 위해 필요한 데이터베이스 설계 구조와 SQL 코드는 Supporting information 1에 상세히 기술하였고 각 데이터베이스에 대응되는 QGIS의 데이터 입력폼의 작성방법에 대해서는 Supporting information 2에 기술하였다. 방형구 조사와 같이 다량의 조사 데이터를 입력하는 경우에도 입력 폼을 체계적으로 구성하여 큰 시간 소요 없이 효과적으로 입력할 수 있으며, 공간 데이터 입력 시에는 기기나 RTK GNSS 수신기의 GPS 정보를 바로 이용하므로 시간을 단축할 수 있다.

5. 결 론

본 연구에서는 생태계 모니터링 과정의 효율성과 정확성을 높이기 위해 FOSS를 활용한 통합 프레임워크를 제안하였다. QGIS와 QField를 통한 실시간 데이터 수집, PostgreSQL/PostGIS를 통한 데이터 저장 및 관리, R Shiny를 통한 실시간 분석 및 시각화를 통해 현장 조사부터 분석까지의 전 과정을 자동화하고 통합하였다. 서울대학교 관악캠퍼스와 한강변에서의 실증 사례를 통해 본 프레임워크의 유효성을 입증하였으며, 전통적인 수작업 방식보다 데이터의 정확성과 시간 효율성을 크게 개선하였다. 본 연구의 통합 프레임워크는 생태계 모니터링 뿐만 아니라, 데이터 수집과 분석이 필요한 다양한 환경 연구 분야에서도 적용 가능할 것이다. 특히 연구자들이 실시간으로 데이터를 확인하고 분석할 수 있어, 보다 빠르고 유연한 생태계 관리 전략 수립에 기여할 수 있을 것으로 기대된다.

Acknowledgements

We would like to express our gratitude to Yerim Lee, Changhoon Shin, and Doyeon Kim for their efforts in surveying the distribution of invasive alien plants on the Gwanak campus of Seoul National University using the framework presented in this study. This work was supported by National Institute of Ecology (NIE) through Integrated Data Platform on Ecosystem and Climate Change (Phase 2), funded by Korea Ministry of Environment (NIE-C-2024-102).

References

1

Campbell, E., Duncan, I., and Hibbitts, H. 2005. Analysis of errors occurring in the transfer of geologic point data from field maps to digital data sets. In, Digital Mapping Techniques '05-Workshop Proceedings 2005, Baton Rouge, Los Angeles, USA. pp. 61-65. http://pubs.usgs.gov/of/2005/1428/campbell/index.html

2

Chang, W., Cheng, J., Allaire, J., Sievert, C., Schloerke, B., Xie, Y., Allen, J., McPherson, J., Dipert, A., and Borges, B. 2024. shiny: Web application framework for R (Version 1.9.1.9000) [R package]. https://github.com/rstudio/shiny.

3

Davies, K.P., Duncan, J., Wales, N., Varea, R., Shojaei, H., Bruce, E., Boruff, B., and Biggs, E. 2019. An open-source mobile geospatial platform for promoting climate-smart livelihood-landscape systems in Fiji and Tonga. ISPRS International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences XLII-4/W14: 31-36.

10.5194/isprs-archives-XLII-4-W14-31-2019
4

Duncan, J., Davies, K.P., Saipai, A., Vainikolo, L., Wales, N., Varea, R., Bruce, E., and Boruff, B. 2022. An open-source mobile geospatial platform for agricultural landscape mapping: a case study of wall-to-wall farm systems mapping in Tonga. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences XLVIII-4/W1-2022, pp. 119-126.

10.5194/isprs-archives-XLVIII-4-W1-2022-119-2022
5

Gnep, B. 2019. Use of QField for mapping breeding birds in the Wadden Sea. https://docs.qfield.org/success-stories/mapping-breeding-birds-in-the-Wadden-Sea/. Accessed 17 December 2024.

6

Kim, H. 2021. FAIR Principles: Considerations for Implementing Digital Archives from a Data Perspective. Journal of Korean Society of Archives and Records Management 21: 155-172. (in Korean)

7

Koo, G., Kim, K., Chung, J.Y., Choi, J., Kwon, N.Y., Kang, D.Y., and Sohn, H. 2017. Development of a high precision displacement measurement system by fusing a low cost RTK-GPS sensor and a force feedback accelerometer for infrastructure monitoring. Sensors 17: 2745.

10.3390/s1712274529182563PMC5751616
8

Korea National Aboretum. 2024. Plant Distribution Area Information Service [Data set]. (in Korean). https://www.data.go.kr/data/15130984/fileData.do. Accessed 17 December 2024.

9

Korea National Park Service. 2024. Current Status of Biological Resources in Jirisan National Park_20240418 [Data set]. (in Korea). https://www.data.go.kr/data/15108199/fileData.do. Accessed 17 December 2024.

10

Magurran, A.E., and McGill, B.J. 2011. Biological Diversity: Frontiers in Measurement and Assessment. Oxford University Press, Oxford, UK.

11

Morrison, L.W. 2021. Nonsampling error in vegetation surveys: understanding error types and recommendations for reducing their occurrence. Plant Ecology 222: 577-586.

10.1007/s11258-021-01125-5
12

National Information Society Agency. 2018. Open government data quality management manual v2.0. Daegu, Republic of Korea. (in Korean)

13

National Institute of Ecology. 2024a. (The 6th) National ecosystem survey guidelines. Seocheon, Republic of Korea. (in Korean)

14

National Institute of Ecology. 2024b. The 4th National Ecosystem Survey 2014-2018 (Version 1.0) [Data set]. (in Korean).

15

National Institute of Forest Science. 2021. Forest constancy table analysis information of Korea [Data set]. (in Korean). https://www.data.go.kr/data/15089967/fileData.do. Accessed 17 December 2024.

16

Oh, M. 2024. Multiscale prediction of the distribution of alien plants and trait-based prediction of their invasiveness. PhD thesis, Seoul National University, Seoul, Korea.

17

OPENGIS.ch. 2024a. QField (Version 3.4) [Mobile application software]. https://qfield.org.

18

OPENGIS.ch. 2024b. QFieldCloud [Software]. https://qfield.cloud.

19

PostGIS Project Steering Committee. 2024. PostGIS [Software extension]. https://postgis.net.

20

PostgreSQL Global Development Group. 2024. PostgreSQL [Database software]. https://www.postgresql.org.

21

QGIS Development Team. 2024. QGIS Geographic Information System. Open Source Geospatial Foundation Project. https://qgis.org.

22

Raymond, E.S. 2001. The Cathedral and the Bazaar: Musings on Linux and Open Source by an Accidental Revolutionary. O'Reilly. Sebastopol, California, USA.

23

Schattschneider, J.L., Daudt, N.W., Mattos, M.P.S., Bonetti, J., and Rangel-Buitrago, N. 2020. An open-source geospatial framework for beach litter monitoring. Environmental Monitoring and Assessment 192: 648.

10.1007/s10661-020-08602-w32951088
24

Stopar, B., Sterle, O., Pavlovčič-Prešeren, P., and Hamza, V. 2024. Observations and positioning quality of low-cost GNSS receivers: a review. GPS Solutions 28: 149.

10.1007/s10291-024-01686-8
25

Valente, D.S.M., Momin, A., Grift, T., and Hansen, A. 2020. Accuracy and precision evaluation of two low-cost RTK global navigation satellite systems. Computers and Electronics in Agriculture 168: 105142.

10.1016/j.compag.2019.105142
26

Vollmar, A., Macklin, J.A., and Ford, L. 2010. Natural history specimen digitization: challenges and concerns. Biodiversity Informatics 7: 93-112.

10.17161/bi.v7i2.3992
27

Weber, S. 2004. The success of open source. Harvard University Press. Cambridge, Massachusetts, USA.

10.4159/9780674044999
28

Wickham, H. 2014 Tidy data. Journal of Statistical Software 59: 1-23.

10.18637/jss.v059.i10
29

Wilkinson, M.D., Dumontier, M., Aalbersberg, I.J., et al. 2016. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data 3: 160018.

페이지 상단으로 이동하기