The Journal of
the Korean Society on Water Environment

The Journal of
the Korean Society on Water Environment

Bimonthly
  • ISSN : 2289-0971 (Print)
  • ISSN : 2289-098X (Online)
  • KCI Accredited Journal

Editorial Office


  1. 경기대학교 생명과학과 (Department of Life Science, Kyonggi University)
  2. SOKN생태보전연구소 (SOKN Institute of Ecology & Conservation)
  3. (주) 생태자원연구소 (Institute of Ecological Resources Research)
  4. (주)애일 (Corporation Aeil)
  5. 국립생태원 자연환경조사팀 (Team of Ecological Survey, National Institute of Ecology)



Benthic macroinvertebrates, Differential entropy, Microhabitat heterogeneity, Probability distribution models, Sample size, Species-area relationship

1. Introduction

특정 서식처에 서식하는 생물의 종수 및 개체수의 구조적 규칙성을 파악하기 위해서는 표본크기(조사횟수 또는 조사면적)가 충분히 커야 한다(Bagon et al., 1986; Cao et al., 2002; Duggan and Collier, 2002; Kong and Kim, 2015a; Li et al., 2001; Morin, 1997; Resh and Jackson, 1993; Vlek et al., 2006).

그러나 모집단에 대한 전수조사가 어렵기 때문에 표본조사로부터 얻어진 종수와 면적 또는 종수와 개체수의 관계를 수학적 모형으로 해석하기 위한 연구가 수행되어 왔으며, 대표적으로 멱함수(power equation) (Arrhenius, 1921), 지수함수(logarithmic function) (Gleason, 1922), 지수(exponential)분포(Kylin, 1926), Fisher 함수(Fisher et al., 1943), Preston 함수(Preston, 1948; 1962), 와이블(Weibull)분포(Weibull, 1951) 모형이 적용된 바 있다(Flather, 1996; Kong and Kim, 2015a; Rørslett, 1991).

특히 멱함수 모형과 지수함수 모형은 종수-면적 관계 해석에서 전통적으로 흔히 적용되어 왔다(Kimoto, 1976). 이러한 모형은 조사면적에 따라 종수가 계속하여 증가하는 육상이나 해양과 같은 개방생태계에서 적합하지만 상대적으로 폐쇄된 하천이나 호수에서 정주하는 저서성 대형무척추동물의 총 종수 예측에는 부합성이 낮을 수 있다(Kong and Kim, 2015a).

국내 하천에서 표본크기에 따른 저서성 대형무척추동물의 군집구조를 연구한 사례는 많지 않다. Yoon et al. (1998)이 강원도 방태천의 출현종수와 다양도지수 및 출현종수와 개체수의 관계를 분석한 바 있고, Kim et al. (2013)이 강원도 한계천의 출현종수와 다양한 군집지수의 변화를 분석한 바 있으나 이들 연구에서 조사면적과 종수에 대한 확률분포 해석은 수행되지 않았다. Kong and Kim (2015a)은 경기도 가평천과 오산천의 종수와 조사면적 간의 관계를 멱함수, Preston 함수, 지수함수, 지수분포, 대수정규(lognormal)분포, 와이블분포 모형을 적용하여 분석하고 와이블분포 모형의 적합성이 높음을 보고한 바 있다. Kong and Kim (2015b)은 오산천의 종수와 조사면적 간의 관계를 와이블분포 모형으로 분석하고 다양한 군집지수의 변화를 여러 수학적 모형으로 해석한 바 있다.

이상의 연구는 방태천의 5개 지점에서 여울(riffle)과 소(pool)로 구분하여 지점당 각각 2회씩 4회 조사(Yoon et al., 1998), 한계천의 3개 지점의 여울에서 지점당 15회 조사(Kim et al., 2013), 가평천과 오산천 각각 3개 지점의 여울에서 지점당 15회 조사(Kong and Kim, 2015a), 오산천 3개 지점의 여울에서 지점당 15회 조사(Kong and Kim, 2015b)된 것이다. 이러한 연구들은 표본크기가 작고 특정 미소서식처에 국한되어 조사된 자료를 가지고 수행된 것일 뿐만 아니라 종수와 면적 관계에 대한 확률분포 해석은 수행되지 않았거나 소수의 모형만이 적용된 것이었다.

본 연구는 상기한 연구의 한계점을 보완하기 위하여 경기도 조종천의 본류와 지류의 4개 지점에서 여울, 흐름(run), 소, 수변식생대(riparian vegetation zone)를 포함하여 지점당 40회의 방형구 조사를 실시하고 20개의 수학적 모형을 적용하여 조사면적과 종수의 관계를 해석한 것이다. 본 연구에서 다룬 주요 사항은 종수와 조사면적의 관계에 대한 각 모형의 적합도 및 예측도 검정, 이론적인 최대종수의 추정, 반포화 면적(half-saturation area) 및 미분엔트로피(differential entropy)에 의한 서식처의 이질성 평가이다.

2. Materials and Methods

2.1 조사 지점

경기도 가평군에 위치한 조종천 본류의 상류(MU)와 하류(MD), 지류인 십이탄천의 상류(TU)와 하류(TD)의 총 4개 지점을 선정하여 조사하였다(Fig. 1). 대상 지점은 대체로 유역 내에 오염원이 적고 육안으로 보았을 때 환경상태가 양호한 상태였다.

Fig. 1. Location of the survey sites (■ and ●: sampling site, : water quality monitoring site)

../../Resources/kswe/KSWE.2025.41.3.199/fig1.png

2.2 이화학적 환경요인

각 지점의 하폭, 수폭, 수심, 하상기질을 조사하였다. 하폭과 수폭의 측정은 거리측정계(Bushnell sport 600)를 이용하였으며, 하상기질은 Cummins (1962)의 기준에 따라 호박돌(boulder), 큰자갈(cobble), 자갈(pebble), 잔자갈(gravel), 모래(sand), 세사(silt), 점토(clay)의 6단계로 구분하여 상대적인 구성 비율을 측정하였다. 하상기질의 평균입경($\Phi_{m}$)은 파이값으로 변환한 입경[$\Phi =-\log_{2}^{D}$, $D$=입경(㎜)] 값을 기준으로 입도 구간별 면적비율과 입도 구간의 중앙값($\Phi_{i}$)으로부터 산출하였다(식 1).

식 1
$\Phi_{m}=\Sigma r_{i}\Phi_{i}$

조사지점에 인접한 환경부 수질측정망 지점의 수질자료(환경부 물환경정보시스템: http://water.nier.go.kr)에서 용존산소(dissolved oxygen)와 BOD5 (5-day biochemical oxygen demand), T-P (total phosphorus)의 2020년 평균 농도를 산출하였으며, Sládeček (1969; 1973)의 BOD5 기준에 따른 부수성(saprobity)과 Vollenweider (1974)의 T-P 기준에 따른 영양상태(trophic state)를 평가하였다.

2.3 현장조사 및 동정

본류 지점은 2020년 5월 22일, 지류 지점은 2020년 5월 29일에 조사하였다. 각 지점에서 4개의 미소서식처(여울, 흐름, 소, 수변식생대)로 구분하여 D-frame net (30 ㎝×30 ㎝, mesh size: 1 ㎜)로 각각 10회씩 총 40회(4개의 조사지점에서 조사된 총 방형구 수는 160개) 채집하였다. 채집물은 각 방형구별로 번호를 부여하여 플라스틱 병에 개별적으로 넣어 95% Ethyl alcohol로 고정한 후 실험실로 운반하여 방형구별로 생물시료를 골라내기 및 동정 후 80% Ethyl alcohol에 보존하였다.

2.4 데이터 조합

각 지점에서 40개 방형구별로 종과 개체수 목록을 작성한 후 방형구 횟수에 따라 종별 개체수를 누적하였다. 방형구 누적에 따른 종별 개체수 합은 그 조합의 수가 커서(예로 40개 방형구 자료에서 20개를 조합하는 경우의 수 $_{40}C_{20}\approx 1.4\bullet 10^{11}$개) Microsoft Exel과 같은 spreadsheet 프로그램으로는 연산이 되지 않기 때문에 Fortran 90으로 별도로 프로그래밍하여 실행하였다.

2.5 종수-면적 해석

2.5.1 모형의 선정

확률분포모형은 매우 다양하며 그 정의역도 적용대상에 따라 달라진다. 일반적으로 모형의 모수가 많아질수록 모수 추정의 복잡성, 불확실성 및 과적합의 가능성이 높아진다. 본 연구에서는 종수-면적 관계 해석에 적합하되 가능한 적은 모수를 가진 모형을 선발하는데 중점을 두고 기존에 알려진 모형 및 새로이 고안된 모형의 적용성을 검토하였다. 또한 조사면적의 정의역에서 최소의 역치값은 음의 값을 포함하지 않은 0 이상의 값으로 고려하였다.

본 연구에서는 4개의 비확률분포 함수 모형과 16개의 확률분포 모형이 적용되었다(Table 1). 함수 모형은 그간에 종수-면적 관계 해석에 널리 적용되어 온 멱함수(power equation)와 지수함수(exponential equation) 및 각각의 함수에 역치값이 포함된 것이다. 확률분포 모형은 역치값을 포함한 2 인자 분포[지수(exponential), 역지수(inverse exponential), 모나드(monad), 사인(sine)], 3 인자 절단분포[정규(normal), 로지스틱(logistic), 굼벨(Gumbel)], 역치값을 포함한 3 인자 분포 [일반지수(generalized exponential), 와이블(Weibull), 역와이블(inverse Weibull), 대수정규(lognormal), 로지스틱멱함수(logistic power), 감마(gamma), 사인멱함수(sine power)], 역치값을 포함한 4 인자 분포[일반로지스틱멱함수(generalized logistic power), 베타(beta)]였다(Table 1).

Table 1 Specific decrease rate function of remaining species (SDRF), cumulative distribution function (CDF), probability density function (PDF), and quantile for the number of species according to area ($x$)

Model

Domain

SDRF

$g(x)$

CDF or

$F(x)$

PDF or

$f(x)$

Quantile

(m2)

Power

$x\in(0,\: \infty)$

$\lambda >0,\: k>0$

Undefined

$\lambda x^{k}$

$\lambda kx^{k-1}$

Undefined

Power

(shifted)

$x\in(a,\: \infty)$

$a\ge 0,\: \lambda >0,\: k>0$

$z=x-a$

Undefined

$\lambda z^{k}$

$\lambda kz^{k-1}$

Undefined

Logarithmic

$x\in(a,\: \infty)$

$\lambda >0,\: k>0$

Undefined

$k\ln x+\lambda$

$\dfrac{k}{x}$

Undefined

Logarithmic

(shifted)

$x\in(a,\: \infty)$

$\lambda >0,\: k>0$

$z=x-a$

Undefined

$k\ln z+\lambda$

$\dfrac{k}{z}$

Undefined

Generalized

exponential

(shifted)

$x\in(a,\: \infty)$

$a\ge 0,\: \lambda >0,\: k>0$

$z=\dfrac{x-a}{\lambda}$

$\dfrac{k}{\lambda}\dfrac{\left(1-e^{-z}\right)^{k-1}e^{-z}}{1-\left(1-e^{-z}\right)^{k}}$

$\left(1-e^{-z}\right)^{k}$

$\dfrac{k}{\lambda}\dfrac{e^{-z}}{\left(1-e^{-z}\right)^{(1-k)}}$

$a-\lambda\ln\left(1-p^{1/k}\right)$

Weibull

(Shifted)

$x\in(a,\: \infty)$

$a\ge 0,\: \lambda >0,\: k>0$

$z=\dfrac{x-a}{\lambda}$

$\dfrac{k}{\lambda}z^{k-1}$

$1-e^{-z^{k}}$

$\dfrac{k}{\lambda}z^{k-1}e^{-z^{k}}$

$a+\lambda\left(\ln\dfrac{1}{1-p}\right)^{1/k}$

Exponential

(shifted)

$x\in(a,\: \infty)$

$a\ge 0,\: \lambda >0$

$z=\dfrac{x-a}{\lambda}$

$\dfrac{1}{\lambda}$

$1-e^{-z}$

$\dfrac{1}{\lambda}e^{-z}$

$a-\lambda\ln(1-p)$

Inverse

Weibull

(shifted)

$x\in(a,\: \infty)$

$a\ge 0,\: \lambda >0,\: k>0$

$z=\dfrac{\lambda}{x-a}$

$\dfrac{k}{\lambda}z^{k+1}\dfrac{e^{-z^{k}}}{1-e^{-z^{k}}}$

$e^{-z^{k}}$

$\dfrac{k}{\lambda}z^{k+1}e^{-z^{k}}$

$a+\dfrac{\lambda}{(-\ln p)^{1/k}}$

Inverse

exponential

(shifted)

$x\in(a,\: \infty)$

$a\ge 0,\: \lambda >0$

$z=\dfrac{\lambda}{x-a}$

$\dfrac{1}{\lambda}z^{2}\dfrac{e^{-z}}{1-e^{-z}}$

$e^{-z}$

$\dfrac{1}{\lambda}z^{2}e^{-z}$

$a-\dfrac{\lambda}{\ln p}$

Normal

(left-

truncated)

$x\in(a,\: \infty)$

$a\ge 0,\: \sigma >0$

$z=\dfrac{x-\mu}{\sigma}$

$\dfrac{\varphi(z)}{\sigma[1-\Phi(z)]}$

$\Phi(z)=\dfrac{1}{2}{erfc}\left(-\dfrac{z}{\sqrt{2}}\right)$

$\varphi(z)=\dfrac{1}{\sqrt{2\pi}}e^{-z^{2}/2}$

$\dfrac{\Phi(z)-\alpha}{1-\alpha}$, $\alpha =\Phi\left(z_{a}\right)$

$z_{a}=\dfrac{a-\mu}{\sigma}$

$\dfrac{\varphi(z)}{(1-\alpha)\sigma}$

$\mu +\sigma\Phi^{-1}[\alpha +(1-\alpha)p]$

Lognormal

(shifted)

$x\in(a,\: \infty)$

$a\ge 0,\: \sigma >0$

$z=x-a$

$\dfrac{\sqrt{2/\pi}e^{-\dfrac{1}{2}\left(\dfrac{\ln z-\mu}{\sigma}\right)^{2}}}{{erfc}\left(\dfrac{\ln{z}-\mu}{\sqrt{2}\sigma}\right)\sigma{z}}$

$\Phi(z)=\dfrac{1}{2}{erfc}\left(-\dfrac{\ln{z}-\mu}{\sqrt{2}\sigma}\right)$

$\dfrac{1}{\sqrt{2\pi}\sigma z}e^{-\dfrac{1}{2}\left(\dfrac{\ln z-\mu}{\sigma}\right)^{2}}$

$a+\Phi^{-1}(p)$

Logistic

(left-

truncated)

$x\in(a,\: \infty)$

$a\ge 0,\: s>0$

$z=\dfrac{x-\mu}{s}$

$\dfrac{1}{s\left(1+e^{-z}\right)}$

$\dfrac{\Phi(z)-\alpha}{1-\alpha}$, $\alpha =\Phi\left(z_{a}\right)$

$\Phi(z)=\dfrac{1}{1+e^{-z}}$, $z_{a}=\dfrac{a-\mu}{s}$

$\dfrac{\varphi(z)}{(1-\alpha)s}$

$\varphi(z)=\dfrac{e^{-z}}{\left(1+e^{-z}\right)^{2}}$

$\mu +s\ln\dfrac{\alpha /(1-\alpha)+p}{1-p}$

Generalized

logistic

power

(shifted)

$x\in(a,\: \infty)$

$a\ge 0,\: \lambda >0,\: k>0,\: \beta >0$

$z=x-a$

$\dfrac{\beta\lambda kz^{\beta k-1}}{\left(\lambda +z^{k}\right)\left[\left(\lambda +z^{k}\right)^{\beta}-z^{\beta k}\right]}$

$\left(1-\dfrac{\lambda}{\lambda +z^{k}}\right)^{\beta}$

$\dfrac{\beta\lambda kz^{\beta k-1}}{\left(\lambda +z^{k}\right)^{\beta +1}}$

$a+\left(\dfrac{\lambda p^{1/\beta}}{1-p^{1/\beta}}\right)^{1/k}$

Logistic

power

(shifted)

$x\in(a,\: \infty)$

$a\ge 0,\: \lambda >0,\: k>0$

$z=x-a$

$k\dfrac{z^{k-1}}{\lambda +z^{k}}$

$1-\dfrac{\lambda}{\lambda +z^{k}}$

$\dfrac{\lambda kz^{k-1}}{\left(\lambda +z^{k}\right)^{2}}$

$a+\left(\dfrac{\lambda p}{1-p}\right)^{1/k}$

Monad

(shifted)

$x\in(a,\: \infty)$

$a\ge 0,\: \lambda >0$

$z=x-a$

$\dfrac{1}{\lambda +z}$

$\dfrac{z}{\lambda +z}$

$\dfrac{\lambda}{(\lambda +z)^{2}}$

$a+\dfrac{\lambda p}{1-p}$

Gamma

(Shifted)

$x\in(a,\: \infty)$

$a\ge 0,\: \lambda >0,\: k>0$

$z=\dfrac{x-a}{\lambda}$

$g(z)=\dfrac{z^{k-1}e^{-z}}{\lambda[\gamma(k)-\gamma(k,\: z)]}$

$\dfrac{\gamma(k,\: z)}{\gamma(k)}$

$\dfrac{1}{\lambda\gamma(k)}z^{k-1}e^{-z}$

$a+\lambda\gamma^{-1}[p\gamma(k)]$

Gumbel

(left-

truncated)

$x\in(a,\: \infty)$

$a\ge 0,\: \lambda >0$

$z=\dfrac{x-\mu}{\lambda}$

$\dfrac{e^{-z}}{\lambda\left[e^{e^{-z}}-1\right]}$

$\dfrac{\Phi(z)-\alpha}{1-\alpha}$, $\alpha =\Phi\left(z_{a}\right)$

$\Phi(z)=e^{-e^{-z}}$, $z_{a}=\dfrac{a-\mu}{\lambda}$

$\dfrac{\varphi(z)}{(1-\alpha)\lambda}$

$\varphi(z)=e^{-(z+e^{-z})}$

$\mu -\lambda\delta$

$\delta =\ln\left(\ln\dfrac{1}{\alpha +(1-\alpha)p}\right)$

Beta

(Shifted)

$x\in(a,\: b)$

$a\ge 0,\: \lambda >0,\: k>0$

$z=\dfrac{x-a}{b-a}$

$\dfrac{z^{\lambda -1}(1-z)^{k-1}}{(b-a)[B(\lambda ,\: k)-B(z;\lambda ,\: k)]}$

$\dfrac{B(z;\lambda ,\: k)}{B(\lambda ,\: k)}$

$\dfrac{z^{\lambda -1}(1-z)^{k-1}}{(b-a)B(\lambda ,\: k)}$

$a+(b-a)I^{-1}(p)$

Sine power

(Shifted)

$x\in(a,\: \lambda)$

$a\ge 0,\: \lambda >0,\: k>0$

$z=\dfrac{x-a}{\lambda}$

$\dfrac{\pi k}{\lambda}z^{k-1}\tan\left(\dfrac{\pi}{2}z^{k}\right)$

$\dfrac{1}{2}\left[1-\cos\left(\pi z^{k}\right)\right]$

$\dfrac{\pi k}{2\lambda}z^{k-1}\sin\left(\pi z^{k}\right)$

$a+\lambda\left[\dfrac{\cos^{-1}(1-2p)}{\pi}\right]^{1/k}$

Sine

(Shifted)

$x\in(a,\: \lambda)$

$a\ge 0,\: \lambda >0$

$z=\dfrac{x-a}{\lambda}$

$\dfrac{\pi}{\lambda}\tan\left(\dfrac{\pi}{2}z\right)$

$\dfrac{1}{2}[1-\cos(\pi z)]$

$\dfrac{\pi}{2\lambda}\sin(\pi z)$

$a+\lambda\left[\dfrac{\cos^{-1}(1-2p)}{\pi}\right]$

2.5.2 기본 개념

어떤 서식처에 서식하는 잠재적인 최대종수($S_{m}$)에 대하여 특정 조사면적($x$)에서 출현한 종수($S$)의 비($S/S_{m}$)가 조사면적에 따라 확률분포 모형의 누적분포함수(cumulative distribution function, CDF) $F(x)$를 따를 때(식 2),

식 2
$S=S_{m}F(x)$

확률밀도함수(probability density function, PDF) $f(x)$는 식 3과 같다.

식 3
$f(x)=\dfrac{d F(x)}{dx}=\dfrac{1}{S_{m}}\dfrac{d S}{dx}$

최대종수에서 특정 조사면적의 종수를 감한 종수($S_{m}-S$) 즉 잔여종수(remaining number of species)의 비감소율함수(specific decrease rate function, SDRF)를 $g(x)$라 하면(식 4),

식 4
$\dfrac{1}{S_{m}-S}\dfrac{d(S_{m}-S)}{dx}=-g(x)$

4의 양변을 적분하고 비감소율함수 $g(x)$의 적분함수를 $G(x)$라 하면(식 5, 식 6), $F(x)$와 $G(x)$의 관계는 식 7과 같고 $f(x)$와 $g(x)$ 및 $F(x)$의 관계는 식 8과 같다.

식 5
$\int_{0}^{S}\dfrac{1}{S_{m}-S}d(S_{m}-S)=-\int_{0}^{x}g(x)dx =-G(x)$
식 6
$S=S_{m}\left[1-e^{-G(x)}\right]$
식 7
$F(x)=1-e^{-G(x)}$
식 8
$f(x)=G^{'}(x)e^{-G(x)}=g(x)[1-F(x)]$

분위값(quantile)은 식 9와 같다.

식 9
$x=F^{-1}(p)$

적률(moment)은 분위값 함수로부터 산정하거나(식 10) 적률생성함수(moment generating function)로부터 산정(식 11)할 수 있다.

식 10
$E\left(X^{n}\right)=\int_{X}x^{n}f(x)dx =\int_{0}^{1}\left[F^{-1}(p)\right]^{n}dp$
식 11
$E\left(X^{n}\right)=M_{X}^{n}(t)\left |_{t=0}\right .$

각 모형의 SDRF, CDF 또는 $F(x)$, PDF 또는 $f(x)$, Quantile 식은 Table 1과 같으며 최빈값, 평균(mean), 분산(variance), 미분엔트로피 식은 Table 2와 같다.

미분엔트로피는 이산확률변수의 엔트로피 개념을 연속확률변수에 확장한 것으로 확률분포의 불확실성(정보량)을 의미한다. 서식처가 이질적일수록 조사면적에 따른 출현종수 변화의 불확실성과 최대종수에 이르는 조사면적이 커질 것이라고 가정한다면, 종수-면적 확률분포의 미분엔트로피는 서식처의 이질성을 평가할 수 있는 지표로 응용될 수 있다.

미분엔트로피는 미분함수 또는 분위함수로부터 산출되며(식 12), 적분전 엔트로피함수의 최대값은 식 13 및 식 14의 과정을 거쳐 오일러 수(Euler’s number)의 역수($e^{-1}$) 또는 확률밀도함수에서 최빈값(mode, $\hat{x}$)에 해당하는 적분전 엔트로피함수 값이 된다(식 15).

식 12
$h(X)=E[-\ln(f(X)]=-\int_{X}\ln f(x)f(x)dx =-\int_{0}^{1}\ln f\left[F^{-1}(p)\right]dp$
식 13
$-\dfrac{d}{dx}\ln f(x)f(x)=-f'(x)-\ln f(x)f'(x)=0$
식 14
$f(x)=e^{-1}$ or $f'(x)=0$
식 15
$-\ln f(x)f(x)= e^{-1}$ or $-\ln f(\hat{x})f(\hat{x})$

종수-면적의 확률분포를 기반으로 서식처의 이질성 평가에 활용될 수 있는 또 다른 지표는 최대종수의 1/2에 해당하는 종수를 보이는 중위면적, 즉 반포화 면적(half-saturation area, $\widetilde{x}$)이다(Kong and Kim, 2015a). 서식처가 균질할수록 반포화 면적 및 최대종수에 이르는 조사면적이 작아지는 반면 서식처가 이질적일수록 반포화 면적 및 최대종수에 이르는 조사면적이 커지게 된다. 본 연구에서 반포화 면적은 누적분포함수 값이 0.5에 해당하는 역함수 값으로 산정하였다.

Table 2 Mode, mean, variance, and differential entropy of probability distribution models

Model

Mode

(m2)

Mean

(m2)

Variance

(m4)

Differential entropy

Power

Undefined

Undefined

Undefined

Undefined

Power

(shifted)

Undefined

Undefined

Undefined

Undefined

Logarithmicic

Undefined

Undefined

Undefined

Undefined

Logarithmicic

(shifted)

Undefined

Undefined

Undefined

Undefined

Generalized

exponential

(shifted)

$a+\lambda\ln k$

$a,\: [k<1]$

$a+\lambda\xi$

$\xi =\psi(1+k)-\psi(1)$

$\lambda^{2}\left[\psi_{1}(1)-\psi_{1}(1+k)\right]$

$\ln\dfrac{e\lambda}{k}-\dfrac{1}{k}+\xi$

Weibull

(Shifted)

$a+\lambda\left(1-\dfrac{1}{k}\right)^{1/k}$

$a,\: [k<1]$

$a+\lambda\xi$

$\xi =\gamma(1+1/k)$

$\lambda^{2}(\tau -\xi^{2})$

$\tau =\gamma(1+2/k)$

$\ln\dfrac{e\lambda}{k}+\dfrac{k-1}{k}\gamma$

Exponential

(shifted)

$a$

$a+\lambda$

$\lambda^{2}$

$1+\ln\lambda$

Inverse

Weibull

(shifted)

$a+\lambda\left(\dfrac{k}{1+k}\right)^{1/k}$

$a+\lambda\xi$

$\xi =\gamma(1-1/k)$

$\lambda^{2}(\tau -\xi^{2})$

$\tau =\gamma(1-2/k)$

$\ln\dfrac{e\lambda}{k}+\dfrac{k+1}{k}\gamma$

Inverse

exponential

(shifted)

$a+\dfrac{\lambda}{2}$

Undefined

Undefined

$1+\ln\lambda +2\gamma$

Normal

(Left-

truncated)

$a,\: [\mu <a]$

$\mu ,\: [\mu\ge a]$

$\mu +\sigma\xi$

$\xi =\dfrac{e^{-z_{a}^{2}/2}}{(1-\alpha)\sqrt{2\pi}},\: z_{a}=\dfrac{a-\mu}{\sigma}$

$\sigma^{2}\left(1+z_{a}\xi -\xi^{2}\right)$

$\ln[(1-\alpha)\sqrt{2\pi e}\sigma]+\dfrac{z_{a}}{2}\xi$

Lognormal

(shifted)

$a+e^{\mu -\sigma^{2}}$

$a+e^{\mu +\sigma^{2}/2}$

$(e^{\sigma^{2}}-1)e^{2\mu +\sigma^{2}}$

$\mu +\dfrac{\ln(2\pi e\sigma^{2})}{2}$

Logistic

(Left-

truncated)

$a,\: [\mu <a]$

$\mu ,\: [\mu\ge a]$

$a-\xi$

$\xi =s\dfrac{\ln\alpha}{1-\alpha}$

$2s^{2}\dfrac{{Li}_{2}(1-\alpha)}{1-\alpha}-\alpha\xi^{2}$

$2+\ln s+\dfrac{\alpha}{1-\alpha}\ln\alpha$

Generalized

logistic

power

(shifted)

$a+\left[\dfrac{\lambda(\beta k-1)}{1+k}\right]^{1/k}$

$a,\: [\beta k<1]$

$a+\xi$

$\xi =\beta\lambda^{1/k}\tau_{1}$

$\tau_{1}=\dfrac{\gamma(2+1/k-1/\beta)\gamma(1-1/k)}{\gamma(2-1/\beta)}$

$\beta\lambda^{2/k}\tau_{2}-\xi^{2}$

$\tau_{2}=\dfrac{\gamma(2+2/k-1/\beta)\gamma(1-2/k)}{\gamma(2-1/\beta)}$

$\ln\dfrac{e\lambda^{1/k}}{\beta k}-\dfrac{1}{\beta k}+\left(1+\dfrac{1}{k}\right)\tau_{3}$

$\tau_{3}=\psi(1+\beta)-\psi(1)$

Logistic

power

(shifted)

$a+\left[\dfrac{\lambda(k-1)}{1+k}\right]^{1/k}$

$a,\: [k<1]$

$a+\xi$

$\xi =\lambda^{1/k}\tau_{1}$

$\tau_{1}=\gamma(1+1/k)\gamma(1-1/k)$

$\lambda^{2/k}\tau_{2}-\xi^{2}$

$\tau_{2}=\gamma(1+2/k)\gamma(1-2/k)$

$2+\ln\dfrac{\lambda^{1/k}}{k}$

Monad

(shifted)

$a$

Undefined

Undefined

$2+\ln\lambda$

Gamma

(Shifted)

$a+\lambda(k-1)$

$a,\: [k<1]$

$a+\lambda k$

$\lambda^{2}k$

$k+\ln[\lambda\gamma(k)]+(1-k)\psi(k)$

Gumbel

(Left-

truncated)

$a,\: [\mu <a]$

$\mu ,\: [\mu\ge a]$

$\mu +\lambda\xi$

$\xi =\dfrac{\gamma -{Ei}\left(- e^{-z_{a}}\right)-\alpha z_{a}}{1-\alpha}$

$\lambda^{2}\left(\dfrac{\pi^{2}/6+\gamma^{2}-\tau}{1-\alpha}-\xi^{2}\right)$

$\tau =\int_{0}^{\alpha}\ln^{2}\left(\ln\dfrac{1}{t}\right)dt$

$\ln[e\lambda(1-\alpha)]+\dfrac{\alpha}{1-\alpha}\ln\alpha +\xi$

Beta

(Shifted)

$a+\dfrac{(b-a)(\lambda -1)}{\lambda +k-2}$

$a,\: [\lambda <1]$

$a+\dfrac{(b-a)\lambda}{\lambda +k}$

$\dfrac{(b-a)^{2}\lambda k}{(\lambda +k+1)(\lambda +k)^{2}}$

$\ln[(b-a)B(\lambda ,\: k)]-\xi_{1}-\xi_{2}$

$\xi_{1}=(\lambda -1)[\psi(\lambda)-\psi(\lambda +k)]$

$\xi_{2}=(k-1)[\psi(k)-\psi(\lambda +k)]$

Sine power

(Shifted)

$a+\lambda z$

$\tan(\pi z^{k})=\dfrac{\pi k}{1-k}z^{k}$

numerical soulution

$a,\: [k<1/2]$

$a+\lambda\xi$

$\xi =\dfrac{\pi}{4}E_{1}+\tau_{1}$

$E_{1}=i\left[E_{-1/k}(-\pi i)+E_{-1/k}(\pi i)\right]$

$\tau_{1}=\dfrac{1}{2\pi^{1/k}}\cos\left(\dfrac{\pi}{2k}\right)\gamma(1+1/k)$

$\lambda^{2}\left(\dfrac{\pi}{4}E_{2}+\tau_{2}-\xi^{2}\right)$

$E_{2}=i\left[E_{-2/k}(-\pi i)+E_{-2/k}(\pi i)\right]$

$\tau_{2}=\dfrac{1}{2\pi^{2/k}}\cos\left(\dfrac{\pi}{k}\right)\gamma(1+2/k)$

$\ln\dfrac{e\lambda}{k\pi^{(k+1)/(2k)}}+\tau_{3}$

$\tau_{3}=\dfrac{k-1}{2k}[\gamma -{Ci}(\pi)]$

Sine

(Shifted)

$a+\dfrac{\lambda}{2}$

$a+\dfrac{\lambda}{2}$

$\lambda^{2}\left(\dfrac{1}{4}-\dfrac{2}{\pi^{2}}\right)$

$\ln\dfrac{e\lambda}{\pi}$

$e$, $\gamma$: Euler constant; $\psi$: digamma; $\psi_{1}$: trigamma; Li2: diLogarithmic; ${Ei}(x)$: Exponential integral E; $E_{a}(x)$: Exponential integral E; Ci: Cosine integral

2.5.3 적합도 검정

본 연구에서 적용된 경험적 누적분포함수 값은 각 조사면적에서 나타난 실측종수를 최대종수로 나눈 값(식 2)으로서 모형에서 추정된 최대종수에 따라 그 값이 달라진다. 즉 경험적 구간에 해당하는 누적 방형구면적이 대상면적 중 일부에 불과하여 최대우도추정(maximum likelihood estimation, MLE) 또는 모멘트추정(moment estimation, ME)으로 모형의 모수를 추정할 수는 없다.

따라서 경험적 구간에서 실측종수와 계산종수의 표준화 평균제곱근오차(normalized root mean squared error, NRMSE)(식 16)가 최소가 되는 확률분포 모형의 모수를 Microsoft Excel 프로그램의 해 찾기 기능을 이용하여 도출하고 적합도를 평가하였다.

식 16

$NR MSE(\%)=\dfrac{\sqrt{\dfrac{1}{n}\sum_{i=1}^{n}(S_{oi}-S_{ci})^{2}}}{\dfrac{1}{n}\sum_{i=1}^{n}S_{oi}}\times 100$

$n$: Number of fitted points

$S_{oi}$: Observed number of species

$S_{ci}$: Calculated number of species

2.5.4 예측도 검정

지점당 40회의 방형구 조사는 많은 시간과 노력이 요구되므로 일반적인 조사에서는 수행하기 어렵다. 이를 고려하여 Kong and Kim (2015a; 2015b)의 연구에서 수행된 바 있는 표본크기인 15회 방형구의 조합을 가지고 종수와 면적 간 최적의 적합도를 보이는 모형의 인자(parameter)를 도출하고, 이를 적용하여 예측된 40회 방형구의 종수($S_{e}$)와 40회 방형구의 실측종수($S_{o}$) 간 백분율 오차(percentage error, PE) (식 17)와 총 조사지점 단위에서의 평균절대백분율오차(mean absolute percentage error, MAPE) (식 18)로 예측도를 검정하였다.

식 17

$PE(\%)=\dfrac{S_{e}-S_{o}}{S_{o}}\times 100$

$n$: Number of fitted points

$S_{o}$: Observed number of species at a sampling site

$S_{e}$: Predicted number of species at a sampling site

식 18

$MAPE(\%)=\dfrac{\sum_{i=1}^{n}\left | S_{oi}-S_{ei}\right |}{\sum_{i=1}^{n}\left | S_{oi}\right |}\times 100$

$n$: Number of survey sites

$S_{oi}$: Observed number of species at site number $i$

$S_{ei}$: Predicted number of species at site number $i$

3. Results and Discussion

3.1 조사지점의 이화학적 조건

하폭과 수폭은 본류의 하류지점(MD)에서 가장 넓었으며, 지류의 하류지점(TD)은 상대적으로 하폭과 수폭이 좁고 수심이 깊었다(Table 3). 하상은 전반적으로 조립질이었으며, 특히 본류의 상류지점(MU)에서 평균입경이 컸다. 본류의 수질은 극빈부수성(xenosaprobic)에서 빈부수성(oligosaprbic) 및 중영양(mesotrophic) 상태로 양호한 수준이었다. 지류의 수질은 별도로 측정되지 않았으나 육안으로 보았을 때 본류와 큰 차이가 없는 양호한 수준이었다.

Kong and Kim (2016)이 제안한 분류기준에 따를 때, MU 지점의 하상기질은 자갈낀 호박돌(pebbly cobble), TU 지점과 MD 지점은 호박돌낀 잔자갈(cobbly gravel), TD 지점은 여러 입자크기의 복합 하상(copegra)이었다(Fig. 2).

Fig. 2. Substrate types of sampling sites.

../../Resources/kswe/KSWE.2025.41.3.199/fig2.png

Table 3 Physicochemical conditions of survey sites

Code

Stream width

(m)

Water

width

(m)

Water

depth

(cm)

Substrate

$\Phi$m†

DO

(㎎/L)

BOD5

(㎎/L)

T-P

(㎎/L)

Saprobicty

Trophic state

TU

50~60

10~15

0~50

-3.4

TD

40~50

5~10

0~60

-3.7

MU

70~90

5~15

0~40

-6.3

10.1

1.0

0.019

Xenosaprobic

mesotrophic

MD

100-120

15-30

0~40

-3.5

9.9

1.2

0.020

Oligosaprobic

mesortrophic

†Phi-scaled mean particle diameter

Saprobity: Sládeček (1969, 1973); BOD5 (㎎/L) 0∼1: xenosaprobic, 1∼2.5: oligosaprobic, 2.5∼5: β-mesosaprobic, 5∼10: α-mesosaprobic, >10: polysaprobic

Trophic state: Vollenweider (1974); T-P (㎎/L) 0∼0.01: oligotrophic, 0.01∼0.02: mesotrophic, 0.02∼0.1: eutrophic, >0.1: hypertrophic

3.2 모형의 적합도

누적면적에 따른 실측종수와 각 모형에서 계산된 종수 간의 NRMSE 값은 Table 4와 같다. 전체 지점에서의 평균 NRMSE 값을 기준으로 일반로지스틱멱함수분포 > 대수정규분포 > 로지스틱멱함수분포 > 역와이블분포 > 와이블분포 > 사인멱함수분포 모형의 순으로 적합도가 높았다. 그 외의 모형은 상대적으로 낮은 적합도를 보였으며, 특히 사인분포 모형의 적합도는 매우 낮았다.

기존의 생물종수와 조사면적에 대한 연구에서, 와이블 모형의 적합도가 매우 높은 것으로 확인된 바 있으나(Flather, 1996) 이는 광범위한 면적에서 조사된 조류(鳥類) 군집을 대상으로 한 것이었다. Kong and Kim (2015a)의 가평천과 오산천의 저서성 대형무척추동물 군집의 종수와 조사면적에 대한 연구에서도 와이블 모형의 적합도가 가장 높은 것으로 보고된 바 있으나 이는 여울에서 1∼15개의 방형구 자료에서 도출된 것이었으며 비교된 모형의 수도 적었다. 다양한 미소서식처에서 40개의 방형구로 조사된 자료를 바탕으로 20개의 모형을 적용한 본 연구에서도 와이블분포 모형의 적합도는 상당히 높은 것이 확인되었지만 가장 높은 적합도를 보이는 모형은 지류 지점에서 역와이블분포, 본류 지점에서는 일반로지스틱멱함수 분포 모형이었다(Fig. 3).

각 모형에서 반포화 면적은 MU>TD$\approx$TU>MD의 순으로 높았다. MU 지점은 TD 지점에 비하여 40회 방형구에서의 출현종수와 모형에서 예측된 최대종수가 모두 작지만 최대종수에 이르는데 보다 큰 조사면적이 요구되는 반면, MD 지점은 TU 지점과 MU 지점에 비하여 40회 방형구에서의 출현종수가 크지만 최대종수에 이르는데 보다 작은 조사면적이 요구됨을 알 수 있다.

또한 생물종수에 대한 서식처의 수용력과 이질성에 의한 변이로 인해 출현종수의 지점 간 순위가 방형구의 횟수에 따라 달라질 수 있다. 즉, 현재 국가생물측정망에서의 표본크기(방형구 3회)로 조사된 MU 지점의 종수는 조사지점 중 가장 작지만, 조사면적이 충분히 커지는 경우는 다른 결과를 보일 수 있다.

Fig. 3. Species-area curves of the best fit models. Dots, observed values; Lines, calculated values; Error bars, standard deviations.

../../Resources/kswe/KSWE.2025.41.3.199/fig3.png

Table 4 Normalized root mean squared error (NRMSE) between observed numbers of species and calculated ones of models according to survey area

Model

TU

TD

MU

MD

Mean

standard

deviation

Power

3.33

3.41

3.45

4.65

3.71

0.55

Power (shifted)

1.38

1.56

1.96

2.83

1.93

0.56

Logarithmic

1.22

0.71

2.77

1.23

1.48

0.77

Logarithmic (shifted)

0.52

0.42

0.17

1.23

0.59

0.39

Generalized exponential (shifted)

0.73

0.46

0.37

0.51

0.52

0.14

Weibull (Shifted)

0.56

0.27

0.21

0.28

0.33

0.13

Exponential (shifted)

6.19

5.99

4.49

4.34

5.25

0.84

Inverse Weibull (shifted)

0.44

0.12

0.13

0.36

0.26

0.14

Inverse exponential (shifted)

5.04

5.50

6.78

5.06

5.59

0.71

Normal (left-truncated)

6.22

6.06

4.55

4.44

5.32

0.83

Lognormal (shifted)

0.48

0.16

0.04

0.07

0.19

0.17

Logistic (left-truncated)

6.12

5.92

4.44

4.29

5.19

0.83

Generalized logistic power (shifted)

0.45

0.12

0.00

0.03

0.15

0.18

Logistic power (shifted)

0.49

0.18

0.10

0.08

0.21

0.16

Monad (shifted)

2.62

2.55

2.14

1.25

2.14

0.54

Gamma (Shifted)

0.72

0.44

0.35

0.48

0.50

0.14

Gumbel (left-truncated)

6.12

5.94

4.59

4.35

5.25

0.79

Beta (Shifted)

0.72

0.44

0.36

0.49

0.50

0.14

Sine power (Shifted)

0.61

0.35

0.31

0.49

0.44

0.12

Sine (Shifted)

44.73

43.28

36.20

40.86

41.27

3.24

3.2.1 멱함수와 로그함수 모형

멱함수 모형은 종수-면적 관계 해석에서 가장 빈번하게 이용되고 있다(Kimoto, 1976; Tjørve, 2003; Ulrich and Buszko, 2007). 그러나 본 연구에서는 멱함수 모형에 비하여 로그함수 모형의 적합도가 높았으며, 기본 함수에 비하여 역치 값만큼 수평이동된 함수(shifted function)의 적합도가 높았다(Table 3, Fig. 4). 이는 본 연구의 대상지역처럼 비교적 작은 면적에서는 멱함수 모형에 비하여 로그함수 모형이 더 적합하다는 선행연구 결과(Kimoto, 1976; Kong and Kim, 2015a)와 일치한다.

멱함수($\lambda x^{k}$) 모형에서 계수 $\lambda$는 종 다양성에 대한 지리적인 변이를 반영하는 것으로 생물군 또는 조사지역마다 다르며, 특정 면적에서의 생물종에 대한 서식처의 수용력과 관계된 값이다(Kong and Kim, 2015a). 승수 $k$는 군집을 구성하는 분류군의 다양성과 이동성 및 서식처의 이질성에 따라 달라진다(Vreugdenhil et al., 2003). Preston (1962)은 종수와 개체수 간의 대수정규칙으로부터 종수와 면적 간의 멱함수식을 도출하였으며 이론적인 승수를 0.262로 제안하였는데 이를 대략 1/4로 간주한 것이 4승근 법칙(the fourth root law)이다.

Preston (1962)은 승수 0.262를 기준으로 서식처의 복잡성 또는 이질성을 판단할 수 있다고 하였다. 그러나 실제 조사결과는 지수 값이 0.262보다 큰 경우가 많은데, MacArthur and Wilson (1967)은 그 이유를 서식처의 이질성보다는 조사면적이 커지면 지세가 복잡해지고 격리된 군집의 종 분화가 커지기 때문인 것으로 해석하였다.

본 연구에서 기본 멱함수의 계수 $\lambda$는 1 m2의 면적에서 출현하는 종수로 본류 지점의 값(46∼62)에 비하여 지류 지점의 값(64∼75)이 더 컸다. 수평이동 멱함수의 계수 $\lambda$는 1 m2에 역치값을 더하거나 감한 면적에서 출현하는 종수로 본류 지점에서는 48∼64, 지류 지점에서는 66∼78이었다.

Kong and Kim (2015a)의 연구에서 기본 멱함수의 계수 $\lambda$는 극빈부수성 및 중영양으로 청정하였던 가평천에서 45∼60, 빈부수성∼$\alpha$-중부수성($\alpha$-mesosaprobic) 및 과영양(hypertrophic)으로 다소 오염되었던 오산천에서 19∼24였다. 이를 통해 볼 때 조종천 본류 지점의 생물종에 대한 수용력은 오산천보다는 매우 크고 가평천보다는 약간 크며, 지류 지점의 수용력은 그보다 더 큰 수준임을 알 수 있다. 승수 $k$는 기본 멱함수에서 지류 지점이 0.23∼0.26, 본류 지점이 0.32∼0.40이었고 수평이동 멱함수에서 지류 지점이 0.22∼0.23, 본류 지점이 0.27∼0.36이었다. 이를 통해 볼 때 서식처 이질성은 본류 지점에 비해 지류 지점이 상대적으로 높으며 특히 MU 지점의 이질성이 가장 높은 것으로 볼 수 있다.

Kong and Kim (2015a)은 가평천에서 승수 $k$ 값이 0.278∼0.418, 오산천에서 0.242∼0.439로 보고한 바 있는데 이러한 결과에 비하여 본 연구에서 나타난 승수의 값은 대체로 작다. 그러나 이러한 차이는 표본크기에 따른 회귀구간의 차이에서 비롯된 것으로 볼 수도 있다. 즉 Kong and Kim (2015a)의 연구는 1∼15개 방형구의 자료로부터 도출된 것이었는데, Fig. 3에서 1∼15개 방형구 구간에서의 승수는 기본 멱함수 모형에서 지류 지점이 0.30∼0.34, 본류 지점이 0.44∼0.51로 Kong and Kim (2015a)의 결과와 큰 차이가 없거나 오히려 크다.

지수함수($k\ln x+\lambda$) 모형에서 $\lambda$는 멱함수와 같이 특정 면적에서의 생물종에 대한 수용력과 관련이 있는 값이다. 본 연구에서 기본 지수함수의 계수 $\lambda$는 1 m2의 면적에서 출현하는 종수로 본류 지점의 49∼64에 비하여 지류 지점에서 65∼77로 더 컸다. 수평이동 지수함수의 계수 $\lambda$는 1 m2에 역치값을 더하거나 감한 면적에서 출현하는 종수로 본류 지점에서는 45∼64, 지류 지점에서는 67∼78이었다.

Kong and Kim (2015a)의 연구에서 기본 지수함수의 계수 $\lambda$는 청정하천인 가평천에서 44∼59, 다소 오염된 오산천에서 19∼24였다. 멱함수에 의한 평가와 마찬가지로 조종천 본류 지점의 생물종에 대한 수용력은 오산천보다는 매우 크고 가평천보다는 약간 크며, 지류 지점의 수용력은 그보다 더 큰 수준임을 알 수 있다.

지수함수의 계수 $k$는 멱함수의 승수와 같이 서식처의 이질성과 관련이 있다. 계수 $k$는 기본 지수함수에서 지류 지점이 14.9∼19.8, 본류 지점이 18.7∼20.0이었고 수평이동 지수함수에서는 지류 지점이 13.7∼18.9, 본류 지점이 19.9∼22.6이었다. 멱함수에 의한 평가와 마찬가지로 조종천 본류 지점의 서식처 이질성은 지류 지점에 비하여 상대적으로 높으며 특히 MU 지점의 이질성이 가장 높은 것으로 판단할 수 있다.

Kong and Kim (2015a)의 연구에서 기본 지수함의 계수 $k$는 가평천에서 10.86∼13.12, 오산천에서 3.63∼7.21이었는데 Fig. 3에서 1∼15개 방형구 구간에서의 계수 $k$는 기본 지수함수 모형에서 16.24∼20.74로 조종천의 이질성은 가평천과 오산천에 비하여 더욱 높은 수준임일 알 수 있다.

그러나 멱함수 모형 또는 지수함수 모형의 계수 값을 가지고 지점 간의 서식처 이질성을 비교하는 것은 무리가 있다. 상기한 바와 같이 멱함수의 승수 값은 표본크기에 영향을 받으며 지수함수 역시 그러하다. 예를 들어 1∼10회의 방형구 구간에서 기본 지수함수의 계수 $k$ 값은 TD (20.97) > MD (20.23) > TU (16.94) > MU (15.26)의 순으로 큰 반면 31∼40회의 방형구 구간에서는 MU (20.85) > TD (18.45) > TU (15.15) > MD (15.11)의 순으로 달리 나타난다. 보다 근본적으로 한정된 좁은 서식구간에서 조사면적이 매우 큰 경우 종수가 더 이상 증가하지 않을 것임을 고려한다면 멱함수의 승수나 지수함수의 계수에 의한 서식처 이질성 평가는 적정하지 않은 것으로 판단된다.

Fig. 4. Observed values (dots) and calculated values of power and logarithmic equations for the number of species according to survey area.

../../Resources/kswe/KSWE.2025.41.3.199/fig4.png

3.3 모형의 예측도

1∼15회 방형구의 조합에서 추정된 모형의 인자로 예측된 40회 방형구의 예측종수와 해당 표본크기의 실측종수 및 예측도 검정결과는 Table 5와 같다.

비확률분포 모형인 멱함수 모형과 로그함수 모형의 예측종수는 과대평가되는 경향을 보였으며, 기본 멱함수 모형에서 그 경향이 더욱 뚜렷하였다. 비확률분포 모형중에는 수평이동 로그함수 모형의 예측도가 상대적으로 높았다. 확률분포 모형의 예측종수는 전반적으로 과소평가되는 경향을 보였으나 일반로지스틱멱함수분포, 대수정규분포, 역와이블분포, 로지스틱멱함수분포에서는 그 정도가 작았다. 이와 반면 지수분포, 역지수분포, 정규분포, 로지스틱분포, 굼벨분포, 사인멱함수분포, 사인분포 모형의 예측종수는 과소평가되는 정도가 뚜렷하였다.

이러한 결과로 볼 때 작은 표본크기의 자료를 바탕으로 종수를 예측할 때 적합한 모형은 비확률분포 모형 중에는 수평이동 로그함수 모형, 확률분포 모형 중에는 일반로지스틱멱함수분포, 대수정규분포, 역와이블분포, 로지스틱멱함수분포 모형인 것으로 평가된다(Fig. 5).

Fig. 5. Observed values and predicted model values of the number of species according to survey area.

../../Resources/kswe/KSWE.2025.41.3.199/fig5.png

Table 5 Numbers of species sampled in 40 replicates of a 30x30 cm quadrat, corresponding ones predicted with model parameters estimated from 1∼15 replicates, percentage errors, and mean absolute percentage error (MAPE)

Model

Observed and predicted number of species

Percentage error (%)

MAPE

(%)

TU

(84)

TD

(102)

MU

(74)

MD

(88)

TU

TD

MU

MD

Power

98

121

91

114

16.8

18.7

22.7

29.3

21.9

Power (shifted)

90

112

84

104

7.5

9.4

13.7

18.4

12.2

Logarithmic

87

105

68

91

3.9

2.7

-8.2

3.2

4.5

Logarithmic (shifted)

85

104

75

94

1.7

2.2

1.0

6.9

2.9

Generalized exponential (shifted)

75

95

69

81

-10.1

-6.9

-7.3

-7.4

8.0

Weibull (Shifted)

78

98

71

84

-7.4

-3.7

-4.4

-4.6

5.0

Exponential (shifted)

67

81

56

71

-19.9

-20.9

-24.3

-18.9

21.0

Inverse Weibull (shifted)

81

101

75

91

-3.9

-1.1

1.4

3.2

2.4

Inverse exponential (shifted)

71

85

56

74

-15.3

-16.8

-23.9

-16.0

18.0

Normal (left-truncated)

76

80

56

71

-9.5

-21.3

-24.9

-19.6

18.8

Lognormal (shifted)

79

100

73

88

-5.7

-1.8

-0.7

-0.3

2.1

Logistic (left-truncated)

67

79

43

71

-19.9

-22.7

-42.2

-18.9

25.9

Generalized logistic power (shifted)

80

101

74

88

-4.9

-1.2

0.0

-0.3

1.6

Logistic power (shifted)

79

100

73

87

-5.4

-2.0

-1.8

-1.0

2.5

Monad (shifted)

75

91

65

83

-10.2

-10.5

-11.6

-5.9

9.6

Gamma (Shifted)

76

95

69

82

-9.7

-6.5

-7.0

-7.0

7.6

Gumbel (left-truncated)

67

81

56

71

-19.9

-21.0

-24.4

-19.0

21.0

Beta (Shifted)

76

95

69

82

-9.8

-6.7

-7.2

-7.2

7.7

Sine power (Shifted)

74

95

68

77

-12.3

-6.8

-8.4

-12.7

10.0

Sine (Shifted)

330

389

32

73

292.5

281.0

-57.4

-17.5

162.1

Number in parentheses: observed values

3.4 모형의 통계량

확률분포 모형에서 추정되는 최대종수($S_{m}$)는 서식처의 여러 환경조건들을 복합적으로 반영하는 수용력의 지표가 될 수 있다(Kong and Kim, 2015a). 그러나 모형의 적합도나 예측도의 차이에 따라 추정된 최대종수 역시 모형별로 크게 달랐다(Table 6).

TU 지점과 TD 지점에서 최적의 적합도와 예측도를 보이는 모형인 역와이블분포 모형에서 추정된 최대종수는 각각 145와 173이었고, MU 지점과 MD 지점에서 최적의 적합도와 예측도를 보이는 모형인 일반로지스틱멱함수분포 모형에서 추정된 최대종수는 각각 157과 115였다. 이를 통해 볼 때 종수에 대한 수용력은 TD > MU > TU > MD의 순으로 높다고 할 수 있다. TD 지점은 다른 지점에 비하여 상대적으로 수심이 깊고 유속이 빨랐으며 여러 입자크기의 복합 하상기질로 구성되어 있었는데 이러한 서식환경이 많은 종을 수용하는데 작용한 것으로 보인다. MU 지점은 하상기질은 자갈낀 호박돌로 조립화 되어 있었는데 이와 반면 보다 세립화된 하상기질인 호박돌낀 잔자갈로 이루어진 MU 지점과 TU 지점은 수용력이 낮은 것으로 보인다.

최대종수는 모형의 차이 또는 표본크기에 따라 추정되는 인자 값의 차이에 의해서도 달리 나타날 수 있다. 작은 표본크기에 적용되었을 경우 와이블분포 모형의 예측종수는 실측값에 비하여 과소평가되는 정도가 역와이블분포나 일반로지스틱멱함수분포 모형에 비해 크다. 따라서 다른 연구결과와의 비교분석에는 동일한 표본크기에서 같은 모형으로 추정된 값이 고려되어야 한다.

Kong and Kim (2015a)의 연구에서 와이블분포 모형으로 추정된 최대종수는 청정하천인 가평천에서 66∼93, 수질이 상대적으로 불량하고 세립질 하상이 주를 이루는 오산천에서 27∼52였다. 본 연구에서 동일한 표본크기로 와이블분포 모형으로 추정된 최대종수는 조종천 본류 지점에서 81∼87, 지류지점에서 80∼107이었다. 이러한 결과로 볼 때 조종천의 종 수용력은 오산천에 비하여 매우 크고 가평천에 비해서는 비슷한 수준으로 평가된다.

TU 지점과 TD 지점에서 최적의 적합도를 보이는 모형인 역와이블분포 모형에서 최대종수의 중위값을 보이는 면적 즉 반포화 면적$(\widetilde{x})$은 각각 1.59 ${m}^{2}$와 1.56 ${m}^{2}$이었고, MU 지점과 MD 지점에서 최적의 적합도를 보이는 모형인 일반로지스틱멱함수분포 모형에서 중위값은 4.46 ${m}^{2}$과 1.07 ${m}^{2}$이었다. Kong and Kim (2015a)은 중위값을 서식처의 이질성을 대변하는 지표로 제안한 바 있는데 이를 따를 때 각 지점별 서식처 이질성은 MU>>TU$\approx$TD>MD의 순으로 평가된다.

역지수분포와 모나드(Monad)분포 모형은 그 구조 상 평균과 분산이 수렴되지 않으며, 역와이블분포, 일반로지스틱멱함수분포, 로지스틱멱함수분포 모형은 도출된 인자값이 평균과 분산의 수렴을 충족하지 않았다. 평균이 수렴된 모든 분포 모형에서 평균값$(\overline{x})$은 중위값에 비하여 크게 나타났는데 이는 면적의 증가에 따른 종수의 변화율의 분포가 정적편포(positively skewed distribution)하는 것을 의미한다. 그중 대수정규분포는 면적의 증가에 따른 종수의 변화율의 분포가 정적편포하는 정도가 커서 평균값과 분산이 비현실적으로 크게 나타나는 것으로 판단된다. 대수정규분포의 평균과 분산은 상대적으로 매우 큰 값을 보였는데 이는 Kong and Kim (2015a)의 연구에서 대수정규분포 모형의 왜도(skewness)가 매우 크게 나타난다는 결과와 일치한다.

각 지점의 조사면적에 따른 종수 관계에서 최적의 적합도를 보이는 확률분포 모형의 누적분포함수와 미분엔트로피함수는 Fig. 6과 같다. 작은 조사면적에서 누적분포함수 값이 증가하는 정도는 MD > TD $\approx$ TU > MU의 순으로 컸다(Fig. 6a). 이는 서식처의 균일성과 관련이 있는 것으로 작은 조사면적에서 최대값에 수렴하는 정도가 클수록 서식처가 균일하다고 할 수 있으며, 최대값에 수렴하는 조사면적이 클수록 서식처가 이질적이어서 면적이 증가할 때 새로운 종이 지속적으로 추가되는 것을 의미한다.

미분엔트로피함수 값의 분포는 최대값인 $e^{-1}$을 기준으로 MU > TU $\approx$ TD > MD의 순으로 산포하는 정도가 컸다(Fig. 6b). 미분엔트로피는 미분엔트로피함수를 적분한 것으로 그 값이 클수록 조사면적에 따른 출현종수의 변화율에 불확실성이 크다는 것을 의미하며 이는 서식처의 높은 이질성을 반영한다고 할 수 있다. 미분엔트로피 값은 TU, TD, MU, MD 지점의 순으로 일반로지스틱멱함수분포 모형에서 3.64, 3.56, 4.51, 2.06, 대수정규분포 모형에서 2.12, 2.09, 2.99, 1.53, 로지스틱멱함수분포 모형에서 2.37, 2.35, 3.05, 1.79, 역와이블분포 모형에서 4.12, 3.85, 5.75, 2.91로 적합도가 높은 모든 모형에서 MU > TU $\approx$TD > MD의 순이었다.

위에서 언급한 바와 같이 서식처의 이질성을 평가하는 지표로서 비확률분포 모형은 방형구 구간의 어떤 구간을 택하여 회귀분석을 하느냐에 따라 계수 값이 달라지기 때문에 적용하는데 무리가 있다. 따라서 반포화 면적이나 미분엔트로피 값으로 서식처의 이질성을 평가하는 것이 바람직하고 특히 모든 면적구간에서 산정되는 무차원의 미분엔트로피 값이 가장 좋은 지표로 판단된다. 미분엔트로피 값을 기준으로 볼 때 서식처의 이질성은 하상기질이 자갈낀 호박돌로 구성된 MU 지점에서 가장 높았고, 호박돌낀 잔자갈로 구성된 TU 지점과 복합 하상인 TD 지점은 중간수준이었으며, 호박돌낀 잔자갈로 구성되었으나 세립질 비율이 높은 MD 지점에서 가장 낮았다.

Fig. 6. Cumulative distribution function and differential entropy function of the best fit models for the number of species according to survey area.

../../Resources/kswe/KSWE.2025.41.3.199/fig6.png

Table 6 Statistics of probability distribution models for the maximum number of species $(S_{m})$ according to area ($x$). maximum number of species $(S_{m})$, median $(\widetilde{x},\: {m}^{2})$, mean $(\overline{x},\: {m}^{2})$, standard deviation $\left(SD,\: m^{2}\right)$, and differential entropy $(h)$

Model

TU

TD

MU

MD

$S_{m}$ $\widetilde{x}$ $\overline{x}$ $SD$ $h$ $S_{m}$ $\widetilde{x}$ $\overline{x}$ $SD$ $h$ $S_{m}$ $\widetilde{x}$ $\overline{x}$ $SD$ $h$ $S_{m}$ $\widetilde{x}$ $\overline{x}$ $SD$ $h$

Generalized exponential (shifted)

91

0.25

1.06

1.90

-0.23

110

0.32

1.08

1.77

0.18

86

0.82

1.72

2.30

1.30

92

0.43

0.96

1.31

0.59

Weibull (Shifted)

102

0.37

3.70

13.26

0.84

122

0.44

2.62

7.31

0.98

95

1.03

2.82

4.95

1.73

97

0.48

1.29

2.23

0.92

Exponential (shifted)

78

0.28

0.40

0.40

0.08

95

0.33

0.48

0.48

0.26

72

0.63

0.90

0.90

0.90

84

0.43

0.63

0.63

0.53

Inverse Weibull (shifted)

145

1.59

-

-

4.12

173

1.56

-

-

3.85

190

9.90

-

-

5.75

132

1.07

-

-

2.91

Inverse exponential (shifted)

83

0.24

-

-

0.35

102

0.29

-

-

0.55

78

0.62

-

-

1.31

91

0.42

-

-

0.92

Normal (left-truncated)

78

0.28

0.40

0.43

0.08

95

0.33

0.47

0.46

0.25

71

0.63

0.89

0.87

0.88

84

0.43

0.62

0.60

0.52

Lognormal (shifted)

119

0.64

190.37

60,974

2.12

142

0.71

48.08

3,441

2.09

124

2.05

33.18

538.45

2.99

106

0.59

3.62

21.90

1.53

Logistic (left-truncated)

78

0.28

0.40

0.40

0.08

95

0.33

0.48

0.48

0.26

72

0.63

0.90

0.90

0.90

84

0.43

0.63

0.63

0.53

Generalized logistic power (shifted)

139

1.27

-

-

3.64

168

1.36

-

-

3.56

157

4.46

-

-

4.51

115

0.72

-

-

2.06

Logistic power (shifted)

122

0.71

-

-

2.37

146

0.79

-

-

2.35

123

1.97

-

-

3.05

111

0.66

-

-

1.79

Monad (shifted)

87

0.27

-

-

0.71

108

0.35

-

-

0.94

90

0.87

-

-

1.86

99

0.51

-

-

1.33

Gamma (Shifted)

91

0.26

1.14

2.14

-0.16

111

0.33

1.15

1.97

0.24

87

0.84

1.80

2.49

1.34

93

0.44

0.99

1.39

0.63

Gumbel (left-truncated)

78

0.28

0.40

0.40

0.08

95

0.33

0.48

0.48

0.26

71

0.62

0.89

0.88

0.88

84

0.43

0.62

0.62

0.53

Beta (Shifted)

91

0.26

1.14

2.12

-0.17

111

0.33

1.14

1.95

0.24

87

0.84

1.79

2.46

1.33

93

0.44

0.99

1.38

0.62

Sine power (Shifted)

93

0.27

1.17

2.00

0.12

111

0.33

1.05

1.58

0.34

84

0.76

1.43

1.65

1.16

90

0.41

0.82

0.97

0.49

Sine (Shifted)

103

1.20

1.80

0.78

1.14

125

1.20

1.80

0.78

1.14

87

1.20

1.80

0.78

1.14

108

1.20

1.80

0.78

1.14

4. Conclusion

표본크기(조사면적)와 저서성 대형무척추동물 종수의 관계 해석을 위해 조종천의 본류와 지류 지점을 대상으로 조사한 결과 다음과 같은 결론을 얻었다.

생물종수에 대한 서식처의 수용력과 이질성에 의한 변이로 인해 조사면적에 따른 종수의 변화율은 표본크기에 따라 다르기 때문에 작은 표본크기로 조사된 결과는 모집단의 종 풍부성 및 다양성에 대하여 왜곡된 평가로 이어질 수 있다.

육상이나 해양과 달리 상대적으로 폐쇄된 하천이나 호수 생태계에 정주하는 저서성 대형무척추동물 군집의 종수와 조사면적의 관계를 비확률분포 모형으로 해석하고자 할 때는 멱함수 모형보다는 지수함수 모형을 적용하는 것이 바람직하며 기본함수보다는 역치값을 가지고 수평이동된 모형을 적용하는 것이 더욱 적합하다.

종수-면적 해석에 적용된 20개의 함수 또는 확률분포 모형 중 가장 높은 적합도와 예측도를 보이는 확률분포 모형은 역와이블분포 모형과 일반로지스틱분포 모형이었다. 이러한 모형을 적용하여 추정되는 최대종수는 물리⋅화학적인 환경수용력을 대변하며, 종수에 대한 반포화 면적 또는 종수의 변화율에 대한 미분엔트로피는 각각 생물종에 대한 미소서식처의 이질성을 평가하는 지표로 활용될 수 있을 것으로 판단된다.

현행 국가생물측정망에서 시행되고 있는 여울에서의 3회 방형구 조사로 출현하는 종수는 다양한 미소서식처(여울, 흐름, 소, 수변식생대)를 대상으로 40회의 방형구 조사에서 출현한 종수의 1/3∼1/2, 최적의 적합도를 보이는 확률분포 모형으로 추정된 최대종수의 약 15∼30%에 불과하므로 보다 정확한 군집구조를 파악하기 위해서는 표본크기를 늘릴 필요가 있다.

본 연구는 생물군집에 대한 조사를 중심으로 진행되었으며 방형구별 물리⋅화학적인 환경요인에 대한 조사가 미진하여 환경요인과 군집특성에 대한 관계 해석에 제한이 있었다. 따라서 향후 환경요인에 대한 조사와 더불어 물리⋅화학적 이질성에 대한 지표를 개발하고, 본 연구에서 제안된 생물기반의 이질성 지표와 비교연구를 수행할 필요가 있다. 또한 미소서식처별로 10회의 방형구 조사는 최대종수를 추정하는데 있어 여전히 충분하지 않은 것으로 판단되므로 향후 표본크기를 더욱 늘리고 방형구별 환경요인을 세밀하게 조사하여 면적-종수 간의 관계를 보다 정확하게 해석할 필요가 있다.

References

1 
Arrhenius, O. (1921). Species and area, Journal of Ecology, 9(1), 95-99. https://doi.org/10.2307/2255763DOI
2 
Bagon, M., Harper, J. L., and Townsend, C. R. (1986). Ecology: Individuals, populations and communities, 3rd Edition, Blackwell Science Ltd.Google Search
3 
Cao, Y., Williams, D. D., and Larsen, D. P. (2002). Comparison of ecological communities: The problem of sample representativeness, Ecological Monographs, 72(1), 41-56. https://doi.org/10.1890/0012-9615(2002)072[0041:COECTP]2.0.CO;2DOI
4 
Cummins, K. W. (1962). An evaluation of some techniques for the collection and analysis of benthic samples with special emphasis on lotic waters, The American Midland Naturalist, 67(2), 477–504.DOI
5 
Duggan, I. C. and Coller, K. J. (2002). Evaluation of invertebrate biometrics and the influence of subsample size using data from some westland, New Zealand, Lowland Streams, New Zealand Journal of Marine and Freshwater Research, 36, 117-128. https://doi.org/10.1080/00288330.2002.9517075DOI
6 
Fisher, R. A., Corbet, S. S., and Williams, C. B. (1943). The relation between the number of species and number of individuals in a random sample of an animal population, Journal of Animal Ecology, 12(1), 42-58. https://doi.org/10.2307/1411DOI
7 
Flather, C. H. (1996). Fitting species-accumulation functions and assessing regional land use impacts on avian diversity, Jourmal of Biogeography, 23(2), 155-168. https://doi.org/10.1046/j.1365-2699.1996.00980.xDOI
8 
Gleason, H. A. (1922). On the relation between species and area, Ecology, 3(2), 158-162. https://doi.org/10.2307/1929150DOI
9 
Kim, A. R, Oh. M. W., and Kong, D. S. (2013). The influence of sample size on environment Assessment using benthic macroinvertebrates, Journal of Korean Society on Water Environment, 29(6), 790-798. [Korean Literature]DOI
10 
Kimoto, S. (1976). Analytical method on animal community I, Koritz Press, 192.Google Search
11 
Kong, D. and Kim A. R. (2015a). Analysis on the relationship between number of species and survey area of benthic macroinvertebrates using weibull distribution function, Journal of Korean Society on Water Environment, 31(2), 142-150. [Korean Literature] https://doi.org/10.15681/KSWE.2015.31.2.142DOI
12 
Kong, D. and Kim A. R. (2015b). Analysis on the relationship between biological indices and survey area of benthic macroinvertebrates using mathematical model, Journal of Korean Society on Water Environment, 31(6), 610-618. [Korean Literature] https://doi.org/10.15681/KSWE.2015.31.6.61DOI
13 
Kong, D. and Kim, J. Y. (2016). Development of benthic macroinvertebrates streambed index (BMSI) for bioassessment of stream physical habitat, Journal of Korean Society on Water Environment, 32(1), 1-14. [Korean Literature] https://doi.org/10.15681/KSWE.2016.32.1.1DOI
14 
Kylin, H. (1926). Über Begriffsbildung und Statistik in der Pflanzensoziologie, Botaniska Notiser, 81-181.Google Search
15 
Li J., Herlihy A., Gerth W., Kaufmann P., Gregory S., Urquhart S., and Larsen D. P. (2001). Variability in stream macroinvertebrates at multiple spatial scales, Freshwater Biology, 46, 87–97.DOI
16 
MacArthur, R. H. and Wilson, E. O. (1967). The theory of Island biogeography, Princeton University Press, Princeton, New Jersey.Google Search
17 
Morin, A. (1997). Empirical models predicting population abundance and productivity in lotic systems, Journal of the North American Benthological Society, 13, 319-337. https://doi.org/10.2307/146802DOI
18 
Preston, F. W. (1948). The commonness and rarity of species, Ecology, 29(3), 254-283. https://doi.org/10.2307/1930989DOI
19 
Preston, F. W. (1962). The canonical distribution of commonness and rarity: Part I, Ecology, 43(2), 185-215. https://doi.org/10.2307/1931976DOI
20 
Resh V. H. and Jackson J. K. (1993). Rapid assessment approaches to biomonitoring using benthic macroinvertebrates, Rosenberg D. M. and Resh V. H. (eds.), Freshwater biomonitoring and benthic macroinvertebrates, Chapman and Hall, New York, 195-233.Google Search
21 
Rørslett, B. (1991). Principal determinants of aquatic macrophyte richness in Northern European lakes, Aquatic Botany, 39(1-2), 173-193. https://doi.org/10.1016/0304-3770(91)90031-YDOI
22 
Sládeček, V. (1969). The measures of saprobity, Verhandlungen des Internationalen Verein Limnologie, 17, 546-559.Google Search
23 
Sládeček, V. (1973). System of water quality from biological point of wiew, Archiv für Hydrobiologie, Beiheft, Ergebnisse der Limnologie, Stuttgart, 7, 218.Google Search
24 
Tjørve, E. (2003). Shapes and functions of species-area curves: A review of possible models, Journal of Biogeography, 30, 827-835. https://doi.org/10.1046/j.1365-2699.2003.00877.xDOI
25 
Ulrich, W. and Buszko, J. (2007). Sampling design and the shape of species-area curves on the regional scale, Acta Oecologica, 31(1), 54-59. https://doi.org/10.1016/j.actao.2006.03.005DOI
26 
Vlek, H. E., Sporka, F., and Krno, I. (2006) Influence of macroinvertebrates sample size on bioassessment of streams, Hydrobiologia, 566, 523-542. https://doi.org/10.1007/s10750-006-0074-7DOI
27 
Vollenweider, R. A. (1974). A manual on methods for measuring, primary production in aquatic environments, IBP Handbook No. 12, International Biological Programme, Blackwell Scientific Publications, Oxford, 225.Google Search
28 
Vreugdenhil, D., Terborgh, J., Cleef, A. M., Sinitsyn, M., Boere, G. C., Archaga, V. L., and Prins, H. H. T. (2003). Comprehensive protected areas system composition and monitoring, World Institute for Conservation and Environment. https://portals.iucn.org/library/sites/library/files/documents/2003-031.pdfDOI
29 
Weibull, W. (1951). A statistical distribution function of wide applicability, Journal of Applied Mathematics, 18(3), 293-297. https://doi.org/10.1115/1.4010337DOI
30 
Yoon, I. B., Bae, Y. J., Ro, T. H., Lee, S. J., and Park, J. H. (1998). Determination on the optimal sample size in the aquatic insect community analysis – Pangtae creek model, The Korean Journal of Ecology, 21(5), 409-418.Google Search