서울 구로구의 코로나19 검사. 김혜윤 기자 unique@hani.co.kr
확진자수, 사망자수, 완치자수의 의미
한국 정부에서 발표하는 코로나19 관련 통계에는 확진자수, 사망자수, 완치자수가 3대 주요 데이터다.[1][2] 감염자수도 중요하지만, 감염되었어도 증상이 없으면 검사를 받지 않아 확진자로 분류되지 않는 사람도 있을 수 있다. 전 국민 전수검사를 하지 않는 이상 이들까지 완벽하게 다 찾아낼 수는 없다. 따라서 실제 감염자수는 확진자수보다 많을 가능성이 있다. 정확한 감염자수를 알기 어렵기 어렵다는 것이, 감염자수가 공식 통계에 포함되지 않는 이유일 수 있다.
감염, 확진, 완치는 시차를 두고 일어난다. 먼저 감염이 되고 이후 검사를 받고 확진이 된다. 확진자 중에 증상이 심한 사람은 치료를 받고, 증상이 없거나 증상이 경미한 사람은 격리되어 생활한다. 시간이 지나 확진자를 다시 검사해 코로나19 바이러스가 검출되지 않은 사람들은 완치자로 분류한다. 감염-확진-완치의 과정에서 사망하는 사람들이 있는데, 이들은 확진과 완치 사이의 한 시점에 사망한다. 때로는 사망한 후에 검사를 통해 확진되는 특별한 상황이 있기도 하다.
머지않은 미래에 코로나19로 인한 감염이 종식되면, 총 확진자수는 총 완치자수와 총 사망자수를 더한 값이 된다. 하지만, 지금과 같이 아직 코로나19 감염이 계속되는 상황에서는 그날그날 발표되는 총 확진자수는 총 완치자수와 총 사망자수를 더한 값보다 크다. 그 차이는 현재 치료 중이거나 격리 중인 사람들의 총수와 같다.
확진자를 찾아내는 시점과 확진자수는 감염자를 찾아내는 전략에 따라 달라질 수 있다. 증상이 나타나는 사람만 검사하는 경우, 증상 유무에 관계없이 확진자와 접촉한 사람도 검사하는 경우, 증상 유무 또는 확진자 접촉 여부와 관계없는 특정 집단 사람들까지 검사하는 경우 등 여러 검사 전략이 있다. 무증상 감염자를 찾아내거나 증상이 나타나기 이전에 감염자를 찾아내는 전략을 쓸 경우 그만큼 일찍 감염자를 찾아낼 수 있지만, 검사 전략 강도가 약해지면 그만큼 더 늦게 감염자를 찾아내게 된다. 이를 이용하면 반대로 감염과 확진 사이의 시차로부터 감염자를 찾아내는 전략을 추정해 볼 수도 있다.
여기에서 감염과 완치 사이의 시차를 주목할 필요가 있다. 어떻게 치료하느냐, 감염자의 나이가 어떠냐 등에 따라 그 시차가 달라질 수 있다. 아직 획기적인 치료약이 나온 상황이 아니고 감염된 사람의 나이도 다른 것을 고려하면 시차의 분포보다 시차의 평균을 보면 문제가 좀 더 간단해진다.
‘확진-완치’ 시차는 평균 35일…100일까진 선제적 검사 위력
코로나 19 관련 통계에는 확진자수가 발표되므로 감염 시점이 아닌 확진 시점이 데이터에 나오고, 완치 시점은 완치자 데이터에 나온다. 먼저 확진과 완치 사이의 시차를 알아본 다음, 감염과 확진 사이의 평균 시차를 더하면 감염과 완치 사이의 평균 시차를 계산할 수 있다.
완치자수에서 확진자수를 계산할 때는 치사율을 고려할 필요가 있다. 확진자수에 치사율을 곱하면 사망자수가 나온다. 확진자수에서 이 사망자수를 뺀 숫자가 완치자수다. 한국의 코로나19 치사율은 약 2.4%이므로, 완치자수를 0.976(=1.0-0.024)로 나누면 과거 시점의 확진자수가 거의 비슷한 값이 나온다. 이를 과거의 확진자 데이터와 비교해 평균적인 ‘확진-완치 시차’를 추정해 볼 수 있다.
아래의 그림은 완치자수 데이터(파란색 마름모)를 0.976으로 나눈 후 35일 전으로 옮긴 데이터(밝은 파란색 마름모)를 확진자수 데이터 (검은색선 동그라미)와 비교하는 그래프다. 신천지발 감염자의 확진 증가 추세가 한풀 꺾인 시기(50~60일차)에 두 데이터는 거의 비슷한 추세를 보여준다. 이 기간의 검사 전략을 기준으로 보면 35일차가 상당히 적절한 ‘확진-완치 시차’임을 알 수 있다. 이 시차를 적용해 계산한 데이터를 ‘확진되었어야 할 사람수’라고 부르겠다.
그림 1. ‘확진되었어야 할 사람수’는 완치자수를 0.976(=1-0.024)로 나눈 후 왼쪽으로 35일 이동한 데이터다. 50일차(3월10일)에서 60일차(3월20일) 사이는 ‘확진자수’와 거의 비슷함을 알 수 있다. (확진자수, 완치자수 데이터 출처: 질병관리본부 [1][2])
하지만 ‘확진되었어야 할 사람수’는 어느 때를 비교하는가에 따라 실제 ‘확진자수’와 차이가 나기도 한다. 대표적인 시기가 45일차 이전이다. ‘확진자수’ 곡선은 ‘확진되었어야 할 사람수’ 아래에 위치한다. 신천지 관련 감염자수가 폭증한 상황에서 뒤늦게 검사를 했기 때문에 ‘확진되었어야 할 사람수’가 실제 ‘확진자수에 비해 훨씬 많아서 나타난 현상이다. 다행히 추적하는 사람들이 거의 명확했기 때문에 빠른 속도로 찾아낼 수 있었고, ‘실제 ‘확진자수’는 빠른 속도로 ‘확진되었어야 할 사람수’와 비슷해진다.
65일차를 넘어서면서부터 100일차까지 실제 ‘확진자수’ 곡선은 ‘확진되었어야 할 사람수’ 곡선 위에 위치한다. 실제로 감염자를 상대적으로 더 많이 찾아냈다고 볼 수 있고, 이는 감염자를 선제적으로 찾아냈다는 의미이기도 하다. 실제 이 기간에 일일 신규확진자 수는 100명 수준에서 10명 수준으로 떨어지는 추세가 나타난다. 선제적으로 감염자를 찾아내 일찍 격리함으로써 감염확산을 막은 결과로 볼 수 있다.
이태원발 확산 분석…5월2일 이후 선제적 확진 ‘마이너스’로
아래 그림에서 보라색 곡선은 ‘확진자수’에서 ‘확진되었어야 할 사람수’를 뺀 값을 그린 곡선이다. 그래프 중간을 가로지르는 가로선은 0을 나타내는 기준선이다. 보라색 곡선이 기준선보다 아래에 위치하면 이미 존재하는 감염자를 상대적으로 뒤늦게 찾아내는 상황이다. 반대로 보라색 곡선이 기준선보다 위에 위치하면 감염자들을 선제적으로 빨리 찾아내는 상황이다. 이런 사실을 고려해 보라색 곡선이 나타내는 데이터를 ‘선제적 확진자수’로 부르겠다.
그림 2. 선제적 확진자수는 실제 ‘확진자수’에서 ‘확진되었어야 할 사람수’를 뺀 값이다. (확진자수, 완치자수, 검사횟수, 해외유입 확진자수(확진자수, 완치자수 데이터 출처: 질병관리본부 [1][2]) 데이터 출처: 질병관리본부 [1][2])
‘선제적 확진자수’ 곡선은 67일차(3월 27일)부터 지속적으로 증가해 79일차(4월 8일)에 최고값을 찍는다. 4월8일은 선제적으로 확진된 사람이 가장 많았을 때라고 볼 수 있다. 질병관리본부가 해외유입 확진자 통계를 내기 시작한 때가 62일차(3월22일)이고 해외유입 사례가 증가하는 기간이 있는데 이 기간과 ‘선제적 확진자수’가 증가했던 기간이 상당히 겹친다. 감염자 해외유입이 본격화되면서 선제적 검사에 적극적이었을 기간이다.
이후 보라색 곡선은 아래로 향한다. ‘선제적 확진자수’가 줄어드는 상황이다. 실제 감염자수가 적었을 수도 있고, 무증상 확진자를 찾아내는 것과 같이 선제적으로 검사하는 사례가 줄어들었을 수도 있다. 이 상황은 100일차를 지날 때까지 지속되고, 그동안 초록색 막대기로 표시한 일일 검사횟수도 동시에 줄어든다.
103일차(5월 2일)에 이르면 ‘선제적 확진자수’는 음수가 된다. 선제적으로 찾아내는 감염자수가 상당히 줄고 감염자를 뒤늦게 찾아내는 경우가 많아지는 상황이다. 감염자 추적이 완화된 것으로도 해석이 가능하며, 이로 인해 찾지 못한 감염자들이 추후 감염 확산을 일으킬 위험이 크다. 이 시점은 많이 모이는 5월 초 연휴 시작 시점과 겹치면서 실제로 감염 확산이 일어났다는 추정을 해볼 수 있다. 5월2일은 용인 66번 확진자가 이태원 클럽에 간 날이기도 하다.
표1. 2월 초중순 한국 코로나19 확진자수와 완치수와 추정 감염자수 비교. 추정 감염자수는 완치자수를 0.976(=1-0.024)로 나누고 40일전으로 되돌린 값이다.
신천지발 확산 분석…31번 환자 확진 때 실제 감염자 5000명 추정
증상이 나타날 때쯤 확진이 된다고 가정을 하면, ‘감염과 확진 사이의 시차’는 대략 코로나19의 평균 잠복기로 볼 수 있다. 평균 잠복기는 보도나 발표마다 조금씩 차이가 있지만 약 5일 정도다. 좀 전에 제시한 평균 ‘확진-완치 시차’ 35일에 평균 잠복기 5일을 더하면 40일이 되고, 이 값을 평균적인 ‘감염-완치 시차’로 볼 수 있다. 이 가정을 기반으로 완치자수 데이터를 40일(=35+5) 전으로 되돌리면, 감염 시점에 따른 감염자수의 증가 추세를 대략 추정할 수 있다. (확진되지 않은 숨은 감염자는 포함되지 않는다.) 이렇게 계산한 감염자수의 증가 추세를 그린 그래프로 신천지발 확진자가 폭증할 때의 실제 감염상황을 들여다볼 수 있다.
그림 3. ‘감염자수’는 완치자수를 0.976(=1-0.024)로 나눈 후 왼쪽으로 40일 이동한 데이터다. 여기에서 감염자수는 확진되지 않은 감염자는 포함하지 않는다. (확진자수, 완치자수 데이터 출처: 질병관리본부 [1][2])
위 그래프를 보면 신천지발 확진자의 시작인 31번 환자가 확진된 2월18일에 이미 5000명이 넘는 감염자가 있었음을 확인할 수 있다. 이날을 포함해 그 이전 세번의 신천지 예배일에 감염자가 얼마나 있었는지는 표1에 나타냈다. 2월2일에는 감염자가 500명이 넘고, 2월9일에 2000명이 넘는 것을 확인할 수 있다. ‘감염-완치 시차’의 오차와 분포를 고려하면 2월2일의 추정 감염자수는 의심해 볼 수 있지만[3], 2월9일의 감염자수가 상당히 컸다는 것은 의심할 여지가 별로 없어 보인다.
윤복원/미국 조지아공대 연구원(전산재료과학센터·물리학)
bwyoon@gmail.com">
bwyoon@gmail.com
주)
[1] 질병관리본부 코로나바이러스감염증-19(COVID-19) http://ncov.mohw.go.kr/
[2] 질병관리본부 보도자료 https://www.cdc.go.kr/board/board.es?mid=a20501000000&bid=0015
[3] 잠복기는 사람에 따라 다르기 때문에 하나의 값이 아닌 여러 값의 분포로 나타난다. 확진후 완치까지 걸리는 시간도 사람마다 다르기 때문에 분포로 나타난다. 이 때문에 완치자수로 추정한 감염자수는 실제 감염자수보다 감염시점 전후로 퍼지는 효과가 있다. 이를 고려하면 완치자수로부터 유도한 추정 감염자수가 적을 때는 그 값이 과대평가 됐을 가능성을 배제해서는 안된다.