국문초록
논문은 『황성신문』 창간호부터 1904년 12월 30일까지 일본 관련 잡보란 기사를 대상으로 원시 코퍼스의 구조화, 토픽모델링, 개체명 인식 그중 지명 태깅, QGIS를 활용한 공간 시각화 과정까지의 워크플로우를 제시하고 이를 통해 일본의 대한정책이 공간 점유와 긴밀히 연동하는 과정을 검토하고자 하였다.
분석은 다음과 같은 단계를 거쳐 이루어졌다. 우선 한글파일로 입력된 원시 코퍼스를 분석 가능한 형태로 변환하기 위해 정규화 과정을 거친 후, 날짜, 제목, 본문을 순차적으로 추출하는 방식으로 파싱을 진행하였다. 본격적인 분석은 토픽모델링을 통한 주제적 분포 확인, 개체명 인식(NER)을 활용한 태깅, 지역명(LC) 정보를 보완, 관련 데이터셋을 재구축하여 지리정보처리 도구 QGIS를 활용해 시기별 공간 분포에 대한 변화를 추적하였다. 이미 원시코퍼스 단계에서부터 주요 토픽이 설정되었기 때문에 토픽모델링은 분석 대상이 되는 전체 1,679개 기사의 주제 지형도를 확인하는 차원에서 보조적으로 사용하였다. 연도별과 월별로 기사 빈도표를 작성하고 농업, 임업, 어업 관련한 기사 등장 연월 구분표를 작성하여 계절별로 수탈 물자와 장소가 변화하는 양상을 지도 자료로 시각화하였다. 또한 1898년부터 1904년까지 기사 중 시간이 구체적으로 언급된 기사를 대상으로 타임라인을 작성하여 1904년 러일전쟁을 전후로 하여 시간적 리듬에 변화가 발생함을 관찰하였다.
1898년부터 1904년까지 일본의 대한정책 관련 잡보 기사에서 언급된 지명을 지도상에 표시한 결과, 점의 분포가 해안가를 따라 집중적으로 생성된 후 내륙으로 점차 들어오며 한반도 전역을 뒤덮는 양상을 띠고 있음을 확인할 수 있다. 이러한 결과는 1904년 무렵 이미 일본의 식민화 과정이 상당부분 이뤄졌다고 판단할 수 있는 근거가 될 수 있다.
특히 러일전쟁 시기 기사를 공간적으로 분석한 결과 평양-함흥-단천-길주를 잇는 최북단 연결선을 중심으로 일본과 러시아가 형성한 전선, 일본의 한반도 장악 범위를 확인할 수 있다. 평안북도 의주, 함경북도 경성 등지는 러시아군의 근거지로 활용되는 곳이었고 북진하는 일본군과 남하한 러시아군이 정주, 영변, 박천, 성진 등지에서 국지적 교전을 벌이며 세력을 다퉜다.
1904년 7월을 전후로 서울 종로에서는 보안회를 중심으로 조직화된 형태의 저항이 등장하였으며 압록강 일대에서는 저항군이 통신선, 철도 노선을 차단하는 등 게릴라 활동을 전개하였다. 1904년까지의 시기는 일본의 군사적, 행정적 공간 점유가 집중적으로 전개된 시기로 그 일방성과 폭력성, 가속성 속에서 조선 사회 전반이 구조적인 충격을 경험하였다. 하지만 1904년 7월 이후로 가면 이에 대응하는 조선인의 다양한 형태의 저항이 맞물리며 공간적 동역학이 본격화하는 양상을 확인할 수 있다.
주제어
『황성신문』, 잡보란, 토픽모델링, 개체명인식, 지도시각화, 러일전쟁 전선 형성, 식민화 공간적 전개