• 제목/요약/키워드: 정형 기법

검색결과 703건 처리시간 0.026초

휠체어 탄 인공지능: 자율적 기술에서 상호의존과 돌봄의 기술로 (Artificial Intelligence In Wheelchair: From Technology for Autonomy to Technology for Interdependence and Care)

  • 하대청
    • 과학기술학연구
    • /
    • 제19권2호
    • /
    • pp.169-206
    • /
    • 2019
  • 이 글은 인공지능이 만들어내는 문화적 상상을 분석하면서 기술과 인간 사이의 새로운 윤리를 모색한다. 과학기술을 돌봄물(matter of care)로 이해하는 페미니스트 과학기술학 연구(Puig de la Bellacas, 2011)에 기댄 이 글은 우선 인공지능이 자율성을 문화적 상상으로 강력하게 생산하고 있다는 점에 주목한다. 스스로의 경험과 학습을 통해 새로운 환경에 적응할 수 있는 능력으로 정의된 이 자율성은 기술적 영역을 넘어 이상적인 인간상을 정의하고 있다. 하지만 데이터에 기반한 딥러닝 기법과 무장한 무인 비행기가 예증하듯, 인공지능 기술은 보이지 않는 인간노동과 복잡한 물질적 장치에 의존하고 있으며, 자율성은 허구에 가깝다. 또한 이른바 '조수 기술 (assistant technology)'이 보여주듯, 가사노동을 부불노동화하는 우리 사회의 오래된 젠더화된 노동인식에 기초해 수많은 인간의 돌봄 노동은 비가시화되는 반면, 기계의 돌봄노동은 적극적으로 가시화되고 있다. 또한 인공지능의 문화적 상상은 자율성과 행위능력을 이상적인 인간의 특질로 정의하면서 장애의 몸과 이 몸이 갖는 가치인 연약함과 의존성의 연대는 가치 없는 것으로 만들고 있다. 인공지능과 그 문화적 상상은 능력이 있는 몸(abled-bodies)을 이상화하고 기술의 자율성을 우선 가치로 삼으면서 서로 의존하는 인간과 기술의 현실적 관계를 삭제하고 있다. 결론에서 저자는 우리에게 필요한 기술은 타자의 비정형적인 몸과 인간의 돌봄노동을 가치 없게 여기도록 하는 것이 아니라 이들을 있는 그대로 드러내면서 그 가치를 인정하는 것이어야 한다고 주장한다. 책임 있게 응답하는 기술은 주변화된 존재들에 공감하고 의존성을 긍정하고 연약성 사이의 연대를 촉진하는 것이어야 한다. 저자는 이런 대안적인 기술을 형상화하기 위해 예술가 수 오스틴의 퍼포먼스에서 영감을 얻어 '휠체어 탄 인공지능'을 제안한다. '휠체어 탄 인공지능'은 자율성을 과시하기보다는 타자의 몸과 노동을 부정하지 않고 이들의 존재론적 가능성을 함께 만들어가려 노력하는 상호의존과 돌봄의 기술이다.

텍스트 마이닝 기법을 활용한 고전 추리 소설 작가 간 문체적 차이와 문체 구조에 대한 연구 (A study on detective story authors' style differentiation and style structure based on Text Mining)

  • 문석형;강주영
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.89-115
    • /
    • 2019
  • 본 연구는 고전 추리 소설 작가로 유명한 아서 코난 도일과 애거서 크리스티의 문체적 차이점을 데이터 분석을 통해 제시하고, 나아가 텍스트 마이닝에 입각한 문체 연구의 해석적 방법론을 제시하고자 시행되었다. 추리 소설의 핵심 요소인 사건과 인물에 더해 작가의 문법적인 집필 방식을 문체로 정의하고 분석을 시도하였다. 작가 별로 각 2권, 총 4권의 책을 선정하였으며 문장 단위로 텍스트를 나누어 데이터를 확보하였다. 각 문장에 따른 감성 점수를 부여한 뒤 페이지 진행에 따른 감성을 시각화하였으며, 페이지에 따라 토픽 모델링을 적용하여 소설 속 사건 진행 흐름을 파악할 수 있었다. 동시 발생 매트릭스(co-occurrence matrix)를 구성하고 네트워크 분석(Network Analysis)을 시행함으로써 사건이 진행되는 과정에서 인물들 간 관계의 변화를 확인할 수 있었다. 또한 전체 문장을 총 6가지 문체를 기준으로 문법적인 체계를 나누어 작가 간, 그리고 작품 간 집필 방식의 차이점을 확인하였다. 이러한 일련의 연구 과정은 문체에 대한 이해를 바탕으로 글 전체의 맥락을 파악할 수 있도록 도움을 줄 수 있으며, 나아가 기존에 개별적으로 진행되었던 문체 연구를 통합시킴으로써 문체 구조에 대한 이해를 도울 수 있다. 그리고 이러한 선행된 이해를 통해 온라인 텍스트를 비롯한 비정형 데이터 속 문체의 존재를 발견하고 구체화하는 작업에 기여할 수 있다. 뉴미디어를 포함한 온라인 텍스트를 심도 있게 분석하고자 하는 시도가 증가하고 있는 상황에서 해당 연구들과 연계를 통해 보다 의미 있는 온라인 텍스트 분석에 기여할 것으로 기대된다.

언어네트워크분석을 활용한 한국농수산대학 신입생 자기소개서 분석 - TF-IDF 분석을 기초로 - (Analyzing Self-Introduction Letter of Freshmen at Korea National College of Agricultural and Fisheries by Using Semantic Network Analysis : Based on TF-IDF Analysis)

  • 주진수;이소영;김종숙;김승희;박노복
    • 현장농수산연구지
    • /
    • 제23권1호
    • /
    • pp.89-104
    • /
    • 2021
  • 비정형 데이터인 한국농수산대학 신입생 자기소개서에서 의미 있는 정보를 추출하기 위하여 핵심적인 역할을 하는 단어의 중요도를 평가하는 TF-IDF 가중치를 기초로 한 언어네트워크분석을 하였다. TF-IDF 가중치에 의한 핵심단어는 문항 1에서는 '농업', '수학', '공부', '문제', '친구', 문항 2에서는 '동아리', '식물', '친구', '농업', '작물', 문항 3에서는 '친구', '동아리', '의견', '갈등', '관리', 문항 4에서는 '버섯', '곤충', '아버지', '농업', '농장' 등으로 나타났다. 또한 빈도수는 낮은 단어이지만 핵심단어로 나타난 단어를 보면 문항 1에서는 '수학', '자격증', '성적', '영어', '과학', 문항 2에서는 '식물', '작물', '공부', '쓰레기', '발표', '실험', 문항 3에서는 '동아리', '청소', '봉사', '갈등', '봉사활동', 문항 4에서는 '버섯', '곤충', '양식', '한우', '조경' 등으로 나타났다. 단어들 간의 관계를 시각적으로 분석이 가능한 언어네트워크분석 결과 매개중심성이 높은 단어는 문항 1에서는 '이유', '고등학교', '재학', 문항 2에서는 '쓰레기', '고등학교', '학교', 문항 3에서는 '중요', '오해', '완성', 문항 4에서는 '가공', '사료', '농가'로 나타났다. 연결정도중심성은 문항 1에서는 '고등학교', '탐구', '성적', 문항 2에서는 '쓰레기', '정리', '수업시간', 문항 3에서는 '의견', '회의', '봉사활동', 문항 4에서는 '가공', '공간', '실습'으로 나타났다. 매개중심성 값이 클수록 네트워크의 중앙에 위치하고, 두 범주 사이의 관계가 강할수록 서로 근거리에 위치한다. 연결정도중심성이 클수록 노드의 크기가 크게 나타나며, 노드 연결선은 단어들의 동시 출현 빈도가 높을수록 edge가 굵게 나타났다. 동시 출현 빈도가 높은 즉 상관관계가 높은 단어 조합은 '자격증 - 취득', '문제 - 해결', '과학 - 생명', '오해 - 양보' 등으로 나타났다. 단어 기반의 계층적 클러스터링 기법에 의하여 단어 간 인접, 상호 관계를 계층적으로 나타낸 클러스터 덴드로그램으로 군집의 개수를 결정하였다. 단어들의 군집 간 비유사도의 차이가 큰 군집을 구한 결과 문항 1은 2개, 문항 2와 문항 4는 4개, 문항 3은 5개의 군집으로 분류할 경우 군집내 응집력이 높고, 군집 간 이질성이 큰 적절한 군집을 구할 수 있었다.

Deep Neural Network와 Convolutional Neural Network 모델을 이용한 산사태 취약성 매핑 (Landslide Susceptibility Mapping Using Deep Neural Network and Convolutional Neural Network)

  • 공성현;백원경;정형섭
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1723-1735
    • /
    • 2022
  • 산사태는 가장 널리 퍼진 자연재해 중 하나로 인명 및 재산피해 뿐만 아니라 범 국가적 차원의 피해를 유발할 수 있기 때문에 효과적인 예측 및 예방이 필수적이다. 높은 정확도를 갖는 산사태 취약성도를 제작하려는 연구는 꾸준히 진행되고 있으며 다양한 모델이 산사태 취약성 분석에 적용되어 왔다. 빈도비 모델, logistic regression 모델, ensembles 모델, 인공신경망 등의 모델과 같이 픽셀기반 머신러닝 모델들이 주로 적용되어 왔고 최근 연구에서는 커널기반의 합성곱신경망 기법이 효과적이라는 사실과 함께 입력자료의 공간적 특성이 산사태 취약성 매핑의 정확도에 중요한 영향을 미친다는 사실이 알려졌다. 이러한 이유로 본 연구에서는 픽셀기반 deep neural network (DNN) 모델과 패치기반 convolutional neural network (CNN) 모델을 이용하여 산사태 취약성을 분석하는 것을 목적으로 한다. 연구지역은 산사태 발생 빈도가 높고 피해가 큰 인제, 강릉, 평창을 포함한 강원도 지역으로 설정하였고, 산사태 관련인자로는 경사도, 곡률, 하천강도지수, 지형습윤지수, 지형위치 지수, 임상경급, 임상영급, 암상, 토지이용, 유효토심, 토양모재, 선구조 밀도, 단층 밀도, 정규식생지수, 정규수분지수의 15개 데이터를 이용하였다. 데이터 전처리 과정을 통해 산사태관련인자를 공간데이터베이스로 구축하였으며 DNN, CNN 모델을 이용하여 산사태 취약성도를 작성하였다. 정량적인 지표를 통해 모델과 산사태 취약성도에 대한 검증을 진행하였으며 검증결과 패치기반의 CNN 모델에서 픽셀기반의 DNN 모델에 비해 3.4% 향상된 성능을 보였다. 본 연구의 결과는 산사태를 예측하는데 사용될 수 있고 토지 이용 정책 및 산사태 관리에 관한 정책 수립에 있어 기초자료 역할을 할 수 있을 것으로 기대된다.

Landsat 위성 영상으로부터 Modified U-Net을 이용한 백두산 천지 얼음변화도 관측 (Observation of Ice Gradient in Cheonji, Baekdu Mountain Using Modified U-Net from Landsat -5/-7/-8 Images)

  • 이어루;이하성;박순천;정형섭
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1691-1707
    • /
    • 2022
  • 한반도와 중국 경계에 위치한 백두산의 칼데라호인 천지호는 계절에 따라 해빙과 결빙을 반복한다. 천지 아래에는 마그마 챔버가 존재하며 마그마 챔버의 변화에 의해 온천수의 온도 및 수압 변화와 같은 화산 전조현상이 발생한다. 이에 따라, 천지호 내에서 다른 부분보다 해빙이 빠르며 결빙기에도 늦게 얼며 물표면 온도가 높은 이상지역이 존재하게 된다. 해당 이상지역은 온천수 방출 지역으로, 이상지역의 얼음변화도 값을 통해 화산활동을 모니터링 할 수 있다. 그러나 지리적, 정치적 그리고 공간적 문제로 천지의 이상지역을 주기적으로 관측하기에는 한계가 존재한다. 따라서 본 연구에서는 Landsat -5/-7/-8 광학위성영상으로부터 Modified U-Net 회귀모델을 이용하여 이상지역내의 얼음변화도를 정량적으로 관측하였다. 1985년 1월 22일부터 2020년 12월 8일까지 이상지역을 갖는 83장의 Landsat 영상의 Visible and Near Infrared (VNIR)대역을 활용하였다. 얼음 변화도를 정량적으로 관측을 위해 VNIR대역에서 수체와 얼음과의 상대적인 분광반사도를 활용하여 새로운 데이터를 만들었다. 가시광선대역과 근적외선 대역이 가지고 있는 정보를 최대한 유지하기 위해 2개의 인코더를 가진 U-Net에 적용하여 얼음변화도를 관측하였으며 Root Mean Square Error (RMSE) 140, 상관계수 0.9968의 높은 예측 성능을 보여주었다. 따라서 Modified U-Net을 활용하면 추후 Landsat 영상으로부터 얼음변화도 값을 높은 정확도로 관측하므로 백두산 화산활동을 모니터링하는 방법 중 하나로 사용될 수 있으며, 다른 화산 모니터링 기법과 더불어 활용한다면 더욱 정밀한 화산감시체계 구축이 가능할 것이다.

A Study on Intelligent Skin Image Identification From Social media big data

  • Kim, Hyung-Hoon;Cho, Jeong-Ran
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.191-203
    • /
    • 2022
  • 화장품 및 뷰티산업에서 고객 맞춤형 제품과 서비스를 제공하는 것은 주요 기술 트렌드이고, 피부상태 진단과 관리는 중요한 필수기능이다. 고객의 요구 수준은 더욱더 높아지고 있으며 이에 대한 다양하고 섬세한 고민과 요구 사항이 소셜미디어 커뮤니티에서 활발하게 다루어지고 있다. 소셜미디어 상의 이미지는 매우 다양하고 비정형적이므로 피부상태 진단 및 관리에 필요한 체계적인 피부 이미지 식별을 위한 시스템이 필요하다. 본 논문에서는 소셜미디어 인스타그램에서 수집한 빅데이터로부터 피부 이미지 데이터를 지능적으로 식별하고, 피부상태 진단 및 관리를 위한 정형화된 피부 샘플 데이터를 추출하는 시스템을 개발하였다. 본 논문에서 제안한 시스템은 빅데이터수집분석단계, 피부이미지분석단계, 훈련데이터준비단계, 인공신경망훈련단계, 피부이미지식별단계로 구성된다. 빅데이터수집분석단계에서는 인스타그램으로부터 빅데이터를 수집하고 피부 상태 진단 및 관리를 위한 이미지 정보를 분석결과로 저장한다. 피부이미지분석단계에서는 전통적인 이미지 처리 기법을 사용하여 피부 이미지의 평가 및 분석 결과를 획득한다. 훈련데이터준비단계에서는 피부이미지 분석결과로부터 피부 샘플데이터를 추출하여 훈련데이터를 준비하였다. 그리고 인공신경망훈련단계에서는 이 훈련데이터를 사용하여 지능적으로 피부 이미지 유형을 예측하는 인공신경망 AnnSampleSkin을 단계별 고도화와 훈련을 통해 모델을 완성하였다. 피부이미지식별단계에서는 소셜미디어로부터 수집된 이미지에 대해 피부샘플을 추출하고, 훈련된 인공신경망 AnnSampleSkin의 이미지 유형 예측 결과들을 통합하여 최종 피부 이미지 유형을 지능적으로 식별한다. 본 논문에서 제안된 피부이미지식별 방법은 약 92% 이상의 높은 피부 이미지 식별 정확도를 나타내고 있고, 정형화된 피부 샘플 이미지 빅데이터를 제공할 수 있게 되었다. 추출된 피부샘플 세트는 피부 상태를 진단하고 관리하는데 매우 효율적이고 유용한 정형화된 피부 이미지 데이터로 사용될 것으로 기대된다.

국유림의 경제적·공익적 기능을 고려한 적정 목재생산량 추정 (Estimating Optimal Timber Production for the Economic and Public Functions of the National Forests in South Korea)

  • 정유진;김영환;장윤성;곽두안;박기현;김다영;정형식;한희
    • 한국산림과학회지
    • /
    • 제112권4호
    • /
    • pp.561-573
    • /
    • 2023
  • 국유림은 사유림에 비해 높은 수준의 자본과 기술, 노동력을 투입할 수 있고 상대적으로 집약적인 관리가 가능하다. 따라서 국유림은 장기적인 목재 수요에 대비한 산림자원의 비축기지로서의 역할뿐만 아니라, 사회가 필요로 하는 산림의 다양한 기능을 안정적으로 발휘할 수 있어야 한다. 하지만 현재 국유림은 4영급 이상인 임분이 대부분으로, 영급이 불균형한 상태에서 목재수확기에 도달하고 있다. 따라서 체계적인 경영계획에 의한 목재수확이 이루어지지 않으면 국유림의 다양한 기능의 지속성을 보장하기 어렵다. 본 연구는 국유림의 영급구조를 개선하면서도 경제적·공익적 기능을 지속가능하게 유지하기 위한 국유림의 적정 목재생산량을 추정하는 것을 목표로 하였다. 이를 위해 먼저 국유림 내에서 목재생산에 적합한 지역을 분석하고, 다목적 선형기법을 적용하여 경제적 기능과 공익적 기능을 동시에 고려할 수 있는 산림경영계획모델을 개발하였다. 분석 결과, 국유림 내 목재생산 적합 지역의 면적은 약 488천ha로, 이를 중심으로 목재수확을 적절하게 관리하면 영급분포가 개선되고 공익적 기능도 지속가능하게 유지되는 것으로 나타났다. 향후 100년 동안 국유림에서 생산 가능한 목재량은 연평균 약 200만m3으로, 이는 연간 국산목재 공급량의 44% 수준을 차지하는 것으로 나타났다.

디지털 이미지 처리와 강형식 기반의 무요소법을 융합한 시험법의 모서리 점과 이미지 해상도의 영향 분석 (Analysis of the Effect of Corner Points and Image Resolution in a Mechanical Test Combining Digital Image Processing and Mesh-free Method)

  • 박준원;정연석;윤영철
    • 한국전산구조공학회논문집
    • /
    • 제37권1호
    • /
    • pp.67-76
    • /
    • 2024
  • 본 논문에서는 역학적 변수들을 측정하는 방안으로 디지털 이미지 프로세싱과 강형식 기반의 MLS 차분법을 융합한 DIP-MLS 시험법을 소개하고 추적점의 위치와 이미지 해상도에 대한 영향을 분석하였다. 이 방법은 디지털 이미지 프로세싱을 통해 시료에 부착된 표적의 변위 값을 측정하고 이를 절점만 사용하는 MLS 차분법 모델의 절점 변위로 분배하여 대상 물체의 응력, 변형률과 같은 역학적 변수를 계산한다. 디지털 이미지 프로세싱을 통해서 표적의 무게중심 점의 변위를 측정하기 위한 효과적인 방안을 제시하였다. 이미지 기반의 표적 변위를 이용한 MLS 차분법의 역학적 변수의 계산은 정확한 시험체의 변위 이력을 취득하고 정형성이 부족한 추적 점들의 변위를 이용해 mesh나 grid의 제약 없이 임의의 위치에서 역학적 변수를 쉽게 계산할 수 있다. 개발된 시험법은 고무 보의 3점 휨 실험을 대상으로 센서의 계측 결과와 DIP-MLS 시험법의 결과를 비교하고, 추가적으로 MLS 차분법만으로 시뮬레이션한 수치해석 결과와도 비교하여 검증하였다. 이를 통해 개발된 기법이 대변형 이전까지의 단계에서 실제 시험을 정확히 모사하고 수치해석 결과와도 잘 일치하는 것을 확인하였다. 또한, 모서리 점을 추가한 46개의 추적점을 DIP-MLS 시험법에 적용하고 표적의 내부 점만을 이용한 경우와 비교하여 경계 점의 영향을 분석하였고 이 시험법을 위한 최적의 이미지 해상도를 제시하였다. 이를 통해 직접 실험이나 기존의 요소망 기반 시뮬레이션의 부족한 점을 효율적으로 보완하는 한편, 실험-시뮬레이션 과정의 디지털화가 상당한 수준까지 가능하다는 것을 보여주었다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.