• Title/Summary/Keyword: Data Sets

검색결과 3,753건 처리시간 0.033초

기후 변화 적응을 위한 벡터매개질병의 생태 모델 및 심층 인공 신경망 기반 공간-시간적 발병 모델링 및 예측 (Spatio-Temporal Incidence Modeling and Prediction of the Vector-Borne Disease Using an Ecological Model and Deep Neural Network for Climate Change Adaption)

  • 김상윤;남기전;허성구;이선정;최지훈;박준규;유창규
    • Korean Chemical Engineering Research
    • /
    • 제58권2호
    • /
    • pp.197-208
    • /
    • 2020
  • 본 연구에서는 발병 횟수가 빠르게 증가하고 있는 벡터매개질병(vector-borne disease) 중 하나인 쯔쯔가무시증의 발병 특성을 공간적 그리고 시간적으로 분석하고 기후변화 시나리오에 따른 미래 발병 특성을 예측하였다. 쯔쯔가무시증의 공간적 분포와 발병률을 예측하기 위하여 환경 그리고 사회 변수의 공간적 특성을 이용하여 maximum entropy(MaxEnt) 생태 모델을 구성하고, 주요 변수의 쯔쯔가무시증 발병에 관한 상관관계를 분석하였다. 공간 특성 중 환경변수인 고도 및 기온이 주요한 변수로 분석되었으며, 이는 쯔쯔가무시증의 매개체인 털진드기의 생육 환경과 주요 관련이 있는 것으로 나타났다. 쯔쯔가무시증의 시간적 발병 횟수는 심층 인공 신경망 모델기반 예측을 하였으며, 특히 쯔쯔가무시증의 주요 특성인 지연 효과를 고려하여 모델을 구성하였다. 심층 인공 신경망을 이용한 예측 결과 여름철의 기온, 강우량, 그리고 습도가 털진드기의 활동에 주된 관련이 있으며 가을철의 쯔쯔가무시증 발병 횟수에 영향을 끼치는 것으로 확인 되었다. 또한, 기존 통계적 예측 모델과 비교하였을 때, 심층 인공 신경망 기반 예측 모델의 예측 정확성이 우수함을 확인하였다. 공간적 그리고 시간적 모델에 기후 변화 시나리오를 이용하여 2040년의 쯔쯔가무시증 발병 특성을 예측한 결과, 최대 발병률이 8% 증가, 발병률이 높은 지역이 9% 확대, 그리고 주된 발병 기간이 2개월 증가하였다. 본 연구 결과를 통해 쯔쯔가무시증의 공간적 및 시간적 발병 특성 분석을 통하여, 공중보건 측면에서 벡터매개 질병 발병 요인 규명을 통해 주민 건강을 위한 질병 관리 및 예측에 기여할 수 있을 것으로 기대한다.

이러닝 적용을 위한 뇌파기반 인지부하 측정 (EEG based Cognitive Load Measurement for e-learning Application)

  • 김준;송기상
    • 인지과학
    • /
    • 제20권2호
    • /
    • pp.125-154
    • /
    • 2009
  • 본 연구는 이러닝 체제에서 상호작용을 개선할 수 있도록 하기 위하여 사용자의 생리적 데이터 가운데서 뇌파를 통하여 학습자의 인지부하 발생을 파악할 수 있는 지를 연구하고자 하였다. 뇌파를 통하여 인지부하 발생을 알 수 있게 된다면 실시간 이러닝 체제에서 적절한 피드백 제공에 활용될 수 있기 때문이다. 이를 위하여 EEG를 이용하여 학습자의 뇌파를 측정하면서 인지활동을 수행하는 동안 발생되는 인지부하도를 측정하였고 인지과부하를 판별할 수 있는지를 알아보았다. 뇌파 측정을 위하여 언어 관련 작업기억 능력을 측정할 수 있는 듣기회상과제를 제시하였으며, 실험을 통한 과제 정답률 및 뇌파 분석 결과는 다음과 같다. 첫째, 듣기회상과제의 정답률은 회상반응과제에서 1단계는 84.4%, 2단계는 90.6%, 3단계는 62.5%, 4단계는 56.3%를 보였으며, 통계적으로 유의한 차이가 있음을 확인하였다. 즉, 3, 4단계의 경우는 피험자들이 매우 어려움을 겪었던 단계로 인지과부하가 발생했을 것으로 보인다. 둘째, SEF-95% 지표는 1, 2단계에 비해 3, 4단계에서 더욱 높은 값을 보였으며, 이는 피험자들의 인지부하가 3, 4단계에서 높았음을 객관적으로 보여주는 근거이다. 셋째, 감마파의 상대파워는 3, 4단계에서 파워값이 급격히 올라가는 패턴을 보였으며, 통계적으로 유의한 5개의 채널(F3, F4, C4, F7, F8)을 확인하였다. 5개의 채널은 뇌의 브로카 영역(F7, F8) 주위에 위치하고 있으며, 특히 뇌맵핑 분석을 통해 확인한 결과, F8(우반구의 브로카 영역에 해당하는 위치)에서 단계별 난이도가 올라갈수록 활성화의 차이가 크게 나타났다. 넷째, 19채널에 대한 상호 상관 분석을 통해 1, 2단계에 비해 3, 4단계에서 비동기화가 증가하였다. 위의 결과를 통한 본 연구의 결론은 뇌파를 이용하여 인간이 인지활동을 수행하는 동안 인지부하도를 측정할 수 있으며, 인지과부하를 판별해 낼 수 있음을 확인하였다.

  • PDF

산란계의 전염성 기관지염을 예측하기 위한 인공신경망 모형의 개발 (Development an Artificial Neural Network to Predict Infectious Bronchitis Virus Infection in Laying Hen Flocks)

  • 박선일;권혁무
    • 한국임상수의학회지
    • /
    • 제23권2호
    • /
    • pp.105-110
    • /
    • 2006
  • 2003년 5월부터 2005년 11월까지 산란계의 전염성기관지염(IB) 예찰 프로그램에 등록한 농장에 대한 역학조사에서 얻은 자료에 근거하여 IB 감염을 확인할 수 있는 모형을 구축하기 위하여 16개의 입력 뉴런, 3 개의 은닉 뉴런, 1개의 출력 뉴런으로 구성된 3층 인공신경망 모형을 개발하였다. 총 86개의 계군 중 77개는 훈련자료에 할당하고 나머지 9개는 검정자료로 무작위로 할당하여 back-propagation algorithm으로 신경망 훈련을 수행하였다. 입력 뉴런은 산란계군의 특성, 사양관리, 계군의 크기 등 16개의 역학조사 항목을 사용하였으며 출력 뉴런은 IB 감염의 유무로 투입하였다. 훈련된 신경망을 검정자료에 적용하여 민감도와 특이도를 산출하였으며 진단의 정확도는 receiver operating characteristic (ROC) 곡선을 사용하여 곡선 밑의 면적(AUC)을 계산하여 평가하였다. 입력 뉴런의 특성과 훈련모수를 변경하면서 다양한 신경망을 구성하였으며 최적의 신경망으로 확인된 IBV_D1 신경망의 경우 훈련자료에 대하여 77건 중 73건을 올바르게 판단하여 94.8%의 정확도를 보였다. 민감도와 특이도는 각각 95.5% (42/44, 95% CI, 84.5-99.4)와 93.9% (31/33, 95% CI, 79.8-99.3)로 나타났다. 훈련된 신경망을 검정자료에 적용하여 ROC 곡선을 작성한 결과 AUC는 전체의 94.8% (SE=0.086, 95% CI 0.592-0.961)를 차지하는 우수한 모형으로 나타났다. ROC 곡선에서 기준을 0.7149 이상으로 판단할 때 진단의 정확도가 88.9%로 가장 높았으며 100%의 민감도를 달성하였다. 이러한 민감도와 특이도에서 44%의 IB 유병률을 가정할 때 IBV_D1 모형은 80%의 양성예측도와 100%의 음성예측도를 보였다. 이러한 소견에 근거할 때 본 연구에서 구축한 신경망 모형은 산란계군에서 IB의 존재를 확인하기 위한 목적에 성공적으로 응용될 수 있을 것으로 판단되었다.

유사도 알고리즘을 활용한 시맨틱 프로세스 검색방안 (Semantic Process Retrieval with Similarity Algorithms)

  • 이홍주
    • Asia pacific journal of information systems
    • /
    • 제18권1호
    • /
    • pp.79-96
    • /
    • 2008
  • One of the roles of the Semantic Web services is to execute dynamic intra-organizational services including the integration and interoperation of business processes. Since different organizations design their processes differently, the retrieval of similar semantic business processes is necessary in order to support inter-organizational collaborations. Most approaches for finding services that have certain features and support certain business processes have relied on some type of logical reasoning and exact matching. This paper presents our approach of using imprecise matching for expanding results from an exact matching engine to query the OWL(Web Ontology Language) MIT Process Handbook. MIT Process Handbook is an electronic repository of best-practice business processes. The Handbook is intended to help people: (1) redesigning organizational processes, (2) inventing new processes, and (3) sharing ideas about organizational practices. In order to use the MIT Process Handbook for process retrieval experiments, we had to export it into an OWL-based format. We model the Process Handbook meta-model in OWL and export the processes in the Handbook as instances of the meta-model. Next, we need to find a sizable number of queries and their corresponding correct answers in the Process Handbook. Many previous studies devised artificial dataset composed of randomly generated numbers without real meaning and used subjective ratings for correct answers and similarity values between processes. To generate a semantic-preserving test data set, we create 20 variants for each target process that are syntactically different but semantically equivalent using mutation operators. These variants represent the correct answers of the target process. We devise diverse similarity algorithms based on values of process attributes and structures of business processes. We use simple similarity algorithms for text retrieval such as TF-IDF and Levenshtein edit distance to devise our approaches, and utilize tree edit distance measure because semantic processes are appeared to have a graph structure. Also, we design similarity algorithms considering similarity of process structure such as part process, goal, and exception. Since we can identify relationships between semantic process and its subcomponents, this information can be utilized for calculating similarities between processes. Dice's coefficient and Jaccard similarity measures are utilized to calculate portion of overlaps between processes in diverse ways. We perform retrieval experiments to compare the performance of the devised similarity algorithms. We measure the retrieval performance in terms of precision, recall and F measure? the harmonic mean of precision and recall. The tree edit distance shows the poorest performance in terms of all measures. TF-IDF and the method incorporating TF-IDF measure and Levenshtein edit distance show better performances than other devised methods. These two measures are focused on similarity between name and descriptions of process. In addition, we calculate rank correlation coefficient, Kendall's tau b, between the number of process mutations and ranking of similarity values among the mutation sets. In this experiment, similarity measures based on process structure, such as Dice's, Jaccard, and derivatives of these measures, show greater coefficient than measures based on values of process attributes. However, the Lev-TFIDF-JaccardAll measure considering process structure and attributes' values together shows reasonably better performances in these two experiments. For retrieving semantic process, we can think that it's better to consider diverse aspects of process similarity such as process structure and values of process attributes. We generate semantic process data and its dataset for retrieval experiment from MIT Process Handbook repository. We suggest imprecise query algorithms that expand retrieval results from exact matching engine such as SPARQL, and compare the retrieval performances of the similarity algorithms. For the limitations and future work, we need to perform experiments with other dataset from other domain. And, since there are many similarity values from diverse measures, we may find better ways to identify relevant processes by applying these values simultaneously.

국내 듀록의 종돈장간의 교류현황과 유전능력평가에 미치는 효과 (The Situation of Genetic Exchange in Duroc Breed and Impacts on Genetic Evaluation)

  • 서재호;신지섭;노재광;송치은;도창희
    • Journal of Animal Science and Technology
    • /
    • 제53권5호
    • /
    • pp.397-408
    • /
    • 2011
  • 국내 듀록 품종 종돈의 교류현황과 또한 유전자원 교류가 국가단위의 유전능력평가에 미치는 영향을 평가하고, 돼지개량네트워크 사업을 통한 돼지개량 전략 마련을 위한 기초자료를 수집하기 위하여 한국종축개량협회의 등록 및 검정 자료를 분석하였다. 자료는 세 곳의 등지방 두께(어깨, 등, 허리)와 등심단면적, 90 kg 도달일령 그리고 일당증체량 형질을 포함하고 있으며, 1987년부터 2010년까지 총 235,511건의 등록 자료와 70,747건의 검정자료를 이용하였다. 수집된 듀록 자료를 분석한 결과, 종돈장간의 유전자원의 교류는 극히 미미한 수준으로 나타났다. 등록 후에 검정까지 수행 되어진 자료의 수는 더욱 적은 것으로 나타났고, 유전능력평가를 위해 필요한 일정규모의 두 수를 가진 종돈장의 수는 더욱 적었다. 혈연관계의 이용정도에 따라 세 가지 분류의 자료(개별 종돈장, 두개의 종돈장 그룹, 전체 종돈장)를 이용한 유전능력 평가 및 유전 모수의 추정에 있어서, 개별 종돈장 분석에서 종돈장간에 유전모수추정에 있어 거점 종돈장에 비하여 종속 종돈장의 유전력이 높은 경향을 보여 주었다. 유전력 추정 오차는 개별 종돈장, 두 그룹, 전체 집단 순으로 작게 나타났다. 유전분산이 종속 종돈장들에서 크게 나타남으로써 종속 종돈장들의 유전적 균일성이 거점 종돈장들에 비해 낮은 것으로 나타났다. 근친계수의 추정에서 차이를 보였으며, 개별 종돈장, 거점 종돈장과 종속 종돈장, 그리고 전체 집단을 평가하였을 때 각각 평균 근친이 1.12, 0.95 그리고 1.53으로 나타나 종돈장 간의 혈연관계를 고려한 전체 집단 평가에서 근친이 높았다. 추정된 육종가에 의한 상관계수에서 개별농가의 평가와 전체평가간의 상관이 가장 낮았다. 반면에 sub-population 평가와 개별농가 평가, 그리고 전체 평가는 이보다 상관이 높게 나타났다. 그러나 농장별 평가와 전체평가간의 상관계수가 이동된 종돈에서 형질별로 0.22에서 0.45, 그리고 전체 종돈에서 0.24에서 0.72의 범위로 비교적 낮게 나타났다. 연구된 결과들은 개별 종돈장 평가 보다는 국가단위의 유전능력평가가 혈연관계를 더 많이 이용하고, 돼지개량네트워크 사업이 종돈장간의 연결성을 증대시켜 국가단위 유전능력평가의 정확도에 기여한다고 사료된다.

임하 다목적댐 건설 후 주변지역 기후 및 작물생산력 변화 (Simulation of Local Climate and Crop Productivity in Andong after Multi-Purpose Dam Construction)

  • 윤진일;황재문;이순구
    • 한국작물학회지
    • /
    • 제42권5호
    • /
    • pp.579-596
    • /
    • 1997
  • 1990년 임하 다목적댐 건설에 의해 경북 안동지역에 생성된 담수면적 28.7$\textrm{km}^2$의 임하호가 주변지역의 국지기후 및 주요 작물의 잠재생산력에 미친 영향을 구명하기 위해 임하호 주변 $30km\times 25km$ 지역을 대상으로 무인기상관측망을 구성, 5년간의 특별관측을 수행하였다. 수집된 자료를 토대로 담수전후 기후시나리오를 작성하고 이를 작물모형에 입력하여 최종 건물생산량을 추정한 바, 주요 결과는 다음과 같다. 1. 담수후 5년간 일최고기온은 담수 전보다 평균적으로 한후기 (10월~3월)에 상승하고 난후기에 하강하였으나, 예외적으로 6월과 7월에는 상승하였다. 일최저기온은 담수 전보다 평균적으로 난후기(4월~8월)에 하강하고 한후기에 상승하였다. 담수 전후 기온의 변화정도는 겨울철에 크고 여름철에 적었다. 2. 담수후 5년간 강수량은 담수 전보다 평균적으로 2, 3, 5, 7, 12월에 증가하였고 나머지 달에는 감소하였으나 연간 총강수량의 변화는 인정되지 않았다. 월별 일사량은 2, 6, 9월을 제외하고는 담수전에 비해 5% 가량 감소하였다. 3. 담수 전후 30년간씩의 벼 생육모의실험에서 대상지역내 27개 재배구역 중 담수에 의해 잠재수량의 변화가 인정되는 곳은 한 곳 뿐으로 담수전에 비해 정조 기준 4%의 증가를 보였다. 4. 담수 전후 30년간씩의 콩 생육모의실험에서 대상지역내 27개 재배구역 중 담수에 의해 잠재수량 감소가 인정되는 곳이 2개였으며 최대 감수율은 16%였다. 5. 담수 전후 30년간씩의 옥수수 생육모의실험에서 담수에 의해 옥수수의 잠재수량 감소가 인정되는 곳이 총 27개 중 6개였고 최대 감수율은 17%였다.. 또한 유수의 크기는 전 유수발달기를 통하여 항상 밀양 2003가 고시히카리보다 컸다. the canopies with more leaf mass, making MB the highest, HB the lowest, and DS in between. Relative humidity was over 90% in the night and dropped to 70% in the mid-afternoon, but vapor pressure within the canopy was highest at around 13:00 LST. Dew point depression was lowest and, combined with the temperature, the relative humidity was highest in HB. Mean period of wetting duration was in the order of DS>HB>MB, while the dew point depression was greatest in DS.ANCOVA, Pearson correlation을 이용하여 분석하였으며, 그 결과는 다음과 같다. 캠프 프로그램은 소아 당뇨병 환자의 자기 효능을 증진시키고 환자 역할 행위 이행을 높여주는데 효과적 이었다. 소아 당뇨병 환자의 자기 효능은 환자 역할 행위 이행과 순 상관 관계가 있어, 자기 효능이 증진될수록 환자 역할 행위 이행 정도가 높아졌다. 무조건 사주지 않는다(8.0%), 무조건 사준다(3.1%)로 식품광고에 나오는 식품 요구시 부모의 70.3%가 거절하는 것으로 나타났다. 거절 이유는 건강에 나쁘다는 것이 가장 큰 이유였으며 강남과 강북 어린이간에 유의적인 차이가 있었다(p<0.001). TV

  • PDF

문헌정보학 실습실의 교수매체 센터화에 관한 연구 (A Study on the Transformation of Traditional Laboratories into Instructional Media Centers for Education of Library and Information Science)

  • 이만수
    • 한국문헌정보학회지
    • /
    • 제34권1호
    • /
    • pp.265-295
    • /
    • 2000
  • 본 연구에서는 32개 대학 문헌정보학과 실습실의 시설과 비품, 그리고 교수 학습자료를 조사 분석하고 교수와 사서들의 의견을 정리하여, 21세기 정보사회에 부응할 수 있는 정보전문가인 사서 양성을 위하여 문헌정보학 교과 운영을 충실히 할 수 있는 실습실의 발전된 모형으로서 교수매체 센터의 새로운 모형을 제시하였는데 요약하면 다음과 같다. (1) 문헌정보학 교수매체 센터에는 분류와 편목의 실습 수업을 할 수 있는 분류 편목 실습실과 첨단의 매체나 시청각 기재 또는 실습용 교구를 사용하여 수업을 할 수 있는 영상매체 실습실, 인터넷을 통한 다양한 정보 검색 방법을 체득하게 하고, 정보 활용 능력을 길러 주며, 컴퓨터 관련 정보학 교과 수업을 할 수 있는 정보처리 실습실을 둔다. (2) 분류 편목 실습실과 영상매체 실습실, 정보처리 실습실의 배치도는 <그림4-1>, <그림4-2>, <그림4-3>과 같다. (3) 각 실의 면적은 각각 $162m^2$(49.1평)이며, 수용인원은 40-50명 정도, 전담운영 관리자로 매체 전문가 1 명과 전담 조교 1명을 둔다. (4) 문헌정보학 교수매체 센터에 소장해야 할 교수 학습자료는 컴퓨터와 주변기기, 시청각 기재, 도서정리를 위한 용품, 각종 장비 및 용구 등과 같은 교구와, 실습용 교재, 실습용 분류와 편목에 관한 도서, 기타 실습용 도서 및 참고도서 등과 같은 교재이다. (5) 문헌정보학 교수매체 센터의 비품으로 실습용 테이블, 서가 등 일반 비품과 CD 보관함 등 각종 자료 보관함을 둔다.

  • PDF

6300 $\AA$ 대기광 자료 분석을 통한 고위도 열권 상부에서의 온도 변화 (A STUDY ON TEMPERATURE VARIATION OF THE UPPER THERMOSPHERE IN THE HIGH LATITUDE THROUGH THE ANALYSIS OF 6300 $\AA$ AIRGLOW DATA)

  • 정종균;김용하;원영인;이방용
    • Journal of Astronomy and Space Sciences
    • /
    • 제14권1호
    • /
    • pp.94-108
    • /
    • 1997
  • 열권 상부의 온도는 일반적으로 태양 활동에 따라 변화하며, 특히 고위도 지역에서는 지자기 활동에 의해서도 크게 변화된다. 본 연구에서는 장기간에 걸쳐 관측된 열권 온도를 이용하여 태양 활동 지수 및 지자기 활동 지수와의 상관 관계를 정량적으로 분석하였다. 본 연구에서 사용된 온도 자료는 미시간 대학에서 운용하고 있는 그린랜드의 두 관측소인 Thule Air Base(76.6$^{\circ}$N, 68.4$^{\circ}$W, Λ = 86$^{\circ}$)와 Strømfjord (67.0$^{\circ}$N,50.9$^{\circ}$W, Λ - 74$^{\circ}$)에서 측정된 것으로 두 곳 모두 지리적 뿐만 아니라 지자기적으로도 고위도 지역에 위치하고 있다. 자료는 페브리-페로 간섭계를 이용하여 6300 $\AA$ 대기광을 관측한 것이며 관측기간은 Thule Air Base 관측소는 1986~1991년, Søndre Strømfjord 관측소는 1986~1994년이다. 본 연구에서 얻어진 분석 결과는 다음과 같다. (1)Thule 지역의 관측 온도와 태양 활동 지수와의 상관 관계는 3$\leq$Kp$\leq$4에서 가장 높게 나타나며 Søndre Strøfjord 지역의 상관 관계는 Kp 지수가 커질수록 증가함을 보인다. (2) 전반적인 온도는 고위도 지역인 Thule 지역에서 높지만, 태양 활동 지수 변화에 따른 온도 변화의 증가율은 Søndre Strømfjord 지역에서 더 크게 나타났다. (3) 겨울철 Thule 지역의 하루 온도 변화는 13-14 LT(LT=UT-4) 부근에 최대 온도를 가진 일일 주기(24hrs) 변화를 보이지만, 태양 활동이 미약한 경우에는 반일 주기 (12 hrs) 변화가 우세하게 나타났다. (4) 고층 대기분야에서 통용되는 MSIS86 모델과 VSH 모델은 여기서 분석된 관측치에 비해 전반적으로 낮은 온도를 예측하고 있으며, 이러한 차이는 특히 태양 활동이 증가함에 따라 더욱 심해짐을 보였다. 따라서 보다 많은 관측 자료를 이용한 새로운 열권 모델의 개발이 시급하다고 생각된다.

  • PDF

일반화된 4차원 특징을 이용한 행동 방향 인식 (Recognizing the Direction of Action using Generalized 4D Features)

  • 김선정;김수완;최진영
    • 한국지능시스템학회논문지
    • /
    • 제24권5호
    • /
    • pp.518-528
    • /
    • 2014
  • 본 논문에서는 4차원 시공간 (4D-ST, [x,y,z,t]) 특징을 이용하여 행동 방향을 인식하는 방법을 제안한다. 이를 위해 4차원 시공간 특징점 (4D-STIPs, [x,y,z,t])을 제안하였고, 이는 여러 다른 뷰에서 촬영한 이미지들로부터 복원된 3차원 공간 (3D-S, [x,y,z]) 볼륨으로부터 계산된다. 3차원 공간정보를 갖고 있는 3D-S 볼륨과 4D-STIPs는 2차원 공간 (2D-S, [x,y]) 뷰로 사영을 하여 임의의 2D-S 뷰에서의 특징을 생성해 낼 수 있다. 이 때, 사영 방향을 결정 할 수 있으므로, 학습 시 방향에 대한 정보를 포함하여 행동 방향을 인식 할 수 있다. 행동 방향을 인식하는 과정은 두 단계로 나눌 수 있는데, 우선 어떤 행동인지를 인식하고 그 후, 방향 정보를 이용하여 최종적으로 행동 방향을 인식한다. 행동 인식과 방향 인식을 위해, 사영된 3D-S 볼륨과 4D-STIPs은 각각 움직이는 부분과 움직이지 않는 부분에 대한 정보를 담고 있는 motion history images (MHIs)와 non-motion history images (NMHIs)로 구성된다. 이러한 특징들은 행동 인식을 위해, 방향 정보에 상관없이 같은 행동이면 같은 클래스로 분류되어 support vector data description (SVDD) 분류기로 학습되고, support vector domain density description (SVDDD)을 이용하여 인식된다. 인식된 행동에서 최종적으로 방향을 인식하기 위해 각 행동을 방향 클래스로 분류하여 SVDD 분류기로 학습하고 SVDDD로 인식한다. 제안된 방법의 성능을 보이기 위해서 INRIA Xmas Motion Acquisition Sequences (IXMAS) 데이터셋에서 제공하는 3D-S 볼륨을 사용하여 학습을 하고, 행동 방향 인식 실험이 가능한 SNU 데이터셋을 구축하여 인식 실험을 하였다.

단일 카테고리 문서의 다중 카테고리 자동확장 방법론 (A Methodology for Automatic Multi-Categorization of Single-Categorized Documents)

  • 홍진성;김남규;이상원
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.77-92
    • /
    • 2014
  • 텍스트에 대한 사용자의 접근성을 향상시키기 위해, 이들 문서는 정해진 기준에 따라 카테고리로 분류되어 제공되고 있다. 과거에는 카테고리 분류 작업이 수작업으로 수행되었지만, 문서 작성자에게 분류를 맡기는 경우 분류 정확성을 보장할 수 없고 관리자가 모든 분류를 담당하는 경우 많은 시간과 비용이 소요된다는 어려움이 있었다. 이러한 한계를 극복하기 위해 카테고리를 자동으로 식별할 수 있는 문서 분류 기법에 대한 연구가 활발하게 수행되었다. 하지만 대부분의 문서 분류 기법은 각 문서가 하나의 카테고리에만 속하는 경우를 가정하고 있기 때문에, 하나의 문서가 다양한 주제를 갖는 실제 상황과 부합하지 않는다는 한계를 갖는다. 이를 보완하기 위해 최근 문서의 다중 카테고리 식별을 위한 연구가 일부 수행되었으나, 이들 연구는 대부분 이미 다중 카테고리가 부여되어 있는 문서에 대한 학습을 통해 분류 규칙을 생성하므로 단일 카테고리만 부여되어 있는 기존 문서의 다중 카테고리 식별에는 적용할 수 없다는 제약을 갖는다. 따라서 본 연구에서는 이러한 제약을 극복하기 위해, 카테고리, 토픽, 문서간 관계 분석을 통해 단일 카테고리를 갖는 문서로부터 추가 주제를 발굴하여 이를 다중 카테고리로 자동 확장시킬 수 있는 방법론을 제안하였다. 실험 결과 원 카테고리가 식별된 총 24,000건의 문서 중 23,089건에 대해 카테고리를 확장시킬 수 있었다. 또한 정확도 분석에서 카테고리의 특성에 따라 카테고리 분류 정확도가 상이하게 나타나는 현상을 발견하였다. 본 연구는 단일 카테고리로 분류된 문서에 대해 다중 카테고리를 추가로 식별하여 부여함으로써, 규칙 학습 과정에서 다중 카테고리가 부여된 문서를 필요로 하는 기존 다중 카테고리 문서 분류 알고리즘의 활용성을 매우 향상시킬 수 있을 것으로 기대한다.