• 제목/요약/키워드: 유사도 행렬

검색결과 260건 처리시간 0.03초

모수적 궤적 기반의 분절 HMM을 이용한 연속 음성 인식 (Continuous Speech Recognition based on Parmetric Trajectory Segmental HMM)

  • 윤영선;오영환
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.35-44
    • /
    • 2000
  • 본 논문에서는 음성 패턴을 효율적으로 모델링하고자 분절 특징(segmental feature)을 이 용하여 은닉 마코프 모델(hidden markov model)의 일반적인 형식에 기반한 새로운 모수적 궤적 모델 (parametric trajectory model)을 제안한다. 일반적으로 벡터의 열로써 표현되는 분절은 관측 열의 궤적(trajectory)으로 표현된다. 이 궤적은 연속적인 프레임들의 전이 정보(transitional information)를 표현하는 디자인 행렬을 이용하여 얻어지며, 다항식의 회귀 함수(polynomial regression function)로써 나타낼 수 있다. 이러한 궤적을 HMM에 적용하기 위해서 프레임 특징 대신 분절의 특성 을 표현하는 궤적으로 대치하고 우도(likelihood) 계산에 궤적들의 비교에 의한 확률 값을 반영시켜야 한다. 본 논문에서는 궤적간의 유사도를 측정하는 분절 우도(segment likelihood)와 모델을 구성하는 궤적변수의 추정 알고리즘을 제안한다. 임의의 분절에 대한 관측 확률은 제안된 분절 우도와 궤적의 추정 오차(estimation error of trajectories)의 곱으로써 표현된다. 궤적의 추정 오차는 상태에서 주어진 분절 우도의 가중치로 표현될 수 있으며, 이 가중치는 궤적과 대응되는 분절의 적합도를 표현하는 확률을 나타낸다. 본 논문에서 제 안된 모델은 일반적 인 HMM과 모수적 궤적 모델의 일반화(generalization) 또는 확장(extension) 모델로 생각될 수 있다. 본 모델의 성능을 평가하기 위하여 TIMIT 데이터에 기반한 실험을 한 결과, 분절 길이(segment length)와 회귀 차수(regression order)가 변할수록 일반적인 HMM에 비하여 뚜렷한 성능향상이 있음을 알 수 있었다.

  • PDF

국내 인지행동치료 연구의 지식구조: 동시출현단어 분석 (Knowledge Structure of Cognitive Behavioral Therapy Studies in Korea: Co-word Analysis)

  • 김도희;김현진;안다혜
    • 디지털융복합연구
    • /
    • 제17권12호
    • /
    • pp.509-521
    • /
    • 2019
  • 본 연구는 인지행동치료(Cognitve Behavioral Therapy: CBT)분야 학술지에서 나타난 키워드의 출현패턴을 조사하여 국내 CBT 연구의 지식구조를 규명하는 데에 목적이 있다. 국내·외에서 수행된 CBT 연구를 비교하고자 '인지행동치료'에서 출판된 논문 234편(2008-2019)과 'Cognitive Therapy and Research'에서 출판된 논문 2,316편(1977-2019)이 수집되었다. 자료는 NetMiner 4.3 프로그램으로 분석되었으며 동시출현단어 분석은 코사인 유사도 행렬을 산출하고, 네트워크를 시각화하는 절차로 수행되었다. 본 연구의 결과로 국내 CBT연구자들의 주요 관심사가 식별되었고, 국내 CBT 지식구조는 9개의 연구영역으로 범주화되었다: '척도 타당화', '완벽주의와 속박감', '조현병 환자의 인지, 정서, 관계적 특성', '경계선 성격장애와 우울/양극성 장애 환자의 인지적 특성과 치료', '적응과 심리적 건강', '사회불안장애 환자의 인지적 특성과 치료', '우울의 원인과 공존이환', '수용전념치료', '폭식 장애 환자의 이해와 치료'. 본 연구는 지난 11년 동안 국내 CBT 분야에서 축적된 지식을 점검하였다는 데에 의의가 있으며 국내 CBT 연구의 향후 발전과제로 임상적 실천 표준을 제고하기 위한 연구가 필요하다고 제안한다.

멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 (A News Video Mining based on Multi-modal Approach and Text Mining)

  • 이한성;임영희;유재학;오승근;박대희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.127-136
    • /
    • 2010
  • 정보 통신기술이 발전함에 따라 멀티미디어 데이터를 포함하는 디지털 기록물의 양은 기하급수적으로 증가하고 있다. 특히 뉴스 비디오는 시대상을 반영하는 풍부한 정보를 내포하고 있으므로, 이를 효과적으로 관리하고 분석하기 위한 뉴스 비디오 데이터베이스 및 뉴스 비디오 마이닝은 광범위하게 연구되어왔다. 그러나 현재까지의 뉴스 비디오 관련 연구들은 뉴스 기사에 대한 브라우징, 검색, 요약에 치중되어 있으며, 뉴스 비디오에 내재되어 있는 풍부한 잠재적 지식을 탐사하는 고수준의 의미 분석 단계에는 이르지 못하고 있다. 본 논문에서는 뉴스 비디오 클립과 스크립트를 동시에 이용하는, 멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 시스템을 제안한다. 제안된 시스템은 텍스트 마이닝의 군집분석을 통해 뉴스 기사들을 자동 분류하고, 분류 결과에 대해 기간별 군집 추이그래프, 군집성장도 분석 및 네트워크 분석을 수행함으로써, 뉴스 비디오의 기사별 주제와 관련한 다각적 분석을 수행한다. 제안된 시스템의 타당성 검증을 위하여 "2007년 제2차 남북 정상회담" 관련 뉴스 비디오를 대상으로 뉴스 비디오 분석을 수행하였다.

사례기반추론과 텍스트마이닝 기법을 활용한 KTX 차량고장 지능형 조치지원시스템 연구 (An Intelligence Support System Research on KTX Rolling Stock Failure Using Case-based Reasoning and Text Mining)

  • 이형일;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.47-73
    • /
    • 2020
  • KTX 차량은 수많은 기계, 전기 장치 및 부품들로 구성되어 있는 하나의 시스템으로 차량의 유지보수에는 상당히 많은 전문성과 유지보수 작업자들의 경험을 필요로 한다. 차량 고장발생 시 유지보수자의 지식과 경험에 따라 문제 해결의 시간과 작업의 질적 차이가 발생하며 그에 따른 차량의 가용율이 달라진다. 일반적으로 문제해결은 고장 매뉴얼을 기반으로 하지만 경험이 많고 능숙한 전문가의 경우는 이와 더불어 개인의 노하우를 접목하여 신속하게 진단하고 조치를 취한다. 이러한 지식은 암묵지 형태로 존재하기 때문에 후임자에게 완전히 전수되기 어려우며, 이를 위해 사례기반의 철도차량 전문가시스템을 개발하여 데이터화된 지식으로 바꾸려고 하는 연구들이 있어왔다. 하지만, 간선에 가장 많이 투입되고 있는 KTX 차량에 대한 연구나 텍스트의 특징을 추출하여 유사사례를 검색하는 시스템 개발은 아직 미비하다. 따라서, 본 연구에서는 이러한 차량 유지보수 전문가들의 노하우를 통해 수행된 고장들에 대한 진단과 조치 이력을 문제 해결의 사례로 활용하여 새롭게 발생하는 고장에 대한 조치가이드를 제공하는 지능형 조치지원시스템을 제안하고자 한다. 이를 위하여, 2015년부터 2017년동안 생성된 차량고장 데이터를 수집하여 사례베이스를 구축하였고, 차원축소 기법인 비음수 행렬 인수분해(NMF), 잠재의미분석(LSA), Doc2Vec을 통해 고장의 특징을 추출하여 벡터 간의 코사인 거리를 측정하는 방식으로 유사 사례를 검색하였으며, 위의 알고리즘에 의해 제안된 조치내역들 간 성능을 비교하였다. 분석결과, 고장 내역의 키워드가 적은 경우의 유사 사례 검색과 조치 제안은 코사인 유사도를 직접 적용하는 경우에도 좋은 성능을 낸다는 것을 알 수 있었고 차원 축소 기법들의 성능 비교를 통해 문맥적 의미를 보존하는 차원 축소 방식 중 Doc2Vec을 적용하는 것이 가장 좋은 성능을 나타낸다는 것을 알 수 있었다. 텍스트 마이닝 기술은 여러 분야에서 활용을 위한 연구들이 이루어지고 있는 추세이나, 본 연구에서 활용하고자 하는 분야처럼 전문적인 용어들이 다수이고 데이터에 대한 접근이 제한적인 환경에서 이러한 텍스트 데이터를 활용한 연구는 아직 부족한 실정이다. 본 연구는 이러한 관점에서 키워드 기반의 사례 검색을 보완하고자 텍스트 마이닝 기법을 접목하여 고장의 특징을 추출하는 방식으로 사례를 검색해 조치를 제안하는 지능형 진단시스템을 제시하였다는 데에 의의가 있다. 이를 통해 현장에서 바로 사용 가능한 진단시스템을 단계적으로 개발하는데 기초자료로써 시사점을 제공할 수 있을 것으로 기대한다.

박과작물의 유연관계 분석을 통한 수박 EST-SSR 마커의 종간 적용성 검정 (Interspecific Transferability of Watermelon EST-SSRs Assessed by Genetic Relationship Analysis of Cucurbitaceous Crops)

  • 김혁준;여상석;한동엽;박영훈
    • 원예과학기술지
    • /
    • 제33권1호
    • /
    • pp.93-105
    • /
    • 2015
  • 본 연구는 수박의 EST-SSR 마커를 이용하여, 네 개의 주요 박과(Cucurbitaceae) 작물인 수박, 호박, 오이, 멜론의 유연 관계를 분석하고 마커의 타 박과 작물에 활용 가능성을 알아보기 위해 수행되었다. Cucurbit Genomics Initiative(ICuGI) database로부터 선발된 120 EST-SSR 프라이머 중 51(49.17%)가 PCR이 성공하였고, 49(40.8%)가 8개 박과 유전자원에서 다형성을 보였다. 총 24개 박과 유전자원을 24개 EST-SSR 프라이머로 분석한 결과 총 382개 대립유전자 특이적 PCR 밴드를 얻었으며, 이를 토대로 짝유사행렬과 계통도를 작성하였다. 짝유사행렬의 범위는 0.01-0.85였으며, 작성된 계통도에서 24개 유전자원이 두 개의 주요그룹(Clade I, II)으로 분류되었다. Clade I은 다시 수박으로 구성된 하위집단 I-1[I-1a, I-1b-2: 각 1개와 2수박 야생종(Citrullus lanatus var. citroides Mats. & Nakai)으로 구성, I-1b-1: 6개수박 재배종(Citrullus lanatus var. vulgaris Schrad.)로 구성]과 멜론과 오이로 구성된 하위집단I-2[I-2a-1: 4개 멜론 재배종(Cucumis melo var. cantalupensis Naudin.), I-2a-2: 2개 참외 재배종(Cucumis melo var. conomon Makino.), I-2b: 5개 오이 재배종(Cucumis sativus L.)]로 분류되었다. 호박으로 구성된 Clade II는 다시 Cucurbita moschata(Duch. ex Lam.) Duch. & Poir와 Cucurbita maxima Duch.로 구성된 하위집단 II-1과 Cucurbita pepo L.과 Cucurbita ficifolia Bouche로 구성된 하위집단 II-2로 나누어졌다. 이러한 결과는 기존의 종명법에 따른 분류와 일치하며, 따라서 수박 EST-SSR 마커를 이용한 타 박과 작물의 비교 유전체 등 연구분야에 적용 가능성을 확인하였다.

도시고속도로 돌발상황 감지 알고리즘 개발에 관한 연구 및 평가 (Study and Evaluation of an Incident Detection Algorithm for Urban Freeways)

  • 서정호;임성만;김영찬
    • 한국ITS학회 논문지
    • /
    • 제3권1호
    • /
    • pp.53-65
    • /
    • 2004
  • 도로에서 발생하는 비반복적이며 예측불가능한 일련의 사건을 돌발상황(incident)이라고 하며 이러한 돌발상황이 발생하게 되면 교통류의 정상 흐름이 와해되고 이로써 도로의 용량감소를 일으키며 교통혼잡과 대기오염 등 막대한 사회$\cdot$경제적 손실을 초래한다. 돌발상황으로 인한 피해를 최소화하고자 국내외 각종 교통관리센터에서는 자동 돌발감지 알고리즘에 의한 자동감지 방법을 사용하고 있다. 그러나 현재 운영중인 돌발상황 감지 알고리즘들은 어느 정도의 감지율은 확보하고 있으나 오경보율이 높아 대체적인 성능은 낮은 것으로 판단된다. 유출입램프 수요과다로 인해 도로용량이 다른 구간에 비해 현저히 떨어지는 병목(bottleneck)구간의 경우, 돌발상황이 빈번하게 발생함에도 불구하고 진출입차량으로 인한 대기행렬과 차로변경등의 유사 돌발상황이 발생하여 자동 돌발상황 감지가 더욱 어려운 실정이다. 본 연구에서는 진출입영향권내에서 발생하는 돌발상황을 정확히 감지하기 위해 돌발상황시 혼잡상황 구분을 통한 자동감지 알고리즘을 바탕으로 램프구간의 혼잡 감지시 인접한 본선의 차로를 돌발상황 판단모듈에서 제외함으로써 모형의 성능을 향상시킬 수 있음을 살펴보았다.

  • PDF

괸당, 정낭(錠木), 묘(墓)의 신문(神門)과 유전자(RNA)의 접목 (The Hyper Connection of The Heredity Gene(RNA) and The Goendang with Jong Nang/Tomb Gate)

  • 김정수;이문호
    • 문화기술의 융합
    • /
    • 제3권4호
    • /
    • pp.1-19
    • /
    • 2017
  • 죽음의 문화는 삶의 문화의 반쪽이라는 의미에서 상보적(相補的)이다. 3개의 이승 정낭과 2개의 묘(墓)의 저승 신문(神門)은 올레길 공간체로 연결되어 있다. 그 공간체에는 삶과 죽음사이의 상생(相生)과 상극(相剋)이 공존하는 상보성(相補性)(complementarity) 원리가 제주 문화(文化)에 숨어있다. 대(對)와 대(待)이다. 즉 반대되는 것은 서로 보완적이다란 말이 "(Contraria Sunt Complementa 라틴어)" 서로 대립하면서도 서로 의존하는 관계로 서로가 서로를 품은 관계를 뜻한다. 정낭은 통신 원리로 사용될 뿐 아니라 인체의 RNA Codon에 기본 원리로 사용된다. 또한, 묘의 사각형 산담 귓돌과 한국의 태극과 괘(卦), 유전자(RNA)의 괘(卦), 연결고리의 유사성 Pattern을 들 수 있다. 제주에는 흑용만리 곡선밭담과 사각형 산담이 들판에 펼쳐있다. 제주에서 돌담은 괸담(Stone Networks)으로 연결되고, 괸담의 관습상 발음이 되는 괸당은 친족(Relative Family Networks)로 연결된다. 조상의 명당 묘와 자손들 관계는 영혼적으로 동기감응(同氣感應: Soul Synchronizing the Ancestor to Offspring)이 되어 발복(發福: Change in Future)이 된다고 믿고, 육체적인 피(血)인 유전인자가 자식들에게 직접 전수된다. DNA RNA를 행렬식으로 표시했다.

제목을스마트 시설환경 실시간 제어를 위한 마이크로 병렬 컴퓨팅 기술 분석 (A Benchmark of Micro Parallel Computing Technology for Real-time Control in Smart Farm (MPICH vs OpenMP))

  • 민재기;이동훈
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.161-161
    • /
    • 2017
  • 스마트 시설환경의 제어 요소는 난방기, 창 개폐, 수분/양액 밸브 개폐, 환풍기, 제습기 등 직접적으로 시설환경의 조절에 관여하는 인자와 정보 교환을 위한 통신, 사용자 인터페이스 등 간접적으로 제어에 관련된 요소들이 복합적으로 존재한다. PID 제어와 같이 하는 수학적 논리를 바탕으로 한 제어와 전문 관리자의 지식을 기반으로 한 비선형 학습 모델에 의한 제어 등이 공존할 수 있다. 이러한 다양한 요소들을 복합적으로 연동시키기 위해선 기존의 시퀀스 기반 제어 방식에는 한계가 있을 수 있다. 관행의 방식과 같이 시계열 상에서 획득한 충분한 데이터를 이용하여 제어의 양과 시점을 결정하는 방식은 예외 상황에 충분히 대처하기 어려운 단점이 있을 수 있다. 이러한 예외 상황은 자연적인 조건의 변화에 따라 불가피하게 발생하는 경우와 시스템의 오류에 기인하는 경우로 나뉠 수 있다. 본 연구에서는 실시간으로 변하는 시설환경 내의 다양한 환경요소를 실시간으로 분석하고 상응하는 제어를 수행하여 수학적이며 예측 가능한 논리에 의해 준비된 제어시스템을 보완할 방법을 연구하였다. 과거의 고성능 컴퓨팅(HPC; High Performance Computing)은 다수의 컴퓨터를 고속 네트워크로 연동하여 집적적으로 연산능력을 향상시킨 기술로 비용과 규모의 측면에서 많은 투자를 필요로 하는 첨단 고급 기술이었다. 핸드폰과 모바일 장비의 발달로 인해 소형 마이크로프로세서가 발달하여 근래 2 Ghz의 클럭 속도에 이르는 어플리케이션 프로세서(AP: Application Processor)가 등장하기도 하였다. 상대적으로 낮은 성능에도 불구하고 저전력 소모와 플랫폼의 소형화를 장점으로 한 AP를 시설환경의 실시간 제어에 응용하기 위한 방안을 연구하였다. CPU의 클럭, 메모리의 양, 코어의 수량을 다음과 같이 달리한 3가지 시스템을 비교하여 AP를 이용한 마이크로 클러스터링 기술의 성능을 비교하였다.1) 1.5 Ghz, 8 Processors, 32 Cores, 1GByte/Processor, 32Bit Linux(ARMv71). 2) 2.0 Ghz, 4 Processors, 32 Cores, 2GByte/Processor, 32Bit Linux(ARMv71). 3) 1.5 Ghz, 8 Processors, 32 Cores, 2GByte/Processor, 64Bit Linux(Arch64). 병렬 컴퓨팅을 위한 개발 라이브러리로 MPICH(www.mpich.org)와 Open-MP(www.openmp.org)를 이용하였다. 2,500,000,000에 이르는 정수 중 소수를 구하는 연산에 소요된 시간은 1)17초, 2)13초, 3)3초 이었으며, $12800{\times}12800$ 크기의 행렬에 대한 2차원 FFT 연산 소요시간은 각각 1)10초, 2)8초, 3)2초 이었다. 3번 경우는 클럭속도가 3Gh에 이르는 상용 데스크탑의 연산 속도보다 빠르다고 평가할 수 있다. 라이브러리의 따른 결과는 근사적으로 동일하였다. 선행 연구에서 획득한 3차원 계측 데이터를 1초 단위로 3차원 선형 보간법을 수행한 경우 코어의 수를 4개 이하로 한 경우 근소한 차이로 동일한 결과를 보였으나, 코어의 수를 8개 이상으로 한 경우 앞선 결과와 유사한 경향을 보였다. 현장 보급 가능성, 구축비용 및 전력 소모 등을 종합적으로 고려한 AP 활용 마이크로 클러스터링 기술을 지속적으로 연구할 것이다.

  • PDF

이용자 중심의 이미지 접근과 이용 분석을 통한 차세대 멀티미디어 검색 패러다임 요소에 관한 연구 (Towards Next Generation Multimedia Information Retrieval by Analyzing User-centered Image Access and Use)

  • 정은경
    • 한국문헌정보학회지
    • /
    • 제51권4호
    • /
    • pp.121-138
    • /
    • 2017
  • 멀티미디어 정보환경의 발전과 다양한 요구를 지닌 정보이용자는 멀티미디어의 접근과 이용에 있어서 기존 정보검색 패러다임에서 중요시하지 않았던 요소를 사용하는 추세이다. 특히 이미지를 포함한 멀티미디어의 감정 접근과 이용은 다양한 정보환경에서 이루어지고 있다. 따라서 효율적으로 추상적 개념인 감정을 이용자에게 접근점으로 제공할 필요성이 증가한다. 본 연구는 감정으로 접근이 가능한 게티 이미지 뱅크의 이미지를 5가지 기본 감정으로 검색하여 부여된 색인어 총 22,675건을 추출하였다. 추출된 색인어는 전체감정, 긍정감정, 부정감정의 세 가지 데이터셋으로 구분하여 분석되었다. 분석을 위해서는 동시출현단어행렬로 작성되어 가중 네트워크와 군집화기법으로 시각화되었다. 분석결과를 살펴보면, 전체감정은 대분류로써 긍정감정, 부정감정, 가족의 3개 군집과 하위 20개의 군집으로 나타났다. 긍정감정은 10개의 군집이며, 부정감정은 10개의 군집으로 구성되었다. 이와 같은 가중 네트워크와 군집구성 분석을 통해, 세 가지 중요한 차세대 멀티미디어 검색을 위한 요소로 논의하였다. 첫째는 이미지 감정 표현을 위한 인물 색인어 특성이다. 둘째는 명시적 단어와 감정을 표현하는 함축적 단어와의 네트워크 구성을 통해서 상대적으로 색인이 용이한 명시적 단어만으로도 함축적 단어 추론 가능성이다. 셋째는 감정으로 표현하는 함축적 단어의 유사어/동의어로의 확장은 이용자 중심의 접근을 제공하는 측면에서 중요하다는 점이다.

사질토에 근입된 해상풍력 모노파일 기초의 횡방향 거동 분석 (Analysis of Lateral Behavior of Offshore Wind Turbine Monopile Foundation in Sandy Soil)

  • 장화섭;김호선;곽연민;박재현
    • 한국강구조학회 논문집
    • /
    • 제25권4호
    • /
    • pp.421-430
    • /
    • 2013
  • 수평하중이 지배적인 해상 풍력발전기 설계 시에는 지반-기초구조물 거동을 정확히 모사하여야 상부구조물에 대한 정확한 거동예측이 가능하며, 합리적 설계가 이루어질 수 있다. 현재 다양한 지반 모델링 기법이 존재하나, 모노파일 기초 설계 시, 각 해석 기법에 대한 충분한 검증 절차 없이 해석 결과를 그대로 사용할 경우 구조물을 과다 및 과소하게 설계할 우려가 있다. 이에 본 연구에서는 지반 모델링 기법 차에 따른 모노파일의 부재력 및 수평변위 차를 비교 분석하였다. 검토 결과 고정단 모델은 최대 수평변위를 과소평가 하여 사용성 검토 측면에서 적합하지 않은 것으로 나타났으며, 고정단 모델, 지반강성행렬 모델은 모노파일의 부재력을 과소평가하는 것으로 나타났다. 반면 가상고정점 모델은 모노파일의 부재력을 과대평가하여 경제성 측면에서 적합하지 않은 것으로 나타났다. 지반반력계수 모델과 p-y곡선 모델의 경우 3D 지반 모델링 해석 결과와 비교적 유사한 수평변위 및 부재력을 나타냈으며, 지반을 2D로 모델링한 경우 타 모델링 기법에 비해 과대한 수평변위와 부재력을 산정했다.