• 제목/요약/키워드: extracting methods

검색결과 948건 처리시간 0.03초

스토리 기반의 정보 검색 연구 (Story-based Information Retrieval)

  • 유은순;박승보
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.81-96
    • /
    • 2013
  • 웹의 발전과 콘텐츠 산업의 팽창으로 비디오 데이터가 폭발적으로 증가함에 따라 데이터의 정보 검색은 매우 중요한 문제가 되었다. 그동안 비디오 데이터의 정보 검색과 브라우징을 위해 비디오의 프레임(frame)이나 숏(shot)으로부터 색채(color)와 질감(texture), 모양(shape)과 같은 시각적 특징(features)들을 추출하여 비디오의 내용을 표현하고 유사도를 측정하는 내용 기반(content-based)방식의 비디오 분석이 주를 이루었다. 영화는 하위 레벨의 시청각적 정보와 상위 레벨의 스토리 정보를 포함하고 있다. 저차원의 시각적 특징을 통해 내용을 표현하는 내용 기반 분석을 영화에 적용할 경우 내용 기반 분석과 인간이 인지하는 영화의 내용 사이에는 의미적 격차(semantic gap)가 발생한다. 왜냐하면 영화의 스토리는 시간의 진행에 따라 그 내용이 변하고, 관점에 따라 주관적 해석이 가능한 고차원의 의미정보이기 때문이다. 따라서 스토리 차원의 정보 검색을 위해서는 스토리를 모델링하는 정형화된 모형이 필요하다. 최근 들어 소셜 네트워크 개념을 활용한 스토리 기반의 비디오 분석 방법들이 등장하고 있다. 그러나 영화 속 등장인물들의 소셜 네트워크를 통해 스토리를 표현하는 이 방법들은 몇 가지 문제점들을 드러내고 있다. 첫째, 등장인물들의 관계에만 초점이 맞추어져 있으며, 스토리 진행에 따른 등장인물들의 관계 변화를 역동적으로 표현하지 못한다. 둘째, 등장인물의 정체성과 심리상태를 보여주는 감정(emotion)과 같은 심층적 정보를 간과하고 있다. 셋째, 등장인물 이외에 스토리를 구성하는 사건과 배경에 대한 정보들을 반영하지 못하고 있다. 따라서 본 연구는 기존의 스토리 기반의 비디오 분석 방법들의 한계를 살펴보고, 문제 해결을 위해 문학 이론에서 제시하고 있는 서사 구조에 근거하여 스토리 모델링에 필요한 요소들을 인물, 배경, 사건의 세 가지 측면에서 제시하고자 한다.

16S rDNA-ARDRA법을 이용한 소나무림과 상수리나무림 토양 내 VBNC 세균군집의 계통학적 특성 비교 (Comparison of Phylogenetic Characteristics of Viable but Non-Culturable (VBNC) Bacterial Populations in the Pine and Quercus Forest Soil by 16S rDNA-ARDRA)

  • 한송이;김윤지;황경숙
    • 미생물학회지
    • /
    • 제42권2호
    • /
    • pp.116-124
    • /
    • 2006
  • 직접 생균수 측정법(DVC)과 평판계수법(PC)을 이용하여 소나무림과 상수리나무림 토양에 분포하는 세균군집의 정량적 평가를 실시한 결과, DVC법에 의해 계수된 생균수에 대해 평판법에 의해 계수된 생균수 1% 미만으로 나타났다. 이상의 결과로부터 산림토양 내에 평판배양법으로는 배양이 곤란한 난배양성(viable but non culturable; VBNC) 세균이 99% 이상 존재해 있는 것으로 판단되었다. 이들 VBNC 세균의 군집구조 해석을 위하여 토양으로부터 직접 DNA를 추출하고 16S rDNA-ARDRA 분석을 통하여 계통학적 특성을 검토하였다. 소나무림과 삼수리나무림 토양으로부터 각각 111 clones, 108 clones을 획득하고 HaeIII 절편양상에 따라 30 groups과 26 groups의 ARDRA group으로 분류하였다. 각 ARDRA group으로부터 대표 clone을 선발하여 16S rDNA 염기서 열을 결정한 결과, 소나무림 토양의 경우 ${\alpha}$-proteobacteria (12 clones), ${\gamma}$-proteobacteria (3 clones), ${\delta}$-proteobncteria (1clone), Flexibacter/Cytophaga (1 clone), Actinobacteria (4 clones), Acidobacteria (4 clones), 그리고 Planctomycetes (5 clone)의 7개의 계통군이 확인되었으며, 상수리나무림 토양에서는 ${\alpha}$-proteobacteria (4 clones), ${\gamma}$-proteobacteria (2 clones), Actinobacteria (10 clones), Acidobacteria (8 clones), Planctomycetes (1 clone), 그리고 Verrucomicrobia (1clone)로 6개의 다양한 계통군이 확인되었다. 이상, 소나무림과 상수리나무림 토양 내에 존재하는 99% 이상의 VBNC 세균군집의 대부분은 미배양성 혹은 미동정균으로 계통학적으로 다양한 미지의 미생물로 구성되어 있음이 확인되었다.

해양관측을 통해 획득된 과학적 지식에 기반한 과학교과서 동해 해류도 (An Oceanic Current Map of the East Sea for Science Textbooks Based on Scientific Knowledge Acquired from Oceanic Measurements)

  • 박경애;박지은;최병주;변도성;이은일
    • 한국해양학회지:바다
    • /
    • 제18권4호
    • /
    • pp.234-265
    • /
    • 2013
  • 중등학교 과학 및 지구과학 교과서의 해류도는 해양에 대한 학생들의 호기심과 관심을 유도하는 데 중요한 역할을 한다. 이 해류도들은 급변하는 기후변화와 지구상의 에너지 균형 문제와 관련이 있는 해류에 대해 학생들이 학습할 수 있는 중요한 기회를 제공할 수 있다. 그럼에도 불구하고 중등학교 교과서의 해류도들은 최근의 해류관련 과학적 지식과 비교해 볼 때 다양한 과학적 오류들을 내포하고 있었다. 이 연구는 오류가 없는 해류도를 제작하고 다양한 동해 해류도들을 하나로 통일하기 위하여 해류도 제작의 기본적인 틀과 방법을 제안하였다. 먼저 중등 과학교과서 27종의 해류도와 기존의 과학 연구 논문에서 제시한 주요 해류도 27개의 도법을 통일하였으며 동해의 난류와 한류들의 수치화된 정량적인 위치 정보를 추출하였다. 대한해협에서 대마난류의 분지 양상, 대마난류의 일본연안분지와 외해분지, 동한난류의 연안거리와 북상한계, 쓰가루해협, 소야해협을 통한 대마난류의 유출 양상과 환류, 리만한류와 북한한류의 분포 양상 등 해류도 제작을 위한 분석 항목들을 선정하였다. 해양 현장관측을 기반으로 형성된 해양학자들의 과학적 전문지식과 연구결과들을 활용하여 동해 해류도 초안을 제작한 후 이를 바탕으로 국내 학회 회원들을 대상으로 동해 해류도 초안에 대한 의견을 묻는 설문조사를 실시하였다. 또한 2013년 춘계 해양학회 특별세션을 기획하여 학회의 의견을 수집하였으며 해양학자들과의 수차례에 걸친 논의를 통하여 일련의 동해 해류도를 제작하고 수정하는 과정을 반복하였다. 최종적으로 해류도에 대한 학계 해류 전문가들의 평가와 의견을 모았으며 이를 최종해류도 제작을 위하여 해류도를 수정하는데 활용하였다. 향후 교과서 해류도 제작과정에서의 오류를 방지하기 위하여 완성된 동해 해류도 결과를 디지털화하여 위 경도 정보를 제시하였다. 이 연구는 황해와 북서태평양을 포함한 우리나라 주변해의 종합적인 해류도를 완성하기 위한 첫걸음이며 향후 중등학교 교과서 해류도 완성을 위한 해양학자들의 관심을 촉진하는 계기가 될 것으로 기대된다.

다중센서 고해상도 위성영상의 딥러닝 기반 영상매칭을 위한 학습자료 구성에 관한 연구 (A Study on Training Dataset Configuration for Deep Learning Based Image Matching of Multi-sensor VHR Satellite Images)

  • 강원빈;정민영;김용일
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1505-1514
    • /
    • 2022
  • 영상정합은 다시기 및 다중센서 고해상도 위성영상을 효과적으로 활용하기 위해 필수적으로 선행되는 중요한 과정이다. 널리 각광받고 있는 딥러닝 기법은 위성영상에서 복잡하고 세밀한 특징을 추출하여 영상 간 빠르고 정확한 유사도 판별에 사용될 수 있음에도 불구하고, 학습자료의 양과 질이 결과에 영향을 미치는 딥러닝 모델의 한계와 고해상도 위성영상 기반 학습자료 구축의 어려움에 따라 고해상도 위성영상의 정합에는 제한적으로 적용되어 왔다. 이에 본 연구는 영상정합에서 가장 많은 시간을 소요하는 정합쌍 추출 과정에서 딥러닝 기반 기법의 적용성을 확인하기 위하여, 편향성이 존재하는 고해상도 위성영상 데이터베이스로부터 딥러닝 영상매칭 학습자료를 구축하고 학습자료의 구성이 정합쌍 추출 정확도에 미치는 영향을 분석하였다. 학습자료는 12장의 다시기 및 다중센서 고해상도 위성영상에 대하여 격자 기반의 Scale Invariant Feature Transform(SIFT) 알고리즘을 이용하여 추출한 영상쌍에 참과 거짓의 레이블(label)을 할당한 정합쌍과 오정합쌍의 집합으로 구축되도록 하였다. 구축된 학습자료로부터 정합쌍 추출을 위해 제안된 Siamese convolutional neural network (SCNN) 모델은 동일한 두 개의 합성곱 신경망 구조에 한 쌍을 이루는 두 영상을 하나씩 통과시킴으로써 학습을 진행하고 추출된 특징의 비교를 통해 유사도를 판별한다. 본 연구를 통해 고해상도 위성영상 데이터 베이스로부터 취득된 자료를 딥러닝 학습자료로 활용 가능하며 이종센서 영상을 적절히 조합하여 영상매칭 과정의 효율을 높일 수 있음을 확인하였다. 다중센서 고해상도 위성영상을 활용한 딥러닝 기반 영상매칭 기법은 안정적인 성능을 바탕으로 기존 수작업 기반의 특징 추출 방법을 대체하고, 나아가 통합적인 딥러닝 기반 영상정합 프레임워크로 발전될 것으로 기대한다.

덴던 비파괴평가를 위한 Total Flux Leakage에서 높은 측정빈도의 데이터를 획득하기 위한 진폭복조의 응용 (Application of Amplitude Demodulation to Acquire High-sampling Data of Total Flux Leakage for Tendon Nondestructive Estimation )

  • 이주형;곽임종;조창빈;최지영;박광연
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제27권2호
    • /
    • pp.17-24
    • /
    • 2023
  • 이 논문은 total flux leakage (TFL) 방법을 이용해 외부텐던을 비파괴검사 하는 솔레노이드 형태의 센서의 측정 신호를 후처리하는 방법을 소개한다. 기존에 개발된 TFL 솔레노이드 센서는 1차 코일과 2차 코일로 이루어져 1차 코일에 정현파 형태의 교류를 입력하면 2차 코일에 그 미분에 비례하는 신호가 측정된다. 이때 진폭은 텐던의 단면에 비례하므로 파단 및 부식 여부를 확인할 수 있다. 따라서 TFL센서의 측정신호에서 진폭정보를 추출 하는 것이 중요한데 기존에는 단순히 극댓값을 모아 진폭정보를 취득했다. 하지만 이 방법을 사용하면 측정빈도가 크게 낮아져 추가적인 신호처리 및 인공지능 적용에 많은 제약이 생긴다. 이 논문은 높은 측정빈도를 가진 진폭정보를 추출하기 위해 진폭복조를 응용해 진폭정보를 획득하는 방법을 제시한다. 진폭복조를 이용해 진폭정보를 취득하면 측정빈도를 원시신호와 동일한 수준으로 유지할 수 있다. 이 방법은 TFL센서의 1차 코일 입력 주파수 선택과 센서를 외부텐던에 적용하는 속도 등에 제약을 없애주어 개발 방향에 많은 자유도를 부여한다. 또한 높은 측정빈도를 유지하므로 추가적인 신호처리나 인공지능 등을 활용 하는데 유리함을 제공한다. 제안된 방법은 실내실험을 통해 검증 되었으며 기존 방법과 비교해 어떤 장점이 있는지 분석했다. 제시된 예제의 경우 진폭복조를 사용한 방법이 기존 방법에 비해 100배 높은 측정빈도를 제공 하는 것을 확인 할 수 있었다. 주어진 상황과 구체적인 장비 설정에 따라 차이가 있겠지만 대부분의 경우 진폭복조를 사용해 진폭정보를 추출하면 기존 방법 대비 만족할만한 결과를 얻을 수 있을 것이다.

초고해상도 무인항공기 영상을 이용한 한국 황도 갯벌의 미세 퇴적 구조 특성 분석 (Analysis of Micro-Sedimentary Structure Characteristics Using Ultra-High Resolution UAV Imagery: Hwangdo Tidal Flat, South Korea)

  • 김민주;백원경;정회수;유주형
    • 대한원격탐사학회지
    • /
    • 제40권3호
    • /
    • pp.295-305
    • /
    • 2024
  • 본 연구는 초고해상도 무인항공기 자료를 활용하여 황도 갯벌의 미세 퇴적 구조를 분석하는 것을 목적으로 하였다. 갯벌은 육지와 바다 사이의 전이 지역으로서 조석 활동에 의해 끊임없이 변화하며, 퇴적 과정과 환경 조건을 이해하는 데 중요한 독특한 환경을 제공한다. 기존의 현장 관측 방법은 공간적 및 시간적 범위에 한계가 있고, 기존 위성 영상은 미세한 퇴적 구조를 연구하기에 충분한 해상도를 제공하지 못한다. 이러한 한계를 극복하기 위해, 본 연구에서는 충청남도 황도 갯벌의 고해상도 이미지를 무인항공기를 이용해 촬영하였다. 황도 갯벌은 방조제 건설과 같은 해안 개발 프로젝트로 인해 퇴적 환경이 크게 변화한 지역이다. 2022년 5월 17일부터 18일까지 현장 관측을 통해 91개의 지점에서 퇴적물 샘플을 수집하였으며, 그중 25개의 주요 지점을 집중적으로 분석하였다. 약 0.9 mm의 공간 해상도를 가진 무인항공기 자료를 이용하여 미세 퇴적 구조의 파라미터(Parameter)를 식별하고 추출하였다. 건열에서는 다각형 장축의 길이를 추출하였고, 연흔에서는 파장과 연흔을 정량적으로 표현하는 대표적인 지표인 연흔 대칭 지수(Ripple Symmetry Index)를 추출하였다. 연구 결과, 니질 함량이 80% 이상인 지역에서는 평균 37.3 cm 간격의 건열이 형성되었으며, 사질 함량이 60% 이상인 지역에서는 평균 파장이 8 cm, 연흔 대칭 지수가 2.0인 연흔이 형성되었다. 본 연구는 초고해상도 무인항공기 자료를 활용하여 인간의 도보에 의한 현장 관측 없이도 갯벌의 미세 퇴적 구조를 효과적으로 분석할 수 있음을 입증하였다. 이는 환경 모니터링 및 해안 관리에서 중요한 도구로써 무인항공기 기술의 가능성을 강조하며, 무인항공기 자료가 퇴적 구조 연구에 유용하다는 것을 보여준다. 또한, 본 연구의 결과는 보다 정밀한 퇴적상 분류를 위한 기반 자료로 활용될 수 있을 것으로 기대된다.

입 모양 인식 시스템 전처리를 위한 관심 영역 추출과 이중 선형 보간법 적용 (Region of Interest Extraction and Bilinear Interpolation Application for Preprocessing of Lipreading Systems)

  • 한재혁;김용기;김미혜
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.189-198
    • /
    • 2024
  • 입 모양 인식은 음성 인식의 중요 부분 중 하나로 음성 인식을 위한 입 모양 인식 시스템에서 입 모양 인식 성능을 개선하기 위한 여러 연구가 진행됐다. 최근의 연구에서는 인식 성능을 개선하기 위해 입 모양 인식 시스템의 모델 구조를 수정하는 방법이 사용됐다. 본 연구에서는 모델 구조를 수정하는 것으로 인식 성능을 개선하는 기존의 연구와 달리 모델 구조의 변화 없이 인식 성능을 개선하는 것을 목표로 한다. 모델 구조의 수정 없이 인식 성능을 개선하기 위해, 사람이 하는 입 모양 인식에서 사용되는 단서를 참고해 입 모양 인식 시스템의 기존 관심 영역인 입술 영역과 함께 턱, 뺨과 같은 다른 영역을 관심 영역으로 설정하고 각 관심 영역의 인식률을 비교해 가장 높은 성능의 관심 영역을 제안한다. 또한, 관심 영역 크기를 정규화하는 과정에서 보간법의 차이로 인해 발생하는 정규화 결과의 차이가 인식 성능에 영향을 준다고 가정하고 최근접 이웃 보간법, 이중 선형 보간법, 이중 삼차 보간법을 사용해 동일한 관심 영역을 보간하고 각 보간법에 따른 입 모양 인식률을 비교해 가장 높은 성능의 보간법을 제안한다. 각 관심 영역은 객체 탐지 인공신경망을 학습시켜 검출하고, 각 관심 영역을 정규화하고 특징을 추출하고 결합한 뒤, 결합된 특징들을 차원 축소한 결과를 저차원 공간으로 매핑하는 것으로 동적 정합 템플릿을 생성했다. 생성된 동적 정합 템플릿들과 저차원 공간으로 매핑된 데이터의 거리를 비교하는 것으로 인식률을 평가했다. 실험 결과 관심 영역의 비교에서는 입술 영역만을 포함하는 관심 영역의 결과가 이전 연구의 93.92%의 평균 인식률보다 3.44% 높은 97.36%의 평균 인식률을 보였으며, 보간법의 비교에서는 이중 선형 보간법이 97.36%로 최근접 이웃 보간법에 비해 14.65%, 이중 삼차 보간법에 비해 5.55% 높은 성능을 나타내었다. 본 연구에 사용된 코드는 https://github.com/haraisi2/Lipreading-Systems에서 확인할 수 있다.

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

사례기반추론과 텍스트마이닝 기법을 활용한 KTX 차량고장 지능형 조치지원시스템 연구 (An Intelligence Support System Research on KTX Rolling Stock Failure Using Case-based Reasoning and Text Mining)

  • 이형일;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.47-73
    • /
    • 2020
  • KTX 차량은 수많은 기계, 전기 장치 및 부품들로 구성되어 있는 하나의 시스템으로 차량의 유지보수에는 상당히 많은 전문성과 유지보수 작업자들의 경험을 필요로 한다. 차량 고장발생 시 유지보수자의 지식과 경험에 따라 문제 해결의 시간과 작업의 질적 차이가 발생하며 그에 따른 차량의 가용율이 달라진다. 일반적으로 문제해결은 고장 매뉴얼을 기반으로 하지만 경험이 많고 능숙한 전문가의 경우는 이와 더불어 개인의 노하우를 접목하여 신속하게 진단하고 조치를 취한다. 이러한 지식은 암묵지 형태로 존재하기 때문에 후임자에게 완전히 전수되기 어려우며, 이를 위해 사례기반의 철도차량 전문가시스템을 개발하여 데이터화된 지식으로 바꾸려고 하는 연구들이 있어왔다. 하지만, 간선에 가장 많이 투입되고 있는 KTX 차량에 대한 연구나 텍스트의 특징을 추출하여 유사사례를 검색하는 시스템 개발은 아직 미비하다. 따라서, 본 연구에서는 이러한 차량 유지보수 전문가들의 노하우를 통해 수행된 고장들에 대한 진단과 조치 이력을 문제 해결의 사례로 활용하여 새롭게 발생하는 고장에 대한 조치가이드를 제공하는 지능형 조치지원시스템을 제안하고자 한다. 이를 위하여, 2015년부터 2017년동안 생성된 차량고장 데이터를 수집하여 사례베이스를 구축하였고, 차원축소 기법인 비음수 행렬 인수분해(NMF), 잠재의미분석(LSA), Doc2Vec을 통해 고장의 특징을 추출하여 벡터 간의 코사인 거리를 측정하는 방식으로 유사 사례를 검색하였으며, 위의 알고리즘에 의해 제안된 조치내역들 간 성능을 비교하였다. 분석결과, 고장 내역의 키워드가 적은 경우의 유사 사례 검색과 조치 제안은 코사인 유사도를 직접 적용하는 경우에도 좋은 성능을 낸다는 것을 알 수 있었고 차원 축소 기법들의 성능 비교를 통해 문맥적 의미를 보존하는 차원 축소 방식 중 Doc2Vec을 적용하는 것이 가장 좋은 성능을 나타낸다는 것을 알 수 있었다. 텍스트 마이닝 기술은 여러 분야에서 활용을 위한 연구들이 이루어지고 있는 추세이나, 본 연구에서 활용하고자 하는 분야처럼 전문적인 용어들이 다수이고 데이터에 대한 접근이 제한적인 환경에서 이러한 텍스트 데이터를 활용한 연구는 아직 부족한 실정이다. 본 연구는 이러한 관점에서 키워드 기반의 사례 검색을 보완하고자 텍스트 마이닝 기법을 접목하여 고장의 특징을 추출하는 방식으로 사례를 검색해 조치를 제안하는 지능형 진단시스템을 제시하였다는 데에 의의가 있다. 이를 통해 현장에서 바로 사용 가능한 진단시스템을 단계적으로 개발하는데 기초자료로써 시사점을 제공할 수 있을 것으로 기대한다.