• 제목/요약/키워드: Random Process

검색결과 1,651건 처리시간 0.036초

NIST SP 800-90B의 최소 엔트로피 추정 알고리즘에 대한 고속 구현 및 효율적인 메모리 사용 기법 (High-Speed Implementation and Efficient Memory Usage of Min-Entropy Estimation Algorithms in NIST SP 800-90B)

  • 김원태;염용진;강주성
    • 정보보호학회논문지
    • /
    • 제28권1호
    • /
    • pp.25-39
    • /
    • 2018
  • 최근 NIST에서는 암호학적 난수발생기의 핵심 요소인 엔트로피 소스의 안전성을 평가하기 위한 방법을 다루고 있는 SP 800-90B 문서의 두 번째 수정안과 이를 Python으로 구현한 코드를 제공하였다. SP 800-90B에서의 엔트로피 소스에 대한 안전성 평가는 엔트로피 소스의 출력 표본 수열로부터 도출한 여러 가지 추정량(estimator)에 기반 하여 최소 엔트로피를 추정하는 과정이다. 최소 엔트로피 추정 과정은 IID 트랙과 non-IID 트랙으로 대별되어 진행된다. IID 트랙의 경우 MCV 추정량만을 사용하여 속도 측면에서 무리가 없다. 반면 non-IID 트랙에서는 MCV를 포함한 총 10 가지의 추정량을 적용해 최소 엔트로피를 추정하게 된다. NIST의 코드에서 non-IID 트랙의 1 회 구동 시간은 약 20 분이 소요되고, 사용되는 메모리는 5.5 GB를 넘긴다. 이는 다양한 잡음원으로 반복적인 평가를 수행해야 하는 평가 기관 또는 여러 환경에서 실험을 수행해야 하는 개발자나 연구자 입장에서는 NIST에서 제공한 Python 코드를 이용하는 것이 불편할 수 있으며, 환경에 따라 실행이 불가할 수도 있다. 본 논문에서는 SP 800-90B의 최소 엔트로피 추정 방법에 대한 고속 구현과 효율적인 메모리 사용 기법을 제시한다. 주요 연구 결과로 MultiMCW 추정 방법에 C++ 코드의 장점을 적용한 고속화 방법, MultiMMC 추정 방법의 데이터 저장 방식을 재구성하여 메모리 사용량을 현저하게 감소시킴과 동시에 고속화한 방법, LZ78Y 추정 방법에 데이터 저장 방식의 재구성을 통한 고속화 기법 등을 제안한다. 우리의 개선된 방법이 종합적으로 적용된 C++ 코드는 NIST에서 제공한 기존의 Python 코드와 비교할 때, 속도는 14 배 빠르고 메모리 사용량은 1/13로 감소하는 효과를 보인다.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

3D 프린팅 소재 화학물질의 독성 예측을 위한 Data-centric XAI 기반 분자 구조 Data Imputation과 QSAR 모델 개발 (Data-centric XAI-driven Data Imputation of Molecular Structure and QSAR Model for Toxicity Prediction of 3D Printing Chemicals)

  • 정찬혁;김상윤;허성구;;신민혁;유창규
    • Korean Chemical Engineering Research
    • /
    • 제61권4호
    • /
    • pp.523-541
    • /
    • 2023
  • 3D 프린터의 활용이 높아짐에 따라 발생하는 화학물질에 대한 노출 빈도가 증가하고 있다. 그러나 3D 프린팅 발생 화학물질의 독성 및 유해성에 대한 연구는 미비하며, 분자 구조 데이터의 결측치로 인해 in silico 기법을 사용한 독성예측 연구는 저조한 실정이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 결측치를 보간하여 3D 프린팅의 독성 및 유해성을 예측한 Data-centric QSAR 모델을 개발하였다. 먼저 MissForest 알고리즘을 사용해 3D 프린팅으로 발생되는 유해물질의 분자표현자 결측치를 보완하였으며, 서로 다른 4가지 기계학습 모델(결정트리, 랜덤포레스트, XGBoost, SVM)을 기반으로 Data-centric QSAR 모델을 개발하여 생물 농축 계수(Log BCF)와 옥탄올-공기분배계수(Log Koa), 분배계수(Log P)를 예측하였다. 또한, 설명 가능한 인공지능(XAI) 방법론 중 TreeSHAP (SHapley Additive exPlanations) 기법을 활용하여 Data-centric QSAR 모델의 신뢰성을 입증하였다. MissForest 알고리즘 기반 결측지 보간 기법은, 기존 분자구조 데이터에 비하여 약 2.5배 많은 분자구조 데이터를 확보할 수 있었다. 이를 바탕으로 개발된 Data-centric QSAR 모델의 성능은 Log BCF, Log Koa와 Log P를 각각 73%, 76%, 92% 의 예측 성능으로 예측할 수 있었다. 마지막으로 Tree-SHAP 분석결과 개발된 Data-centric QSAR 모델은 각 독성치와 물리적으로 상관성이 높은 분자표현자를 통하여 선택함을 설명할 수 있었고 독성 정보에 대한 높은 예측 성능을 확보할 수 있었다. 본 연구에서 개발한 방법론은 다른 프린팅 소재나 화학공정, 그리고 반도체/디스플레이 공정에서 발생 가능한 오염물질의 독성 및 인체 위해성 평가에 활용될 수 있을 것으로 사료된다.

인공지능을 활용한 경관 지각반응 예측모델 개발 가능성 기초연구 - 머신러닝 기법을 중심으로 - (Basic Research on the Possibility of Developing a Landscape Perceptual Response Prediction Model Using Artificial Intelligence - Focusing on Machine Learning Techniques -)

  • 김진표;서주환
    • 한국조경학회지
    • /
    • 제51권3호
    • /
    • pp.70-82
    • /
    • 2023
  • 최근 IT 기술과 데이터의 범람으로 생활 전반적인 부분의 패러다임이 전환되고 있다. 이러한 기술의 발전과 변화는 학술영역에도 영향을 미치고 있다. 학문적 교류와 연계를 통해 연구주제나 연구 방법의 개선이 이루어지고 있다. 특히, 데이터 기반의 연구 방법이 다양한 학문분야에서 진행되고 있으며 조경학에서도 지속적인 연구가 필요한 시점이다. 따라서 본 연구에서는 이러한 시대적 상황을 반영하여 인공지능의 한 분야인 머신러닝을 활용한 경관 선호 평가 및 예측모델의 개발 가능성을 알아보는 것을 목표로 한다. 본 연구의 목표를 달성하기 위하여 경관 분야에 머신러닝 기법을 적용하여 경관 선호 평가 및 예측 모델을 구축하고, 구축된 모형의 모의정도를 검증하였다. 이를 위해 본 연구에서는 최근 신재생에너지 사업으로 주목받는 풍력발전시설 경관 이미지를 연구대상으로 선정하였다. 분석을 위하여 풍력발전시설 경관 이미지를 웹크롤링 기법을 활용하여 수집하고 분석 테이터셋을 구축하였다. 우수한 성능의 예측모델 도출을 위하여 머신러닝 분석에 활용되는 University of Ljubljana의 프로그램인 오렌지 버전 3.33을 활용하였다. 또, 머신러닝 학습데이터의 평가기준을 통합한 모델과 평가기준 별도 모델 구조를 활용하였으며, 머신러닝 분류모델에 적합한 kNN. SVM, Random Forest, Logistic Regression, Neural Network 알고리즘을 사용해 모델을 생성하였다. 생성된 모델을 성능 평가를 실시하여 본 연구에 가장 적합한 예측모델을 도출하였다. 본 연구에서 도출된 예측모델은 경관의 유형에 따른 분류, 경관과 대상의 시거리에 따른 분류, 선호에 따른 분류 등 3가지 평가기준을 별도로 평가 후 종합해 예측하여 결과를 도출하였다. 연구 결과 경관 유형에 따른 평가 기준 정확도 0.986, 시거리에 따른 평가 기준 정확도 0.973, 선호에 따른 평가 기준 정확도 0.952에 달하는 높은 정확도를 가진 예측모델을 개발하였으며, 평가데이터 예측 결과를 통한 검증과정을 보아도 모델의 성능 치를 상회하는 성과를 도출했음을 알 수 있다. 경관 관련 연구에서 머신러닝을 활용한 예측모델 개발 가능성을 알아본 실험적 시도로 이미지 데이터의 수집 및 정제를 통해 데이터 세트를 구축하여 높은 성능의 예측모델이 생성 가능하며, 이후 경관 관련 연구 분야에 활용될 수 있다는 가능성을 확인할 수 있었다. 본 연구의 결과와 시사점, 한계점을 반영한다면 풍력발전시설의 경관뿐만 아니라 자연경관이나 문화경관 등 다양한 형태의 경관 예측모델 개발이 가능할 것으로 생각되며, 경관 유형에 따라 이미지를 분류하는 모델의 연구를 통해 데이터 분류의 시간을 단축하거나 머신러닝을 활용한 경관예측 인자분석을 통해 경관계획 요소의 중요도 분석 등의 주제에 맞는 연구 방법을 탐색하고 적용하여 후속 연구를 진행한다면 조경학 분야에서도 머신러닝 기법을 보다 유용하고 가치 있게 활용할 수 있을 것으로 생각된다.

유적지 발굴을 위한 효율적 3차원 GPR 탐사 (Effective 3-D GPR Survey for the Exploration of Old Remains)

  • 김정호;이명종;손정술;조성준;박삼규
    • 지구물리와물리탐사
    • /
    • 제8권4호
    • /
    • pp.262-269
    • /
    • 2005
  • 역사유물은 지질구조와는 달리 일정한 방향성이 없이 매몰되어 있는 경우가 많으므로 고적지 탐사를 위해서는 근본적으로 2차원 보다는 3차원 물리탐사가 바람직하다. 그러나 3차원 GPR 탐사는 매우 조밀한 측선설정과 아울러 대단히 많은 자료를 획득하여야 하므로 자력, 전자탐사와 같이 유적지 탐사에 많이 응용하는 다른 탐사방법에 비하여 상대적으로 현장탐사기간이 길어질 뿐만 아니라 많은 경비가 소요된다. 이 연구에서는 두 조의 송, 수신 안테나와 안테나 이동 궤적을 연속적으로 자동 기록할 수 있는 측량 시스템을 이용하여 소규모의 3차원 GPR 자동연속 탐사 시스템을 구성하였다. 3차원 측선을 미리 측량함 또한 상당한 기간과 경비가 소요되므로 미리 설정하지 않은 임의의 경로를 따라 자료를 취득하는 개념을 도입하였다. 이와 병행하여 개발한 자료취득 시스템으로 획득한 자료를 효율적으로 전산처리하고 영상화하는 소프트웨어 또한 개발하였다. 개발한 시스템을 이용하여 부여 외곽 백제 유적지로 추정되는 지역에서 3차원 GPR 탐사를 수행하였다. 약 $17,000m^2$에 걸친 지역의 3차원 GPR 탐사에 약 6 시간의 현장작업시간이 소요되었으며 이는 개발한 시스템의 효율성을 입증한다. 미리 설정한 격자망 측선이 아닌 임의의 측선 경로를 따라 자료를 획득하였음에도 불구하고 고분해능 3차원 지하 영상의 획득이 가능하였으며, 이로부터 경작지, 수로, 인공 구조물 또는 유물 등의 존재를 알려주는 이상대들을 파악할 수 있었다. 이 연구를 통하여, 3차원 GPR 탐사 또한 국부적인 이상대의 규명뿐만 아니라 광역적인 유적지 조사에도 다른 물리탐사와 마찬가지로 쉽게 활용될 수 있다는 결론을 얻을 수 있었다.

청소년의 건강행위와 비행의 영향 요인에 관한 모형 구축 (Model Development of Affecting Factors on Health Behavior and Juvenile Delinquency of Adolescents)

  • 김현숙;김화중
    • 한국학교보건학회지
    • /
    • 제11권2호
    • /
    • pp.171-187
    • /
    • 1998
  • In recent years, adolescent issues including smoking, drinking, drug abuse, juvenile delinquency, deviant sexual behavior, mental health problems, high suicide rate, juvenile delinquency and absence without due notice, etc are emerging as serious social problems and the debate on these controversial issues is heating up. The previous studies on adolescent health behavior and social juvenile delinquency such as run-away from home and absence without due notice have been conducted mostly by cause analysis utilizing social demographic factors or biological factors. In other words, the main factors analyzed were demographic and economic factors or parent's educational level, etc, which were the fixed environmental ones that were unable to cause the change in the health behavior. Accordingly, the purpose of this study is to analyze factors which are changeable and fixable among the factors influencing the adolescent's health behavior and misconducts and, eventually influencing factors which can be used as the basis to establish health policies and health promotion program to reduce the health risk behavior and misconducts of adolescents. The study subjects were selected by dividing senior high school student in Seoul by region and through random sampling. The 890 subjects were selected from 10 schools including the preparatory school, vocational schools and institutional schools. The duration of the study was for July 1-5, 1997 for the first survey and the second one, for August 25-September 10. Regarding the analysis method, the SAS program was used. The adoptablity of theoretical model was tested through covariance structural analysis utilizing PC-LISREL 8.12 Program. The major findings of the study are as follows: As a result of establishing the model of factors influencing health behavior and juvenile delinquency, in case of male students as the health behavior self-efficacy, education level of fathers, economic level, self-control and the health interest of parent were higher, students were more likely to practice the health promoting behavior. Juvenile delinquency and health risk behavior were prevalent among those with the less shyness, the lower health behavior self-efficacy, lower self-control, lower self-assertiveness, lower economic level. The self-control was the most powerful factor. In case of female students, those with higher health behavior self-efficacy were more likely to practice the health promoting behavior whereas those with lower health behavior self-efficacy, lower self-control, lower self- assertiveness, less shyness were more likely to practice health risk behavior and juvenile delinquency. In case of prep schools, those with higher health behavior self-efficacy and better perceived health status were more likely to practice the health promoting behavior while those with less shyness, lower health behavior self-efficacy and lower academic achievement were more likely to engage in health risk behavior and juvenile delinquency. In case of vocational schools, as health behavior self-efficacy and economic level were higher, the practice rate of health promoting behavior was higher. As the self-control, shyness, self-assertiveness, health behavior self-efficacy were lower, the rate of health risk behavior and juvenile delinquency were higher. In case of social institutional schools, as, the health behavior self-efficacy, social support and economic level, health interest of parents were higher, the rate of health promoting behavior were higher. As the self-control, shyness, self-assertiveness, health behavior self-efficacy and social support were lower, the rate of health risk behavior and juvenile delinquency were higher. So the health promoting behavior was positively related to the health behavior self-efficacy, health interest of parents, social support, education level of fathers, level of perceived health status, economic level. The health risk behavior and juvenile delinquency were higher with the lower health behavior self-efficacy, self-control and self-assertiveness, lower health locus control, less shyness and loneliness, lower economic level and academic achievement. In conclusion, the health risk behavior and juvenile delinquency can be reduced by enhancing self-control, self-assertiveness, health behavior self-efficacy and social support. According to the final model drawn by connecting health behavior and juvenile delinquency, the reduction of health risk behavior can greatly contribute to decreasing social juvenile delinquency as the process of juvenile delinquency was extended from common behaviors to problem behaviors and further into juvenile delinquency.

  • PDF

이단계 군집분석에 의한 농촌관광 편의시설 유형별 소비자 선호 결정요인 (Determinants of Consumer Preference by type of Accommodation: Two Step Cluster Analysis)

  • 박덕병;윤유식;이민수
    • 마케팅과학연구
    • /
    • 제17권3호
    • /
    • pp.1-19
    • /
    • 2007
  • 본 연구에서는 농촌관광 방문객에게 제공되는 편의시설을 유형화하고 어떤 특징을 가진 방문객이 어떤 편의시설을 선호하는지를 규명하기 위한 방법과 그 분석결과를 제시하였다. 이를 위하여 우선 2단계 군집분석법을 사용하여 농촌관광 편의시설을 유형화하였다. 그 다음으로 군집분석에 사용되는 변인이 범주형 변인이 있을 경우 전통적인 군집분석 방법을 적용할 수 없기 때문에 2단계 군집분석을 하였다. 본 연구는 2단계 군집분석법이 범주형 변인으로 측정된 농촌관광의 편의시설을 유형화하는 데 매우 유용하다는 것을 보여 주고 있다. 다중로짓 모형을 사용하여 특정 편의시설 유형을 선호할 확률에 영향을 미치는 농촌관광 방문자의 사회인구학적 특성과 여행특성을 규명하였다. 즉, 다중로짓 모형을 통해 참조항(일반농가형)으로 설정된 편의시설 유형에 비해 특정 편의시설을 선호할 확률에 영향을 미치는 소비자의 특성을 규명할 수 있다는 것이 본 연구의 특징이다.

  • PDF

자체 제작한 QA Phantom을 이용한 양성자 PPS (Patient Positioning System)의 정확성 평가 (Evaluation on the Accuracy of the PPS in the Proton Therapy System, Which Uses the Self Made QA Phantom)

  • 이지은;김재원;강동윤;최재혁;염두석
    • 대한방사선치료학회지
    • /
    • 제24권2호
    • /
    • pp.115-121
    • /
    • 2012
  • 목 적: 양성자 치료는 DIPS (Digital Imaging Positioning System)를 이용하여 기준이 되는 DRR (Digital Reconstruction Radiography) 영상과 당일 치료 과정에서 얻은 X-ray 영상의 해부학적 구조를 비교하여 교정 값을 얻어 PPS (Patient Positioning System)를 교정 후 치료한다. PPS는 환자 셋업의 정확성을 위해 6방향(X축 Lateral, Y축 Longitudinal, Z축 Vertical, Rotation, Pitch, Roll)의 이동을 기반으로 움직인다. 따라서 DIPS의 교정 값과 PPS 움직임 구현성의 정확성 평가가 필요하다. 이에 자체 제작한 PPS QA 팬텀을 이용하여 PPS의 정확성을 평가하고자 한다. 대상 및 방법: 환자의 해부학적 구조를 대신 할 납 볼이 부착된 PPS QA 팬텀을 기준점에 셋업 한다. 임의의 수치 값으로 PPS 6 방향의 움직임을 만들어 PPS QA 팬텀을 이동시킨다. DIPS로 얻은 교정 값을 적용 후 기준점과 기준점으로 돌아온 PPS QA 팬텀과의 교정 값이 허용 범위 내에 들어오는지 평가한다. 결 과: 기준점에 위치한 PPS QA 팬텀의 X축, Y축, Z축의 3개의 좌표를 함께 1 cm에서 5 cm까지 1 cm씩 이동한 후 기준점과의 평균 교정 값은 PPS 6축에서 각각 0.04 cm, 0.026 cm, 0.022 cm, $0.22^{\circ}$, $0.24^{\circ}$, $0^{\circ}$이다. PPS QA 팬텀의 6방향의 이동 좌표계를 모두 1과 2만큼 이동 시켰을 때 평균 교정 값은 1 이동 시 0.06 cm, 0.01 cm, 0.02 cm, $0.1^{\circ}$, $0.3^{\circ}$, $0^{\circ}$이었고, 2만큼 이동 시에 0.02 cm, 0.04 cm, 0.01 cm, $0.3^{\circ}$, $0.5^{\circ}$, $0^{\circ}$이었다. 결 론: 교정 값을 평가한 결과 Lateral, Longitudinal, Vertical의 경우 허용 범위인 0.5 cm Rotation, Pitch, Roll의 경우 허용 범위 $1^{\circ}$ 안에 모두 들어오는 것을 알 수 있었다. 하지만 더욱 정확한 양성자 치료를 위해 DIPS의 이미지 질 개선과 DIPS 매칭 시스템의 발전 노력, 정기적인 장비 관리를 함으로써 현재 발생하는 기계적인 오차를 더욱 줄여나가야 하겠다.

  • PDF

비대칭 오류비용을 고려한 분류기준값 최적화와 SVM에 기반한 지능형 침입탐지모형 (An Intelligent Intrusion Detection Model Based on Support Vector Machines and the Classification Threshold Optimization for Considering the Asymmetric Error Cost)

  • 이현욱;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.157-173
    • /
    • 2011
  • 최근 인터넷 사용의 증가에 따라 네트워크에 연결된 시스템에 대한 악의적인 해킹과 침입이 빈번하게 발생하고 있으며, 각종 시스템을 운영하는 정부기관, 관공서, 기업 등에서는 이러한 해킹 및 침입에 의해 치명적인 타격을 입을 수 있는 상황에 놓여 있다. 이에 따라 인가되지 않았거나 비정상적인 활동들을 탐지, 식별하여 적절하게 대응하는 침입탐지 시스템에 대한 관심과 수요가 높아지고 있으며, 침입탐지 시스템의 예측성능을 개선하려는 연구 또한 활발하게 이루어지고 있다. 본 연구 역시 침입탐지 시스템의 예측성능을 개선하기 위한 새로운 지능형 침입탐지모형을 제안한다. 본 연구의 제안모형은 비교적 높은 예측력을 나타내면서 동시에 일반화 능력이 우수한 것으로 알려진 Support Vector Machine(SVM)을 기반으로, 비대칭 오류비용을 고려한 분류기준값 최적화를 함께 반영하여 침입을 효과적으로 차단할 수 있도록 설계되었다. 제안모형의 우수성을 확인하기 위해, 기존 기법인 로지스틱 회귀분석, 의사결정나무, 인공신경망과의 결과를 비교하였으며 그 결과 제안하는 SVM 모형이 다른 기법에 비해 상대적으로 우수한 성과를 보임을 확인할 수 있었다.

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.