• 제목/요약/키워드: 재현율 향상 방식

검색결과 29건 처리시간 0.024초

통합적 제약완화 방식을 통한 한국어 문맥의존 철자오류 교정규칙의 재현율 향상 (Improving Recall for Context-Sensitive Spelling Correction Rules Through Integrated Constraint Loosening Method)

  • 최현수;윤애선;권혁철
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권6호
    • /
    • pp.412-417
    • /
    • 2015
  • 문맥의존 철자오류는 단독으로 사용하면 정확한 어절이지만, 문맥을 고려했을 때 오류인 유형이다. 이를 검색하고 교정하기가 매우 어려우며, 고품질 맞춤법 검사기의 성능을 크게 좌우한다. 한국어 맞춤법 검사기에서의 문맥의존 철자오류는 언어 전문가에 의해 수작업으로 구축된 교정규칙을 사용하는 것이 가장 일반적이다. 이때 규칙을 이용한 방법은 그 특성상 교정 정확도는 매우 높지만, 재현율은 매우 낮다. 본 논문에서는 기존에 연구되었던 교정규칙에서의 선택제약 명사 확장 방식과 조사 제약조건을 완화하는 방법을 통합하여 정확도를 유지하거나 거의 낮추지 않으면서, 재현율을 향상시키는 방법을 제안한다. 또한, 두 방식을 단순하게 통합하지 않고 수의적 부사 삽입과 활용형, 관형형을 고려하여 단계별로 통합하는 방식을 제안하여 평균적으로 정확도를 거의 낮추지 않고 재현율을 약 13% 향상시킨다.

규칙의 일반화와 통계 방식을 결합한 한국어 문맥의존 철자오류 교정규칙의 재현율 향상 (Improving Recall for Context-Sensitive Spelling Correction Rules by Combining Rule-Generalization and Statistical Method)

  • 최현수;권혁철;윤애선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.18-23
    • /
    • 2014
  • 한국어 맞춤법 검사기는 전자화된 한국어 텍스트에 나타난 오류어를 검색하여 이를 교정할 대치어를 제시하는 시스템이다. 이때 오류어의 유형은 크게 단순 철자오류와 문맥의존 철자오류로 구분할 수 있다. 이중 문맥의존 철자오류는 어절(word)단위로 봤을 때는 정확하지만, 문맥을 고려하였을 때 오류가 되는 유형으로 교정 난도가 매우 높다. 문맥의존 철자오류의 교정 방법은 크게 규칙을 이용한 방법과 통계 정보에 기반을 둔 방법으로 나뉜다. 이때 규칙을 이용한 방법은 그 특성상 정확도가 매우 높지만, 반대로 재현율이 매우 낮다. 본 논문에서는 본 연구진이 기존에 연구하였던 규칙을 일반화하는 방식에 추가로 조건부 확률을 이용한 통계 방식을 결합하여 정확도를 유지하면서 재현율을 향상시키는 방법을 제안한다.

  • PDF

동적 윈도우를 갖는 조건부확률 모델을 이용한 한국어 문맥의존 철자오류 교정 규칙의 재현율 향상 (Improving Recall for Context-Sensitive Spelling Correction Rules using Conditional Probability Model with Dynamic Window Sizes)

  • 최현수;권혁철;윤애선
    • 정보과학회 논문지
    • /
    • 제42권5호
    • /
    • pp.629-636
    • /
    • 2015
  • 한국어 맞춤법 검사기가 교정하는 오류어의 유형은 크게 단순 철자오류와 문맥의존 철자오류로 구분할 수 있다. 이 중 문맥의존 철자오류는 어절(word)단위로 봤을 때는 올바르지만, 문맥을 고려하였을 때 오류가 되는 유형으로, 교정 난도가 매우 높다. 문맥의존 철자오류는 글을 쓰는 사람들도 자주 저지르는 오류이므로, 이를 잘 검색하여 정확하게 교정하는 것이 맞춤법 검사기의 사용자가 갖는 신뢰도에 큰 영향을 미친다. 높은 정확도가 매우 중요하므로, 문맥의존 철자오류의 교정 방법은 대부분 규칙에 기반한다. 반대 급부로 재현율이 매우 낮다는 단점을 갖는다. 문맥의존 철자오류의 교정에서 재현율을 높이기 위한 방법은 크게 언어지식을 이용하여 규칙을 일반화하는 방법과 통계 정보에 기반을 하여 공기 어휘의 제약 조건을 확장하는 방법으로 나뉠 수 있다. 기존 연구는 언어지식을 이용하여 규칙을 일반화하는 다양한 방식을 연구했으나, 최고 성능이 평균 정확도 95.19%, 평균 재현율 37.56%을 보였다. 본 논문에서는 통계정보에 기반한 규칙의 확장 방식을 제안한다. 동적 윈도우를 갖는 조건부확률 모델을 이용한 방법이며, 최고 성능은 평균 정확도 97.23%, 평균 재현율 50.50%을 보여주었다.

구조화된 소셜 메타데이터를 활용한 이미지 자료의 시맨틱 검색에 관한 실험적 연구 (An Experimental Study on Semantic Searches for Image Data Using Structured Social Metadata)

  • 김현희;김용호
    • 한국문헌정보학회지
    • /
    • 제44권1호
    • /
    • pp.117-135
    • /
    • 2010
  • 본 연구는 이미지의 시맨틱 검색을 위해서 동등어, 동의어 및 관련어를 질의 확장시에 사용하여 태그를 통제한 구조화된 폭소노미 시스템의 모형을 제안하였다. 그런 다음 제안한 시스템의 효율성을 평가하기 위해서 실험을 통해서 이 시스템을 태그를 전혀 통제하지 않은 태그 기반 시스템과 검색 효율성(재현율과 정확률)과 만족도 측면에서 비교해 보았다. 이외에 검색 효율성이 질의 확장 방식에 따라서 어떤 차이를 보이는지 조사해 보았다. 실험 결과, 제안된 구조화된 폭소노미 시스템이 태그 기반 시스템 보다 재현율, 정확률 및 만족도에서 더 높게 나타났으며 그 차이도 통계적으로 유의미한 것으로 나타났다. 한편 질의 확장 방식에 따라서 재현율은 차이가 없었지만 정확률은 부분적으로 차이가 있는 것으로 나타났다. 본 연구 결과는 라이브러리 2.0 시대의 디지털 도서관 시스템에 적용되어 디지털 자원에 대한 접근성을 향상시킬 수 있을 것이다.

고전경락과의 부합율 향상을 위한 경혈자극방식의 개선 및 식별시스템의 설계 (Improvement of Stimulus Pattern and Design of Discrimination System for Coincident ratio Elevation with Traditional Meridians)

  • 이용흠;고수복;정동명
    • 전기전자학회논문지
    • /
    • 제7권1호
    • /
    • pp.22-31
    • /
    • 2003
  • 한의학에서 진단과 치료의 기본 대상인 경혈?경락의 혈위 식별을 위한 방법으로 기존의 방식은 직류를 인체 피부에 자극하여 양도점을 식별하고 있다. 그러나 직류는 피부의 저항과 용량성으로 인한 시간에 따른 전류 감소현상을 나타내며, 이러한 시간적 감소현상은 경락진단의 변수로는 유의성을 가지나 식별율 및 부합율, 인체영향력, 재현성 등에서 식별데이터의 신뢰성이 충분하지 못한 단점이 있었다. 이를 개선하기 위하여 1.28V의 4kHz, 듀티비 40%의 구형파인 SPAC(Single Power Alternative Current) 자극방식의 최적 파라메터를 추출하였다. 또한 피부 상태에 관계없이 식별이 어려운 부위에서도 식별이 용이하도록 피부 전류량의 절대값과 상대값을 동시에 표시하고, 측정 전류량을 그래프로 연속 표시하여 식별에 유리하도록 하였다. 추출된 최적파라메터와 알고리즘을 적용한 시스템을 구현하여 경혈자극 방식에 따른 식별율, 재현성, 인체영향력 및 고전 경혈점과의 부합율을 비교하여 성능이 우수함을 확인하였다.

  • PDF

수정된 ARIMA 기반 원격교육 학습자 전처리 연구 (Modified ARIMA-based Distance Learning Learner Preprocessing Study)

  • 민연아;백영태
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.535-536
    • /
    • 2022
  • 본 논문 원격교육환경에서 학습자가 남긴 개별 데이터에 대한 장기적 관리 및 효율적 학습자 관리를 위한 데이터 전처리 방법으로 전통적인 ARIMA를 수정하여 연구하였다. ARIMA는 과거시점 데이터에 대한 회귀식과 변화율을 현 시점 데이터에 반영하는 방식이며 본 연구에서는 ARIMA 처리과정에서 딥러닝 알고리즘인 RNN의 변형방법인 LSTM을 적용하여 부분 데이터셋의 전처리과정에 대한 정확성과 재현율을 높이도록 하였다. 본 연구의 결과 전통적인 ARIMA 적용시와 대비하여 7~9%의 성능향상을 확인하였다.

  • PDF

소프트웨어 아키텍쳐 기반의 재사용 가능한 컴포넌트 검색 (Reusable Component Retrieval Based on Software Architecture)

  • 이승근;안치돈;이윤수;왕창종
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권11호
    • /
    • pp.1099-1105
    • /
    • 2000
  • 이 연구에서는 재사용을 위한 소프트웨어 아키텍쳐 검색 방법과 아키텍쳐의 재사용에 필요한 컴포넌트를 효율적으로 검색하기 위해 변경된 시그니쳐 일치와 검색 방법을 제안한다. 제안된 검색 방식은 소프트웨어 아키텍쳐 검색을 통해 컴포넌트의 검색 범위를 제한함으로써 검색의 정확성과 재현율을 향상시키고, 일치 수행의 비교 횟수를 줄임으로써 검색 수행 시간을 감소시켰다. 또한 이미 정의된 소프트웨어 아키텍쳐와 컴포넌트의 재상용을 향상시킬 수 있다.

  • PDF

통계적 문맥의존 철자오류 교정 기법의 향상을 위한 지역적 문서 정보의 활용 (The Utilization of Local Document Information to Improve Statistical Context-Sensitive Spelling Error Correction)

  • 이정훈;김민호;권혁철
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권7호
    • /
    • pp.446-451
    • /
    • 2017
  • 본 논문에서의 문맥의존 철자오류(Context-Sensitive Spelling Error) 교정 기법은 샤논(Shannon)의 노이지 채널 모형(noisy channel model)을 기반으로 한다. 논문에서 제안하는 교정 기법의 향상에는 보간(interpolation)을 사용하며, 일반적인 보간 방법은 확률의 중간 값을 채우는 방식으로 N-gram에 존재하지 않는 빈도를 (N-1)-gram과 (N-2)-gram 등에서 얻는다. 이와 같은 방식은 동일 통계 말뭉치를 기반으로 계산하는데 제안하는 방식에서는 통계 말뭉치와 교정 문서간의 빈도 정보를 이용하여 보간 한다. 교정 문서의 빈도를 이용하였을 때 이점은 다음과 같다. 첫째 통계 말뭉치에 존재하지 않고 교정 문서에서만 나타나는 신조어의 확률을 얻을 수 있다. 둘째 확률 값이 모호한 두 교정 후보가 있더라도 교정 문서를 참고로 교정하게 되어 모호성을 해소한다. 제안한 방법은 기존 교정 모형보다 정밀도와 재현율의 성능향상을 보였다.

주사형 정전용량 현미경(SCaM)의 개발

  • 김응규
    • 전기의세계
    • /
    • 제42권9호
    • /
    • pp.6-11
    • /
    • 1993
  • 미소탐침을 STM과 같이 PZT등의 압전액튜에이터로 대상물을 2차원 또는 2.5차원 주사해서 그 정전량을 화상화하는 주사형 정전용량 현미경(SCaM)의 개발에 대해서 기술했다. 광학현미경과 레이저현미경은 빛을 이용하기 때문에 파장의 제약을 받아 그 분해능의 한계는 0.3[.nu.m]정도이다. 이것에 대해 SCaM은 광학방식가 같은 분해능의 원리적 한계가 없고, 또한 광학상과는 다른 유전율상의 특성화상이 얻어진다. 이와같은 특징에 의해, 최종적으로 0.01[.mu.m]레벨의 분해능을 얻을 수 있는 실용레벨의 현미경을 시험제작함을 목적으로 하고 있다. 본 연구에서는 탐침과 시료표면간의 거리를 진동에 의해 미소로 변화시켰을 때의 정전용량의 변화를 포착하는 미분용량법을 이용했으며, 탐침높이 및 주사시에 있어서의 검출기 출력의 재현성, 즉 신호 검출방식으로서의 S/N이 양호한 동기검파를 이용했을 대해서 실험적 검토를 하였다. 이와같은 검파방식에 의해 잡음, 히스테리시스 등의 영향에 대해 개선이 되고, 분해능도 향상되었다. 더욱이 2.5차원 탐침 주사방식 미분용량형 정전용량 현미경에 의해 칼날 부분 선단부의 확대화상이 명료하게 얻어졌다. 그러나 실용적으로는 아직 불충분하다.

  • PDF

웹기반 한글정보검색시스템의 구현 (An Implementation of Web-Based Korean Language Information Retrieval System)

  • 홍기채;정현수
    • 전자통신동향분석
    • /
    • 제14권6호통권60호
    • /
    • pp.9-21
    • /
    • 1999
  • 최근 인터넷상에는 매일 방대한 양의 정보가 창출되어 유포되고 있으며, 수많은 정보 제공 사이트들이 늘고 있다. 이용자들은 필요한 정보를 찾고 활용하기 위해 야후(Yahoo), 알타비스타(AltaVista) 등 국외 검색엔진(search engine)들과 심마니, 미스 다찾니 등 국내 검색엔진 등 인터넷상에 운용되고 있는 이들 시스템들을 이용하고 있지만, 대부분의 시스템들은 자체 정보 제공보다는 로봇 에이전트를 이용하여 인터넷 사이트에 등록되어 있는 다양한 분야의 홈페이지 정보들을 수집/분석하여 관련 사이트를 연결해주는 방식의 메타 검색엔진들로서 불필요한 정보들까지 제공함에 따라 이용자들이 필요로 하는 정보를 찾기에는 너무 많은 노력과 시간을 소모하게 되는 문제점을 안고 있다. 이에 본 고에서는 형태소 분석 및 시소러스 사전을 이용하여 검색의 정확성 및 재현율 향상을 고려하고, 주제어 중심의 불리언 검색뿐만 아니라 하이퍼텍스트 기반의 주제어 카탈로그 검색, 각기 다른 사이트의 검색엔진들로부터 질의한 결과를 통합하여 제공하는 지능형 통합검색, 이용자 프로파일에 근거하여 최신 업데이트된 정보를 주기적으로 제공해주는 맞춤정보서비스(Selective Dissemination of Information Service: SDI) 등을 통합한 인터넷 기반의 한글 정보검색시스템의 구현에 대한 내용을 기술하고자 한다.