• Title/Summary/Keyword: 재현율 향상 방식

Search Result 29, Processing Time 0.023 seconds

Improving Recall for Context-Sensitive Spelling Correction Rules Through Integrated Constraint Loosening Method (통합적 제약완화 방식을 통한 한국어 문맥의존 철자오류 교정규칙의 재현율 향상)

  • Choi, Hyunsoo;Yoon, Aesun;Kwon, Hyukchul
    • KIISE Transactions on Computing Practices
    • /
    • v.21 no.6
    • /
    • pp.412-417
    • /
    • 2015
  • Context-sensitive spelling errors (CSSE) are hard to correct, since they are perfect words when analyzed alone. Determined only by considering the semantic and syntactic relations of their context, CSSEs affect largely the performance of spelling and grammar checkers. The existing Korean Spelling and Grammar Checker (KSGC 4.5) adopts a rule-based method, which uses hand-made correction rules for CSSEs. Using rule-based method, the KSGC 4.5 is designed to obtain the very high precision, which results in the extremely low recall. In this paper, we integrate our previous works that control the CSSE correction rules, in order to improve the recall without sacrificing the precision. In addition to the integration, facultative insertion of adverbs and conjugation suffix of predicates are also considered, as for constraint-loosening linguistic features.

Improving Recall for Context-Sensitive Spelling Correction Rules by Combining Rule-Generalization and Statistical Method (규칙의 일반화와 통계 방식을 결합한 한국어 문맥의존 철자오류 교정규칙의 재현율 향상)

  • Choi, Hyun-Soo;Kwon, Hyuk-Chul;Yoon, Aesun
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.18-23
    • /
    • 2014
  • 한국어 맞춤법 검사기는 전자화된 한국어 텍스트에 나타난 오류어를 검색하여 이를 교정할 대치어를 제시하는 시스템이다. 이때 오류어의 유형은 크게 단순 철자오류와 문맥의존 철자오류로 구분할 수 있다. 이중 문맥의존 철자오류는 어절(word)단위로 봤을 때는 정확하지만, 문맥을 고려하였을 때 오류가 되는 유형으로 교정 난도가 매우 높다. 문맥의존 철자오류의 교정 방법은 크게 규칙을 이용한 방법과 통계 정보에 기반을 둔 방법으로 나뉜다. 이때 규칙을 이용한 방법은 그 특성상 정확도가 매우 높지만, 반대로 재현율이 매우 낮다. 본 논문에서는 본 연구진이 기존에 연구하였던 규칙을 일반화하는 방식에 추가로 조건부 확률을 이용한 통계 방식을 결합하여 정확도를 유지하면서 재현율을 향상시키는 방법을 제안한다.

  • PDF

Improving Recall for Context-Sensitive Spelling Correction Rules using Conditional Probability Model with Dynamic Window Sizes (동적 윈도우를 갖는 조건부확률 모델을 이용한 한국어 문맥의존 철자오류 교정 규칙의 재현율 향상)

  • Choi, Hyunsoo;Kwon, Hyukchul;Yoon, Aesun
    • Journal of KIISE
    • /
    • v.42 no.5
    • /
    • pp.629-636
    • /
    • 2015
  • The types of errors corrected by a Korean spelling and grammar checker can be classified into isolated-term spelling errors and context-sensitive spelling errors (CSSE). CSSEs are difficult to detect and to correct, since they are correct words when examined alone. Thus, they can be corrected only by considering the semantic and syntactic relations to their context. CSSEs, which are frequently made even by expert wiriters, significantly affect the reliability of spelling and grammar checkers. An existing Korean spelling and grammar checker developed by P University (KSGC 4.5) adopts hand-made correction rules for correcting CSSEs. The KSGC 4.5 is designed to obtain very high precision, which results in an extremely low recall. Our overall goal of previous works was to improve the recall without considerably lowering the precision, by generalizing CSSE correction rules that mainly depend on linguistic knowledge. A variety of rule-based methods has been proposed in previous works, and the best performance showed 95.19% of average precision and 37.56% of recall. This study thus proposes a statistics based method using a conditional probability model with dynamic window sizes. in order to further improve the recall. The proposed method obtained 97.23% of average precision and 50.50% of recall.

An Experimental Study on Semantic Searches for Image Data Using Structured Social Metadata (구조화된 소셜 메타데이터를 활용한 이미지 자료의 시맨틱 검색에 관한 실험적 연구)

  • Kim, Hyun-Hee;Kim, Yong-Ho
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.44 no.1
    • /
    • pp.117-135
    • /
    • 2010
  • We designed a structured folksonomy system in which queries can be expanded through tag control; equivalent, synonym or related tags are bound together, in order to improve the retrieval efficiency (recall and precision) of image data. Then, we evaluated the proposed system by comparing it to a tag-based system without tag control in terms of recall, precision, and user satisfaction. Furthermore, we also investigated which query expansion method is the most efficient in terms of retrieval performance. The experimental results showed that the recall, precision, and user satisfaction rates of the proposed system are statistically higher than the rates of the tag-based system, respectively. On the other hand, there are significant differences among the precision rates of query expansion methods but there are no significant differences among their recall rates. The proposed system can be utilized as a guide on how to effectively index and retrieve the digital content of digital library systems in the Library 2.0 era.

Improvement of Stimulus Pattern and Design of Discrimination System for Coincident ratio Elevation with Traditional Meridians (고전경락과의 부합율 향상을 위한 경혈자극방식의 개선 및 식별시스템의 설계)

  • Lee, Yong-Heum;Ko, Su-Bok;Jeong, Dong-Myong
    • Journal of IKEEE
    • /
    • v.7 no.1 s.12
    • /
    • pp.22-31
    • /
    • 2003
  • Conventional stimulus patterns have used DC for discrimination of acupoint and meridian which is the basic object of diagnosis and medical treatment in oriental medicine. Those discriminate conduction points by stimulation on body skin with DC. But, it is insufficient to reliability in discrimination ratio, coincident ratio, body effect, reproductivity. Therefore, this paper has extracted the optimal parameter of frequency and waveform in order to improve conventional pattern, and proposed the SPAC(Single Power Alternative Current) stimulus pattern applying that. Also, We proposes algorithm which is able to discriminate with low pressure of the electrode by displaying in the level meter both the absolution and relation value of the skin current. It can decrease pain and body effect by electrode pressure and discriminate acupoint regardless of skin current in difficult discrimination spot. We have compared the performance of system applying the extracted optimal parameter and algorithm. We have compared discrimination, coincident ratio of both conduction point and traditional acupoints by acupoint stimulation pattern. In the results, we confirmed reliability of SPAC stimulus pattern.

  • PDF

Modified ARIMA-based Distance Learning Learner Preprocessing Study (수정된 ARIMA 기반 원격교육 학습자 전처리 연구)

  • Min, Youn A;Baek, YeongTae
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.535-536
    • /
    • 2022
  • 본 논문 원격교육환경에서 학습자가 남긴 개별 데이터에 대한 장기적 관리 및 효율적 학습자 관리를 위한 데이터 전처리 방법으로 전통적인 ARIMA를 수정하여 연구하였다. ARIMA는 과거시점 데이터에 대한 회귀식과 변화율을 현 시점 데이터에 반영하는 방식이며 본 연구에서는 ARIMA 처리과정에서 딥러닝 알고리즘인 RNN의 변형방법인 LSTM을 적용하여 부분 데이터셋의 전처리과정에 대한 정확성과 재현율을 높이도록 하였다. 본 연구의 결과 전통적인 ARIMA 적용시와 대비하여 7~9%의 성능향상을 확인하였다.

  • PDF

Reusable Component Retrieval Based on Software Architecture (소프트웨어 아키텍쳐 기반의 재사용 가능한 컴포넌트 검색)

  • Lee, Seung-Geun;An, Chi-Don;Lee, Yun-Su;Wang, Chang-Jong
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.11
    • /
    • pp.1099-1105
    • /
    • 2000
  • 이 연구에서는 재사용을 위한 소프트웨어 아키텍쳐 검색 방법과 아키텍쳐의 재사용에 필요한 컴포넌트를 효율적으로 검색하기 위해 변경된 시그니쳐 일치와 검색 방법을 제안한다. 제안된 검색 방식은 소프트웨어 아키텍쳐 검색을 통해 컴포넌트의 검색 범위를 제한함으로써 검색의 정확성과 재현율을 향상시키고, 일치 수행의 비교 횟수를 줄임으로써 검색 수행 시간을 감소시켰다. 또한 이미 정의된 소프트웨어 아키텍쳐와 컴포넌트의 재상용을 향상시킬 수 있다.

  • PDF

The Utilization of Local Document Information to Improve Statistical Context-Sensitive Spelling Error Correction (통계적 문맥의존 철자오류 교정 기법의 향상을 위한 지역적 문서 정보의 활용)

  • Lee, Jung-Hun;Kim, Minho;Kwon, Hyuk-Chul
    • KIISE Transactions on Computing Practices
    • /
    • v.23 no.7
    • /
    • pp.446-451
    • /
    • 2017
  • The statistical context-sensitive spelling correction technique in this thesis is based upon Shannon's noisy channel model. The interpolation method is used for the improvement of the correction method proposed in the paper, and the general interpolation method is to fill the middle value of the probability by (N-1)-gram and (N-2)-gram. This method is based upon the same statistical corpus. In the proposed method, interpolation is performed using the frequency information between the statistical corpus and the correction document. The advantages of using frequency of correction documents are twofold. First, the probability of the coined word existing only in the correction document can be obtained. Second, even if there are two correction candidates with ambiguous probability values, the ambiguity is solved by correcting them by referring to the correction document. The method proposed in this thesis showed better precision and recall than the existing correction model.

주사형 정전용량 현미경(SCaM)의 개발

  • 김응규
    • 전기의세계
    • /
    • v.42 no.9
    • /
    • pp.6-11
    • /
    • 1993
  • 미소탐침을 STM과 같이 PZT등의 압전액튜에이터로 대상물을 2차원 또는 2.5차원 주사해서 그 정전량을 화상화하는 주사형 정전용량 현미경(SCaM)의 개발에 대해서 기술했다. 광학현미경과 레이저현미경은 빛을 이용하기 때문에 파장의 제약을 받아 그 분해능의 한계는 0.3[.nu.m]정도이다. 이것에 대해 SCaM은 광학방식가 같은 분해능의 원리적 한계가 없고, 또한 광학상과는 다른 유전율상의 특성화상이 얻어진다. 이와같은 특징에 의해, 최종적으로 0.01[.mu.m]레벨의 분해능을 얻을 수 있는 실용레벨의 현미경을 시험제작함을 목적으로 하고 있다. 본 연구에서는 탐침과 시료표면간의 거리를 진동에 의해 미소로 변화시켰을 때의 정전용량의 변화를 포착하는 미분용량법을 이용했으며, 탐침높이 및 주사시에 있어서의 검출기 출력의 재현성, 즉 신호 검출방식으로서의 S/N이 양호한 동기검파를 이용했을 대해서 실험적 검토를 하였다. 이와같은 검파방식에 의해 잡음, 히스테리시스 등의 영향에 대해 개선이 되고, 분해능도 향상되었다. 더욱이 2.5차원 탐침 주사방식 미분용량형 정전용량 현미경에 의해 칼날 부분 선단부의 확대화상이 명료하게 얻어졌다. 그러나 실용적으로는 아직 불충분하다.

  • PDF

An Implementation of Web-Based Korean Language Information Retrieval System (웹기반 한글정보검색시스템의 구현)

  • Hong, G.C.;Chung, H.S.
    • Electronics and Telecommunications Trends
    • /
    • v.14 no.6 s.60
    • /
    • pp.9-21
    • /
    • 1999
  • 최근 인터넷상에는 매일 방대한 양의 정보가 창출되어 유포되고 있으며, 수많은 정보 제공 사이트들이 늘고 있다. 이용자들은 필요한 정보를 찾고 활용하기 위해 야후(Yahoo), 알타비스타(AltaVista) 등 국외 검색엔진(search engine)들과 심마니, 미스 다찾니 등 국내 검색엔진 등 인터넷상에 운용되고 있는 이들 시스템들을 이용하고 있지만, 대부분의 시스템들은 자체 정보 제공보다는 로봇 에이전트를 이용하여 인터넷 사이트에 등록되어 있는 다양한 분야의 홈페이지 정보들을 수집/분석하여 관련 사이트를 연결해주는 방식의 메타 검색엔진들로서 불필요한 정보들까지 제공함에 따라 이용자들이 필요로 하는 정보를 찾기에는 너무 많은 노력과 시간을 소모하게 되는 문제점을 안고 있다. 이에 본 고에서는 형태소 분석 및 시소러스 사전을 이용하여 검색의 정확성 및 재현율 향상을 고려하고, 주제어 중심의 불리언 검색뿐만 아니라 하이퍼텍스트 기반의 주제어 카탈로그 검색, 각기 다른 사이트의 검색엔진들로부터 질의한 결과를 통합하여 제공하는 지능형 통합검색, 이용자 프로파일에 근거하여 최신 업데이트된 정보를 주기적으로 제공해주는 맞춤정보서비스(Selective Dissemination of Information Service: SDI) 등을 통합한 인터넷 기반의 한글 정보검색시스템의 구현에 대한 내용을 기술하고자 한다.