• Title/Summary/Keyword: 한글 검출

Search Result 81, Processing Time 0.026 seconds

Similarity Measurement System of Korean Documents Using the Specified Particles and High Frequency Words (특정 조사와 빈도수 높은 단어를 이용한 한글 논문의 유사도 측정 시스템 구현)

  • Yoo, Seung-Hee;Han, So-Hee;Cho, Dong-Sub
    • Proceedings of the KIEE Conference
    • /
    • 2007.07a
    • /
    • pp.1829-1830
    • /
    • 2007
  • 인터넷의 발달로 대량의 전자문서들을 손쉽게 구할 수 있는 정보의 바다라 불리는 현대사회에서 논문 표절은 심각한 문제를 안게 되었다. 표절여부를 검사하는 방법에는 여러 가지가 있지만 보다 정확하고 빠르게 검출할 수 있는 기법이 요구된다. 외국에서는 표절을 검사하기 위한 시스템적인 접근이 이루어지고 있지만 국내에서의 표절 검사에 대한 연구는 아직 초기 단계에 있다. 본 논문에서는 논문 표절 검사 시스템에 사용되는 기법 중 지문법을 바탕으로 하지만 기존의 단어, 문장 등을 사용하는 방법과 차별을 두어 몇몇 주요 단어와 특정 조사의 비교를 이용해 유사성을 측정하여 보다 빠르고 정확하게 검출할 수 있는 시스템을 구현해 보았다.

  • PDF

Improving Dialogue Intent Classification Performance with Uncertainty Quantification based OOD Detection (불확실성 정량화 기반 OOD 검출을 통한 대화 의도 분류 모델의 성능 향상)

  • Jong-Hun Shin;Yohan Lee;Oh-Woog Kwon;Young-Kil Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.517-520
    • /
    • 2022
  • 지능형 대화 시스템은 줄곧 서비스의 목표와 무관한 사용자 입력을 전달받아, 그 처리 성능을 의심받는다. 특히 종단간 대화 이해 생성 모델이나, 기계학습 기반 대화 이해 모델은 학습 시간대에 한정된 범위의 도메인 입력에만 노출됨으로, 사용자 발화를 자신이 처리 가능한 도메인으로 과신하는 경향이 있다. 본 연구에서는 대화 생성 모델이 처리할 수 없는 입력과 신뢰도가 낮은 생성 결과를 배제하기 위해 불확실성 정량화 기법을 대화 의도 분류 모델에 적용한다. 여러 번의 추론 샘플링이 필요 없는 실용적인 예측 신뢰도 획득 방법과 함께, 평가 시간대와 또다른 도메인으로 구성된 분포 외 입력 데이터를 학습에 노출시키는 것이 분포 외 입력을 구분하는데 도움이 되는지를 실험으로 확인한다.

  • PDF

An Improvement Method for the Braille Labeling of Beverage Products Using OpenCV (OpenCV를 활용한 음료 제품 점자 표기 개선 방안)

  • Choi, Hyo Hyun;Moon, Su Hyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.447-448
    • /
    • 2022
  • 본 논문에서는 대중의 참여를 통해 캔 음료 제품의 점자 표기 실태를 파악하고, 음료 제조사가 이를 개선하도록 유도하는 방안을 제안한다. 캔 음료 상단에 표기된 점자를 촬영한 이미지에서 OpenCV를 통해 점자의 윤곽을 검출하고, 검출된 윤곽의 좌표를 계산하여 점자를 국문으로 번역하는 모듈을 개발한 후 서버에 이식한다. 서버와 통신하는 모바일 애플리케이션을 개발하여 소비자가 점자 이미지를 서버에 업로드하고, 점자의 인식결과를 확인할 수 있도록 한다. 점자 표기가 적절하지 않다고 판단하는 경우 해당 제품에 대한 정보를 기록하도록 하고, 제조사 별로 제보된 횟수의 순위를 제공한다. 이를 통해 소비자는 올바른 점자 표기를 제공하지 않는 제조사를 파악할 수 있으며, 제조사는 이를 의식하고 점자 표기를 개선할 수 있는 효과를 기대한다.

  • PDF

Detecting Errors in Dependency Treebank through XGBoost and Cross Validation (XGBoost와 교차 검증을 이용한 구문분석 말뭉치에서의 오류 탐지)

  • Choi, Min-Seok;Kim, Chang-Hyun;Cheon, Min-Ah;Park, Hyuk-Ro;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.103-107
    • /
    • 2020
  • 의존구조 말뭉치는 자연언어처리 분야에서 문장의 의존관계를 파악하는데 널리 사용된다. 이러한 말뭉치는 일반적으로 오류가 없다고 가정하지만, 현실적으로는 다양한 오류를 포함하고 있다. 이러한 오류들은 성능 저하의 요인이 된다. 이러한 문제를 완화하려고 본 논문에서는 XGBoost와 교차검증을 이용하여 이미 구축된 구문분석 말뭉치로부터 오류를 탐지하는 방법을 제안한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로, 일반적인 분류기로서 오류를 검출할 수 없다. 본 논문에서는 분류기의 결과를 분석하여 오류를 검출하는 방법을 제안한다. 성능을 분석하려고 표본집단과 모집단의 오류 분포의 차이를 분석하였고 표본집단과 모집단의 오류 분포의 차이가 거의 없는 것으로 보아 제안된 방법이 타당함을 알 수 있었다. 앞으로 의미역 부착 말뭉치에 적용할 계획이다.

  • PDF

Remote Drawing Technology Based on Motion Trajectories Analysis (움직임 궤적 분석 기반의 원거리 판서 기술)

  • Leem, Seung-min;Jeong, Hyeon-seok;Kim, Sung-young
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.9 no.2
    • /
    • pp.229-236
    • /
    • 2016
  • In this paper, we suggest new technology that can draw characters at a long distance by tracking a hand and analysing the trajectories of hand positions. It's difficult to recognize the shape of a character without discriminating effective strokes from all drawing strokes. We detect end points from input trajectories of a syllable with camera system and localize strokes by using detected end points. Then we classify the patterns of the extracted strokes into eight classes and finally into two categories of stroke that is part of syllable and not. We only draw the strokes that are parts of syllable and can display a character. We can get 88.3% in classification accuracy of stroke patterns and 91.1% in stroke type classification.

Implementation of Real-time Recognition System for Korean Sign Language (한글 수화의 실시간 인식 시스템의 구현)

  • Han Young-Hwan
    • The Journal of the Korea Contents Association
    • /
    • v.5 no.4
    • /
    • pp.85-93
    • /
    • 2005
  • In this paper, we propose recognition system which tracks the unmarked hand of a person performing sign language in complex background. First of all, we measure entropy for the difference image between continuous frames. Using a color information that is similar to a skin color in candidate region which has high value, we extract hand region only from background image. On the extracted hand region, we detect a contour and recognize sign language by applying improved centroidal profile method. In the experimental results for 6 kinds of sing language movement, unlike existing methods, we can stably recognize sign language in complex background and illumination changes without marker. Also, it shows the recognition rate with more than 95% for person and $90\sim100%$ for each movement at 15 frames/second.

  • PDF

Automatic Recognition of Hand-written Hangout by the Phase Rotation (위상회전에 의한 필기체 한글의 자동인식)

  • 이주근;김홍기
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.13 no.1
    • /
    • pp.23-30
    • /
    • 1976
  • In this paper, a method is proposed for the recognition of hand-written Hangeul. This is peiformed by extraction of the concave structural segments by phase rotation. Character patterns can be decomposed into the fundamental concave structural segments which are also categorized into segment sects, and the closure and phase features of each segment in set is represented by logics. By rotating the logic pattern, the topological and phase features of segment are extracted for the reliable recognition of the character. It is also evaluated that this method applies to a wide variety of shape, position and declination of the character.

  • PDF

Human Friendly Recognition and Editing Support System of Korean Language (인간에게 친밀한 한글 인식 및 편집 지원시스템)

  • Sohn, Young-Sun
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.17 no.4
    • /
    • pp.494-499
    • /
    • 2007
  • In this paper we realized a system, if a user selects the area of the important parts or the arrangement parts when he reads the books or the papers, which amends, stores and readjusts the characters that are included in the selected area by outputting the characters to the word processor in sequence. If a user selects what he wishes lot with his finger, the system detects the movement of the finger by applying the hand recognition algorithm and recognizes the selected area. The system converts the distance of the width and the length of the selected area to the number of the pulse, and controls the motor to move the camera at the position. After the system scales up/down the zoom to be able to recognize the character and controls the focus to the regulated zoom closely, it controls the focus in detail to get more distinct image by using the difference of the light and darkness. We realize the recognition and editing support system of korean language that converts the obtained images to the document by applying the character recognition algorithm and arrange the important parts.

A Study on Validation Testing for Input Files of MS Word-Processor (MS 워드프로세서의 입력 파일에 대한 유효성 테스팅 방법에 관한 연구)

  • Yun, Young-Min;Choi, Jong-Cheon;Yoo, Hae-Young;Cho, Seong-Je
    • The KIPS Transactions:PartC
    • /
    • v.14C no.4
    • /
    • pp.313-320
    • /
    • 2007
  • In this paper, we propose a method to analyze security vulnerabilities of MS word-processor by checking the validation of its input files. That is, this study is to detect some vulnerabilities in the input file of the word processor by analyzing the header information of its input file. This validation test can not be conducted by the existing software fault injection tools including Holodeck and CANVAS. The proposed method can be also applied to identify the input file vulnerabilities of Hangul and Microsoft Excel which handle a data file with a header as an input. Moreover, our method can provide a means for assessing the fault tolerance and trustworthiness of the target software.

Automatic cognitive processing of korean written language as indexed by visual MMN(vMMN) (시각적 MMN(vMMN)의 분석을 통한 한국어 글말의 무의식적인 인지과정 연구)

  • Lee, Sung Eun
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.67-72
    • /
    • 2009
  • ERP의 일종인 MMN(Mismatch Negativity)은 언어의 청각 인지정보 처리과정(central auditory processing)을 규명하는 데 유용한 수단으로 이용되어 왔다. 그런데, 최근의 연구들은 이러한 MMN이 청각 자극뿐만 아니라 시각 자극에 의해서도 검출될 수 있음을 밝혀냈다. 본 연구는 이러한 시각적 MMN을 이용하여 뇌에서 이루어지는 한국어 화자의 무의식적인 한국어 문자 정보처리과정을 규명하려고 시도하였다. 본 연구에서는 한국어의 글말 최소쌍 '므'/'모'와 '므'/'무', 이에 대응되는 비언어자극 '+ㅡ'/'+ㅗ'와 '+ㅡ'/'+ㅜ'(+표시의 아래에 모음을 붙여서 만든 인공문자, 그림1 참고)를 수동적(passive) Oddball paradigm으로 제시하고 언어 자극에 대한 EEG를 비언어자극과 비교 하에 측정, 분석하였다. 본 연구의 결과, 언어자극과 비언어자극 모두에서 시각적 MMN이 검출되었다. 하지만, 언어자극의 시각적 MMN이 비언어자극의 시각적 MMN보다 높게 나타남을 확인하였다. 이는 한국어 모국어화자들이 무의식적인 인지과정에서 언어자극이 갖는 물리적인 시각 정보뿐만 아니라 한국어 문자의 언어적 정보도 함께 처리하고 있음을 보여주는 것이다. 본 연구의 결과들은 한국어 글말의 무의식적인 인지처리과정을 밝혀주는 한편, 한국어 문자가 인지과학에서 갖는 중요한 지위를 보여줄 수 있을 것으로 기대된다.

  • PDF