• 제목/요약/키워드: 맞춤법

검색결과 95건 처리시간 0.036초

한글 부호의 최적화 전송을 위한 한국어 낱자 분석 (An Analysis on the Korean Language for Optimum Transmission of Hangul Code)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.33-38
    • /
    • 2015
  • 본 논문은 한글부호의 전송을 최적화하는데 요구되는 한글낱자를 연구하였다. 한글낱자는 한국어를 구성하고 있는 한글을 토대로 하여 분석하였다. 한글낱자의 분석은 세가지 유형을 대상으로 하여 수행하였다. 첫번째 대상은 한글맞춤법 통일안의 24개 낱자이었다. 두번째 대상은 표준 두벌식 글자판의 낱자 28개이었다. 세 번째 대상은 한글맞춤법 통일안에 겹낱자를 포함한 총 54개 낱자이었다. 이 세가지 분석대상별로 각 낱자에 대한 사용빈도를 분석하였다. 국립국어원의 한국어자료에 수록된 총 한국어 단어는 총58,437개인데, 단어들은 총 1,540자의 글자로 구성되어 있다. 이 한글들을 분석한 결과, 사용빈도수를 보면, 첫 번째 대상의 경우, 닿소리는 "ㅇ"이 가장 많고 "ㅋ"이 가장 적었으며 홑소리는 "ㅏ"가 가장 많고 "ㅑ"가 가장 적었다. 두 번째 대상의 경우, 닿소리는 첫 번째 대상과 같고 홑소리는 "ㅏ"가 가장 많고 "ㅒ"가 가장 적었다. 세 번째 대상의 경우, 닿소리는 "ㄱ"이 가장 많고 "ㄽ"이 가장 적었으며 홑소리는 "ㅏ"가 가장 많고 "ㅞ"가 가장 적었다.

다자유도 곡선 맞춤법과 RKU 기법을 이용한 점탄성 감쇠재의 탄성 및 손실계수 추정방법 연구 (Study of the Measurement of Young's Modulus and Loss Factor for a Viscoelastic Damping Material Using a Multi Degree of Freedom Curve Fitting Method and RKU Equation)

  • 민천홍;박한일;배수룡;전재진
    • 한국해양공학회지
    • /
    • 제25권1호
    • /
    • pp.67-72
    • /
    • 2011
  • Offshore structures, such as a platform, a buoy, or a floating vessel, are exposed to several dynamic loads, and viscoelastic damping material is used to reduce the vibration of offshore structures. It is important to know the properties of viscoelastic materials because loss factor and Young's modulus of the viscoelastic damping material are dependent on frequency and temperature. In this study, an advanced technique for obtaining accurate loss factor and Young's modulus of the viscoelastic damping material is introduced based on a multi degree of freedom curve-fitting method and the RKU (Ross-Kerwin-Ungar) equations. The technique is based on a modified experimental procedure from ASTM E 756-04. Loss factor and Young's modulus of the viscoelastic damping material are measured for different temperatures by performing the test in a temperature-controlled vibration measurement room where temperature varies from 5 to 45 degrees Celsius.

한국특허정보의 표기법 문제 분석 (A survey on the description problems in the Korean patent information)

  • 김태중;최호남;이명선;신진섭
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.289-293
    • /
    • 2009
  • 특허정보는 기술정보로서 뿐만 아니라 산업정보로서 가치도 중요하게 인정되고 있다. 그러나 한국특허정보는 표기 형식과 맞춤법이 제대로 지켜지지 않고 있어 그 효용성이 떨어지며 활용하기 위해서 매우 많은 추가적인 노력이 필요하다. 이 논문에서는 일부 국내외의 데이터베이스의 평가 및 오류에 관한 연구 현황을 소개하였으며 한국과학기술정보연구원과 한국특허정보원에서 서비스하고 있는 한국특허정보에서 2008년 1월부터 10월 사이에 출원된 데이터에서 발견된 오류와 표기의 문제를 분석하고 특허정보의 가치를 높이기 위한 개선 방안을 제안한다.

  • PDF

한글 문서에서 형태적 중의 오류의 교정 (A method for morphological correction of ambiguous error)

  • 김민주;정준호;이현주;최재혁;김항준;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-48
    • /
    • 1998
  • 교정 시스템에 나타나는 오류 유형들 중에는 전체적인 교정률에 차지하는 비중은 적지만 출현할 때마다 틀릴 가능성이 아주 높은 오류들이 있다. 기존의 교정 시스템에서는 이러한 오류들에 대한 처리가 미흡한데, 철자 오류와 띄어쓰기 오류 중 형태가 비슷하거나 같은 형태가 다른 기능을 함으로써 발생하는 오류들이다. 이러한 오류는 일반 문서 작성자뿐만 아니라 한글 맞춤법에 대해 어느 정도 지식을 가진 사람의 경우에도 구분이 모호하다. 복합 명사와 미등록어를 제외한 오류 중 약 30%가 여기에 속한다. 따라서 본 논문에서는 이러한 오류 유형들을 분류하고, 이 중에서 빈번하게 출현하는 오류에 대한 교정을 시도하고, 오류 유형들이 문장 내에서 어떤 분포를 가지는지 알아본다. 약 617만 어절의 말뭉치를 이용하여 해당 형태와 다른 성분들과의 관련성을 조사하여 교정 방법을 제시하고, 형태소 분석을 하여 교정을 행한다. 코퍼스 655만 어절 대상으로 실험한 결과 84.6%의 교정률을 보였다. 본 논문에서 제시한 교정 방법은 기존의 교정 시스템에 추가되어 교정 시스템의 전체 교정률을 향상시킬 수 있다. 또한 이와 비슷한 유형의 다른 어휘 교정에 대한 기초 자료로 사용될 수 있을 것이다.

  • PDF

클래스 임베딩과 주의 집중 순환 신경망을 이용한 자주 묻는 질문의 자동 분류 (Automatic Classification of Frequently Asked Questions Using Class Embedding and Attentive Recurrent Neural Network)

  • 장영진;김학수;김세빈;강동호;장현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.367-370
    • /
    • 2018
  • 웹 또는 모바일 사용자는 고객 센터에 구축된 자주 묻는 질문을 이용하여 원하는 서비스를 제공받는다. 그러나 자주 묻는 질문은 사용자가 직접 핵심어를 입력하여 검색된 결과 중 필요한 정보를 찾아야 하는 어려움이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 사용자 질의를 입력 받아 질의에 해당하는 클래스를 분류해주는 문장 분류 모델을 제안한다. 제안모델은 웹이나 모바일 환경의 오타나 맞춤법 오류에 대한 강건함을 위해 자소 단위 합성곱 신경망을 사용한다. 그리고 기계 번역 이외에도 자연어 처리 부분에서 큰 성능 향상을 보여주는 주의 집중 방법과 클래스 임베딩을 이용한 문장 분류 시스템을 사용한다. 457개의 클래스 분류와 769개의 클래스 분류에 대한 실험 결과 Micro F1 점수 기준 81.32%, 61.11%의 성능을 보였다.

  • PDF

한국어 오류 교정 시스템의 구현 (Implementation of Korean Error Correction System)

  • 최재혁;김권양
    • 컴퓨터교육학회논문지
    • /
    • 제3권2호
    • /
    • pp.115-127
    • /
    • 2000
  • 기존 워드프로세서의 맞춤법 검사기는 여러 오류 단어 후보군 중에서 1개를 선택하는 오류 작업의 불편함과 60%대의 낮은 교정률 그리고 늦은 처리 속도 등의 단정을 갖고 있다. 본 연구에서는 이러한 단점들을 해결하기 위하여 1개의 교정 단어와 페이지 단위의 일괄 교정으로 교정의 불편함을 해소하고, 높은 오류 교정률과 빠른 처리 속도를 가능하게 하는 방안을 제시한다. 이를 위하여 형태소 분석 시 처리 속도를 향상시키기 위한 방법으로 양방향 최장일치법을 적용하며, 교정 시의 정확성보장과 처리 속도의 향상을 위한 사전과 여러 알고리즘(복합명사 분리, 보조용언 분리, 오타 교정 등) 등을 개발하여 적용하였다. 특히 한국어에서 모호성이 많이 발생되는 의존명사 및 접미사와 조사/어미의 구분 방안, "로써/로서, 되다" 등의 구분 처리 방안을 제시하여 교정 시스템의 신뢰성을 높였다.

  • PDF

XML 기반의 본문검색 미들웨어 시스템 설계 및 구현 (Design and Implementation of the Search Inside Middleware System by using XML)

  • 김효남
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.229-232
    • /
    • 2011
  • 최근 스마트 디바이스 기반의 다양한 콘텐츠 제작 공급에 대한 새로운 마켓 시장 형성과 태블릿 디바이스 기반의 전자책 시장 규모의 확대에 따른 새로운 유형의 디지털 콘텐츠 시장이 형성되고 있다. 디지털 미디어는 정보환경 범위를 종이의 범위에서 벗어나 매체와 연계한 다양한 형태로의 변화뿐만 아니라 서술 방식과 소통방식의 방법에도 변화를 발생하였다. 그리고 지면에서 국한된 아날로그 매체의 물리적, 공간적, 시간적인 한계를 뛰어넘어 다양한 콘텐츠를 손쉽게 접근할 수 있게 만들었다. 이런 환경에서 본문검색 서비스는 아날로그와 디지털 매체의 상호 공존관계를 형성할 수 있다. 본 논문에서는 그림종이문서를 본문검색이 가능한 이미지형태의 디지털문서로 변환해주는 디지털라이징 시스템으로 문자위치정보를 포함하는 광학문자인식(OCR)기능과 인식된 문자의 오류를 수정하는 에디터기능을 통해 추출된 내용을 XML형태로 제공하는 본문검색 시스템을 제안한다. 특히, 문자인식 후처리 공정에서 복수의 관학문자인식(OCR)엔진을 통해 결과 비교와 문자위치 정보 확인 및 편집, 맞춤법 검사 등의 특화된 기능 등은 본 논문에서 가지는 강점으로 디지털문서 구축에 소요되는 시간과 비용을 혁신적으로 절감시켜준다.

  • PDF

한국어 형태소 분석기 HAM의 형태소 분석 및 철자 검사 기능 (Morphological Analysis and Spelling Check Function of Korean Morphological Analyzer HAM)

  • 강승식;이하규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.246-252
    • /
    • 1996
  • 한국어 형태소 분석기의 효율성에 영향을 미치는 요인은 분석 알고리즘의 효율성보다도 어휘 사전 등 형태소 분석과 관련된 여러 가지 요인들이 미치는 영향이 훨씬 더 크다. 따라서 단어의 유형 분류 기법이나 불규칙 용언의 분석 방법을 비롯하여 어휘 사전의 구조 및 크기, 알고리즘의 선택과 구현 등 형태소 분석과 관련된 모든 요소들을 형태소 분석에 적합하도록 구성하여야 한다. 본 논문에서는 어휘형태소 사전과 문법형태소 사전의 크기, 한글 문서에 나타나는 단어의 특성 등 형태소 분석기의 효율 및 성능에 영향을 미치는 요소들을 고찰하였다. 그 결과로 알고리즘의 효율보다는 사전 탐색 시간이 형태소 분석에 미치는 영향이 매우 크다는 것을 알 수 있었다. 이와 같이 형태소 분석기의 성능에 영향을 미치는 요인들을 고려하여 구현된 범용 형태소 분석기 HAM에 대하여 형태소 분석 기능과 철자 검사 기능을 실험하였다. 형태소 분석 성공률에 대한 실험 결과 99.46%의 분석률을 보이고 있으며, 맞춤법 검사 기능으로는 상용화된 철자 검사기와 비슷한 성능을 보이고 있다. HAM의 처리 속도는 pentium 120MHz linux 2.0 환경에서 1 초에 약 1,000 단어를 분석한다.

  • PDF

위상 비교 모노 펄스 알고리즘에서 위상평균법을 이용한 추정 각도 정확도 향상 (Accuracy Improvement of the Estimated Angle Using Phase Averaging in Phase-Comparison Monopulse Algorithm)

  • 조병래;이정수;이종민;선선구
    • 한국전자파학회논문지
    • /
    • 제23권10호
    • /
    • pp.1212-1215
    • /
    • 2012
  • 레이다 간섭계에서 표적의 공간 도달 각도를 추정하는 방법 중에서 위상 비교 모노 펄스 알고리즘의 추정 각도 정확도를 향상시키기 위한 위상평균법 및 시간 지연 보상 방안을 제안하였다. 실시간 신호처리 시스템에 적용할 경우, 저역 통과 필터의 특성을 갖는 위상평균법을 적용하면 필연적으로 시간 지연이 발생한다. 이 문제점을 보완하기 위해 곡선 맞춤법을 이용하여 추정된 각도의 변화율을 계산하고 보상하여 실시간 신호처리 시스템에 적용 가능하도록 하였다. 제안 방법의 효용성을 입증하기 위해 실제 레이다 간섭계를 이용하여 획득된 데이터에 적용하여 추정된 각도의 정확도를 비교하였다.

한국어 자소 음가 분류에 관한 연구 (A Study on the Korean Grapheme Phonetic Value Classification)

  • 유승덕;김학진;김순협
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.89-92
    • /
    • 2001
  • 본 논문에서는 한국어 대용량 음성인식 시스템의 기초가 되는 자소(grapheme)가 지니는 음가를 분류하였다. 한국어 자소를 음성-음운학적으로 조음 위치와 방법에 따라 분류하여, 그 음가 분석에 관한 연구와 함께 한국어 음성인식에서 앞으로 많이 논의될 청음음성학(auditory phonetics)에 대하여 연구하였다. 한국어는 발음상의 구조와 특성에 따라 음소 분리가 가능하여 초성, 중성, 종성 자소로 나눌 수 있다. 본 논문에서 초성은 자음음소 18개, 중성은 모음 음소(단모음, 이중모음) 17개, 그리고 'ㅅ' 추가 8종성체계의 자음음소로 하였다. 청음음성학적 PLU(Phoneme Like Unit)의 구분 근거는 우리가 맞춤법 표기에서 주로 많이 틀리는 자소(특히, 모음)는 그 음가가 유사한 것으로 판단을 하였으며, 그 유사음소를 기반으로 작성한 PLU는 자음에 'ㅅ' 종성을 추가하였고, 모음에 (ㅔ, ㅐ)를 하나로, (ㅒ, ㅖ)를 하나로, 그리고 모음(ㅚ, ㅙ, ㅞ)를 하나의 자소로 분류하였다. 혀의 위치와 조음 방법과 위치에 따라 분류한 자음과 모음의 자소를 HTK를 이용하여 HMM(Hidden Markov Model)의 자소 Clustering하여 그것의 음가를 찾는 결정트리를 검색하여 고립어인식과 핵심어 검출 시스템에 적용 실험한 결과 시스템의 성능이 향상되었다.

  • PDF