• 제목/요약/키워드: 한글맞춤법

검색결과 46건 처리시간 0.019초

우리말 ㅎ 음운도치와 불연속형태 (h-Metathesis and Discontinuous Morphs in Modern Korean)

  • 유만근
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.510-513
    • /
    • 1996
  • 현대 한국어에 ㅎ음운도치 현상에 잇는데 주로 두가지 문법범주에 나타난다. 첫째는 ${\ulcorner}암탉/수탉{\Ircorner}$ 처럼 ${\ulcorner}암{\Ircorner}$ (female), ${\ulcorner}수{\Ircorner}$ (male)에 이어지는 명사초성 파열음에서 생기고, 그 다음은 ${\ulcorner}놓고/많지{\Ircorner}$ 처럼 용언 어간말음 ㅎ소리와 그것에 이어지는 어미초성 파열음, 파찰음 사이에서 생긴다. 첫째 경우에는 정서법이 음운도치를 그대로 반영하지만 두째 경우에는 어간.어미를 갈라적는다는 기준에 따라 대개 발음순서와 철자순서가 다르게 되어있다. 이 글의 초점은 현행 한글맞춤법상 이렇게 발음순서와 철자순서가 어긋남을 음성학적 분석을 통해 고찰하고, 그 철자방식을 비판하면서 한글맞춤법 개선을 위해 ㅎ받침 효용에 대한 새로운 제안을 하려는 것이다.

  • PDF

음절수에 따른 한국어 복합 명사 분리 방안 (A Division Method of Korean Compound Noun by number of syllable)

  • 최재혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.262-267
    • /
    • 1996
  • 한국어 맞춤법 검사기는 문서내에서 발생되는 비표준어 오류, 띄어쓰기/붙여쓰기 오류, 조사/어미 오류, 외래어 오류, 철자 오류 등에 대해서 이에 적합한 대치어를 제시해 준다. 일반적으로 한국어의 맞춤법 오류 중 가장 빈번하게 발생되는 것이 띄어쓰기 오류이며, 이 중에서도 복합 명사에 대한 띄어쓰기 오류가 가장 많이 발생한다. 본 논문에서는 복합 명사에 대한 띄어쓰기 교정 방안으로 복합명사의 음절수에 따라 1개의 결과만을 출력하도록 하는 복합 명사 분리 방안을 제시하며, 또한 복합 명사 분리 시의 사전 참조 횟수를 줄이는 방법을 제안한다.

  • PDF

한글 철자 오류 교정 시스템 (A Correcting method of Speller for Hangul)

  • 채영숙;이영식;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.459-468
    • /
    • 1992
  • 문서 속에서 나타나는 철자 오류는 맞춤법을 몰라서 잘못 쓴 경우와 자료 입력 과정에서 잘못 입력된 경우로 볼 수 있다. 이들 각각의 오류들에 대해 맞춤법 및 표준어 규칙을 비롯하여 한국어 자료의 통계적 분석을 통한 교정 기법을 제공하고자 한다. 본 논문은 철자 검사기가 틀리다고 판단한 오류 어절로부터 올바른 어절을 찾아서 교정해 주고 철자가 틀린 원인을 알려줄 수 있는 도움말 기능을 제공하는 철자 교정 시스템을 구현하고자 한다.

  • PDF

어법과 문법 - 한글 맞춤법을 중심으로 ('Usage' and 'Grammar' - Focusing on the Rule of Korean Orthography)

  • 정희창
    • 비교문화연구
    • /
    • 제39권
    • /
    • pp.485-499
    • /
    • 2015
  • Initially, the word 'usage' in the rule of Korean orthography was used to indicate the whole grammatical knowledge to separate between stems and inflectional affixes and nominals and case markers. Nowadays the word 'usage' in the rule of Korean orthograph is understood to indicate both 'usage' as the principles of the orthographic rule and 'grammar.' Even though 'usage' and 'grammar' can be understood as two different words, the discrepancy between them is not clear. In fact, if examining the rule of Korean orthography, it is not difficult to find that the principles of the orthography is written based on the grammar rules. Thus, the original principle is damaged because the rule of Korean orthography depends on the grammar rules too much. In addition, the rule of Korean orthography forces to change the grammar rules when describing them. Incorrect description of the grammar rules often causes the spelling mistakes. Therefore, it is necessary to divide two areas such as 'usage' and 'grammar' when dealing with 'the orthographic rules' and describing them.

음절 bigram 특성을 이용한 띄어쓰기 오류의 인식 (A Recognition of Word Spacing Errors Using By Syllable Bigram)

  • 강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-88
    • /
    • 2000
  • 대용량 말뭉치에서 이웃 음절간 공기빈도 정보를 추출하여 한글의 bigram 음절 특성을 조사하였다. Bigram 음절 특성은 띄어쓰기가 무시된 문서에 대한 자동 띄어쓰기, 어떤 어절이 띄어쓰기 오류어인지 판단, 맞춤법 검사기에서 철자 오류어의 교정 등 다양한 응용분야에서 유용하게 사용될 것으로 예상되고 있다. 본 논문에서는 한글의 bigram 음절 특성을 자동 띄어쓰기 및 입력어절이 띄어쓰기 오류어인지를 판단하는데 적용하는 실험을 하였다. 실험 결과에 의하면 bigram 음절 특성이 매우 유용하게 사용될 수 있음을 확인하였다.

  • PDF

말뭉치를 기반으로 한 한국어 철자 교정기의 구현 (Korean Spelling Corrector Based on Corpus Analysis)

  • 이병훈;윤준태;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.285-293
    • /
    • 1993
  • 대량의 말뭉치에서 나타나는 맞춤법 오류의 대부분은 타자수의 입력 실수로 인한 것이다. 맞춤법 오류의 유형은 크게 띄어 쓰기 오류, 철자 오류, 띄어 쓰기와 철자의 복합 오류의 세 가지로 나타난다. 이 중, 철자 오류를 표층 형태만으로 표준어 오류, 조사/어미 오류, 자소 대치 오류로 유형을 분류하였다. 본 논문은 300만 말뭉치에서 형태소 분석이 실패한 맞춤법 오류 어절 중에서 띄어 쓰기와 철자 오류를 분석하여, 각 오류 유형에 따른 교정 방법과 자소 대치 규칙 베이스를 이용한 교정 방법을 구현하였다. 또한 형태소 분석기를 거친 40만 어절 사전을 이용한 분석기로 기존의 형태소 분석기를 대치시켜 교정 어절을 검증하였고, 위의 사전에서 추출한 순위 결정 요소와 Heuristic 정보를 이용하여 각 후보 어절에 대한 가중치를 계산하고 가능성이 높은 교정 어절을 제시하는 시스템을 구현하였다.

  • PDF

중국어 전사 한글 표기와 키보드의 표준 방안 (Korean Keyboard Standard for Koreanization of Chinese)

  • 김국;김하림;박호범
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.70-72
    • /
    • 2015
  • 중국어(한어)를 라틴 알파벳으로 전사하는 음운표기 체계를 병음(Pinyin)이라고 하는데, 이에 비해 한국어 사용자를 위한 한글식의 중국어 전사 표기가 여러 가지가 연구되었다. 이는 한국어 및 한글 구사자에게 중국어를 학습하거나 중국문자를 컴퓨터에 입력하는 데 유용할 것이다. 이 논문은 중국어 한글전사 표준과 이 용도의 키보드를 만드는 원칙을 연구한 것이다. 핵심은 중국어의 한글전사를 현대 한국어맞춤법을 따르도록 하고, 기존 표준키보드에 정합되게 한다.

  • PDF

세벌식을 응용한 효율적인 한글 입력의 제안 (The Proposal of Effective Hangeul Input Based on Sebeolsik(Three-Layered) Key Layout)

  • 김용묵;김진형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.300-305
    • /
    • 2003
  • 현재 우리나라의 표준 자판은 두벌식이며, 한글 입력기에 대한 연구도 두벌식을 중심으로 되어 왔다. 물론 세벌식도 있지만 널리 보급되지 못한 상태이며, 연구를 한다고 해도 글쇠배열 쪽으로 편향해 있지, 세벌식 구조자체에 대한 평가와 연구가 제대로 이루어지지 못한 실정이다. 본 연구에서는 <날개셋> 한글 입력기라는 새로운 입력기를 개발하여, 세벌식 글쇠배열을 응용한 효율적인 한글 입력 방식을 제안한다. 기존 연구들이 한국어와 한글 맞춤법의 특성을 살린 것이거나 세벌식과 두벌식을 절충하는 것이라면, 본 연구는 세벌식 자체의 장점을 살려 입력기의 내부 기능을 향상시켰다. 그래서 세벌식의 당위성을 단순한 글쇠 배열 차원의 능률이 아닌, 구조적이고 원천적인 관점에서 역설했다. 이들 고급 기능들은 초/중/종성을 순서 없이 쳐도 조합이 성립될 수 있는 세벌식 모아치기 원리에 근거를 두고 있다.

  • PDF

음절 bigram 특성을 이용한 띄어쓰기 오류의 인식 (A Recognition of Word Spacing Errors Using By Syllable)

  • 강승식
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.85-88
    • /
    • 2000
  • 대용량 말뭉치에서 이웃 음절간 공기빈도 정보를 추출하여 한글의 bigram 음절 특성을 조사하였다. Bigram 음절 특성은 띄어쓰기가 무시된 문서에 대한 자동 띄어쓰기, 어떤 어절이 띄어쓰기 오류어인지 판단, 맞춤법 검사기에서 절차 오류어의 교정 등 다양한 응용분야에서 유용하게 사용될 것으로 예상되고 있다. 본 논문에서는 한글의 bigram 음절 특성을 자동 띄어쓰기 및 입력어절이 띄어쓰기 오류어인지를 판단하는데 적용하는 실험을 하였다. 실험 결과에 의하면 bigram 음절 특성이 매우 유용하게 사용될 수 있음을 확인하였다.

  • PDF

한글 부호의 최적화 전송을 위한 한국어 낱자 분석 (An Analysis on the Korean Language for Optimum Transmission of Hangul Code)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.33-38
    • /
    • 2015
  • 본 논문은 한글부호의 전송을 최적화하는데 요구되는 한글낱자를 연구하였다. 한글낱자는 한국어를 구성하고 있는 한글을 토대로 하여 분석하였다. 한글낱자의 분석은 세가지 유형을 대상으로 하여 수행하였다. 첫번째 대상은 한글맞춤법 통일안의 24개 낱자이었다. 두번째 대상은 표준 두벌식 글자판의 낱자 28개이었다. 세 번째 대상은 한글맞춤법 통일안에 겹낱자를 포함한 총 54개 낱자이었다. 이 세가지 분석대상별로 각 낱자에 대한 사용빈도를 분석하였다. 국립국어원의 한국어자료에 수록된 총 한국어 단어는 총58,437개인데, 단어들은 총 1,540자의 글자로 구성되어 있다. 이 한글들을 분석한 결과, 사용빈도수를 보면, 첫 번째 대상의 경우, 닿소리는 "ㅇ"이 가장 많고 "ㅋ"이 가장 적었으며 홑소리는 "ㅏ"가 가장 많고 "ㅑ"가 가장 적었다. 두 번째 대상의 경우, 닿소리는 첫 번째 대상과 같고 홑소리는 "ㅏ"가 가장 많고 "ㅒ"가 가장 적었다. 세 번째 대상의 경우, 닿소리는 "ㄱ"이 가장 많고 "ㄽ"이 가장 적었으며 홑소리는 "ㅏ"가 가장 많고 "ㅞ"가 가장 적었다.