• 제목/요약/키워드: 표기 방법

검색결과 384건 처리시간 0.026초

은닉 마르코프 모델을 이용한 음차표기된 외래어의 자동인식 및 추출 기법 (Automatic Detection and Extraction of Transliterated Foreign Words Using Hidden Markov Model)

  • 오종훈;최기선
    • 인지과학
    • /
    • 제12권3호
    • /
    • pp.19-28
    • /
    • 2001
  • 본 논문에서는 한국어문서에서 음차표기된 외래어를 자동적으로 인식 및 추출하는 알고리즘을 제안한다. 제안된 방법에서는 음차표기된 외래어 인식 및 추출 문제를 음절태깅문제로 변환한다. 음절태깅문제는 주어진 단어 내의 음절들에 대하여 순수 한국어를 구성하는 음절인지 또는 음차표기된 외래어를 구성하는 음절인지를 태깅하는 작업으로 정의된다. 이를 위하여. 주어진 어절 내의 음절의 나열을 순수 한국어 음절을 표현하는 상태와 외래어 음절을 표현하는 상태의 이진 상태(binary state)로 모델링한 은닉 마르코프 모델을 이용한다. 제안된 방법은 기존 연구에 비하여 높은 재현율과 정확률로 음차표기된 외래어를 인식 및 추출하였다.

  • PDF

한국어 음가/ 한글 표기 변환을 위한 표준 규칙 제정 (Establishment of the ′Standard Hangul Phoneme into Character Conversion Rule′)

  • 이계영;임재걸
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.128-132
    • /
    • 2002
  • 한글 표기를 음가로 변환하는 규칙을 역으로 적용하여 음가를 한글 표기로 전환시키는 표준 규칙을 고안하는 것이 본 연구의 목표다. 이러한 표준 규칙은 음성인식에 반드시 필요한 귀중한 자료가 된다. 음성 인식은 표준으로 기록된 음성의 패턴과 입력을 비교하여 가장 유사한 패턴을 찾는 방법을 사용한다. 이때 표준 음성 패턴이 띄어쓰기 단위라면 수백만 개의 표준 패턴이 수록되어야 한다. 이렇게 하면 표준 패턴을 위한 데이터베이스도 너무 커지고 비교회수도 너무 많아져서 실용화가 불가능하다. 그래서, 음절단위로 인식하는 것이 바람직하다. 음절단위로 인식하면 인식된 음가가 한글 표기 문법에 맞지 않으므로, 인식 결과를 출력할 때에는 음가를 그대로 출력하는 것이 아니라 한글표기로 변환하여 표기해야 한다 이때, 본 연구의 연구 결과인 표준규칙을 사용한다.

  • PDF

중국의 외래어 표기를 한자와 병음 대신 한글로 쓰면 좋은 이유 증명 (The reasons why it is good to write Chinese loanwords in Korean instead of Chinese characters and Hànyǔ pīnyīn)

  • 정태충
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.639-643
    • /
    • 2022
  • 한글이 우수한 글자라는 의견에 세계 대부분의 학자들이 동의하고 있다. 한글 자모의 단순성과 직교성(규칙성)으로 인해 표현할 수 있는 발음의 수도 제일 많고 읽고 쓰고 배우기도 쉽다는 점을 누구나 인정하기 때문이다. 구한말과 1950년대에 중국도 한글표기를 사용할 뻔 했다는 이야기도 있다. 그러나 그들은 한자를 사용하되 단순화 하는 방법과 병음을 사용하는 것으로 결론이 났고 현재 그렇게 사용하고 있다. 그런데 중국인들이 외래어를 다루는 것을 보면 많이 고생한다는 생각이 든다. 외래어 표기를 한글로 사용한다면 외래어를 위한 한자 단어를 만들 필요가 없고 외래어를 표현하고 배우고 읽고 쓰는데 훨씬 더 효과적으로 할 수 있고, 원음 재현율이 매우 개선된다. 또한' 글자의 길이가 짧아지고 더 멀리서도 인식되는 장점도 있다. 본 논문은 그것을 보여준다. 본 논문에서는 영어 원단어, 한국어 표기, 중국어 표기, 병음 표기, 중국어 발음 한글 표기 등을 비교해서 한글이 유리함을 보여주고자 한다. 결론적으로 외국단어를 한자나 한자의 병음으로 표현하는 것보다 한글로 표현하는 것이 중국어를 사용하는 모든 사람들에게 큰 도움이 될 것이다. 물론 그들이 한글을 읽고 쓰는 것을 배우는 부담은 있지만 몇일만 배우면 평생의 문제를 해결하게 되는 문제이므로 큰 부담은 아니라고 본다.

  • PDF

괄호 생략 관점에서 식의 표기에 관한 고찰 (A Study on the mathematical notation of expression in terms of skipping the parenthesis)

  • 김창수;강정기
    • 한국학교수학회논문집
    • /
    • 제19권1호
    • /
    • pp.1-19
    • /
    • 2016
  • 본 연구는 오늘날 사용되는 식의 표기를 괄호 생략의 관점에서 고찰하였다. 먼저 연산 기호 생략 규칙과 관련한 초 중등 교과 내용을 검토해본 결과, '$48{\div}2(9+3)$의 계산 결과는 얼마인가?'라는 물음에 답할 명시적 근거를 찾기 어려웠다. 다음 표기에 관한 근본적인 탐구를 위해 전위 표기법, 중위 표기법, 후위 표기법의 특징을 살펴보고, 중위 표기법이 갖는 장 단점을 확인하였다. 동시에 표기법의 발전을 괄호 생략의 관점에서 조명해 보았다. 이러한 고찰로부터 연산 생략은 곧 함수의 이미지라는 관점이 괄호 생략을 원활하게 해석할 수 있는한 방법임을 확인할 수 있었다. 이를 통해 역사 발생적 원리에 따른 수학적 표기 지도, 중위 표기법의 선택 맥락 이해와 난점 극복을 위한 노력의 재현, 연산자를 포함한 생략된 괄호를 찾아 근본 식을 파악하는 활동, 곱셈이 생략된 경우를 함수의 이미지로서 간주하는 관점의 명시 등을 포함한 몇 가지 지도방안을 제안하였다.

후위 표기법을 사용한 수학식 색인 및 랭킹 (Indexing and Ranking Mathematical Equations Using Postfix Notation)

  • 이세희;신준수;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.160-164
    • /
    • 2009
  • 최근 인터넷 및 컴퓨터의 사용이 활발해짐에 따라 문서의 디지털화가 빠르게 진행되고 있다. 이런 변화에 따라 수학식이 많이 사용되는 과학, 공학, 수학 등의 분야와 관련된 문서들을 검색해야할 필요성이 늘어가고 있다. 그러나 현재 일반 검색엔진은 텍스트 검색만을 제공하며 별도의 수학식 검색은 제공하지 않는다. 따라서 본 논문에서는 수학식 검색이 가능하도록 수학식의 색인 방법 및 랭킹 방법을 제안한다. 제안하는 색인 방법은 MathML로 입력되는 수학식을 후위 표기법과 일반 색인 방법의 두 가지로 색인하며, 언어모델을 사용하여 질의에 적합한 수학식을 랭킹한다. 일반 검색 엔진의 성능과 비교하기 위하여 2-포아송 모델과 제안 모델을 비교하였으며, 그 결과 제안 모델의 성능이 더 우수함을 보였다.

  • PDF

한글에 의한 외국어 표기법에서 음절표현 방법 제안 (Suggestion of syllable representation methods for foreign languages in Hangul)

  • 정태충
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.65-69
    • /
    • 2015
  • 우리 모두 소리의 표현력이 뛰어난 한글의 우수성은 너무나 잘 알고 있으며, 한글의 세계화를 외치고 있다. 그러나 그런 일을 해야할 국립국어원 등 국가기관은 외국어 표기법을 만들지 않고 있다. 외래어표기법으로 충분하다고 생각하고 있는 것이다. 외래어표기법은 현재의 한글을 유지하면서 외국어를 한글 단어로 만들 때 어떻게 만드느냐를 규정한 것이다. 한글세계화에 필요한 외국어 표기법은 한글로 외국어를 잘 표현함으로써 한글을 외국에 퍼트리는 것이 목표이다. 따라서 외국인이 쓰기에 편리해야하고 외국어 발음 왜곡을 최소화 하면서 잘 표현해 내기엔 현재 한글로는 부족한 면이 있음으로 표현력이 확장된 한글을 만들어야한다. 물론 확장된 한글이 현재의 한글과 동떨어지면 안될 것이다. 많은 분들이 여러 아이디어로 제안을 해 왔지만 대부분 자음을 추가하는 데에 집중되어 있다. 확장한글에서 다루어야할 것은 1) 추가되는 자음과 모음 2) 한글에 없는 성조나 강약 및 장단 등에 관한 규정 추가 등이면 된다고 생각하고 있다. 그러나 한글의 큰 특성인 음절이 외국어 표현 때에 왜곡되는 현상이 있는데, 어떻게 외국어와 한글의 음절개념을 일치시킬 수 있을지에 대해 관심을 가지고 방안을 제안하고자 한다. 그 방안으로는 1) 합용병서와 2) 풀어쓰기 활용법이 가능하나, 필자는 중간선으로 3) 촉진자 표기법을 제안한다. 또한, 크기조절법에 대응해 음절인 글자 위에 점을 표기하는 음절점표기법도 제안한다.

  • PDF

문자 없는 나라를 위한 문자 교육 시스템(소울)에 관한 연구 (A Study on the Education System for People Who Don't Have Their Own Letters, SOUL)

  • 함혜령;노용덕
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.377-380
    • /
    • 2010
  • 지식기반 사회에서 교육은 장기적인 발전을 위한 필수 요소이다. 교육을 위해서는 말하기, 듣기, 쓰기, 읽기 능력이 필요하다. 이 중 하나라도 충족하지 못한다면 제대로 된 교육을 받을 수 없다. 하지만 전 세계에 존재하는 약 6900여종의 언어 중 6600여종의 언어는 표기할 수 있는 고유 문자가 없다. 읽기 능력과 쓰기 능력을 기르기 위한 최소 조건조차 마련되어 있지 않은 것이다. 그래서 말은 있지만 문자는 없는 국가에 말을 표기할 수 있는 문자를 보급하여 지식기반 발전의 기반을 마련해 주는 소울(SOUL) 시스템을 제안한다. 소울(SOUL)은 두 가지 기능을 가지고 있다. 문자 교육 기능과, 지식 공유 공간 기능이다. 문자 교육 기능에서는 각 문자가 내는 소리와 조합방법, 그리고 각 문자의 표기법, 표기 순서 등을 익힘으로써 문자를 쉽게 익힐 수 있도록 하였다. SOUL은 말을 표기할 문자로 비교적 익히기 쉬운 언문인 한글을 채택하였다. 그리고 지식 공유 공간 기능에서는 문자를 익힌 사용자가 마치 위키피디아처럼 지식을 기록하고 공유할 수 있어 지식을 축적하도록 도와주도록 설계하였다. 여기서는 소울(SOUL) 시스템의 구조 및 구현을 보인다.

유통기한 및 원재료명 표시에 대한 소비자의 이해도 및 선호도 (Consumers' understanding and preference for shelf life and ingredient listings in food label)

  • 이경애;김향숙
    • 한국식품조리과학회지
    • /
    • 제17권4호
    • /
    • pp.405-411
    • /
    • 2001
  • 선행연구에서 식품 구매시에 확인정도가 높았던 식품표시사항인 유통기한과 원재료명 표시에 대한 소비자의 이해도, 선호도 및 요구도를 설문지법으로 검토하였다. 유통기한에 대한 이해도를 알아보기 위한 질문인 ‘유통기한 이후에 판매할 수 없다’에 대한 정답자의 비율은 과자류 67.7%, 햄 80.1%로서 대부분의 응답자가 유통기한의 의미를 바르게 이해하고 있었다. 원재료명에 대한 이해도는 질문의 내용에 따라 차이를 보였는데 ‘원재료명의 함량’에 대한 이해도가 가장 높았으며, ‘원재료의 용도’, ‘원재료명의 표기순서’의 순 이었다. 표시방법에 대한 선호도를 검토한 결과, 유통기한의 표시는 표시방법에 따라 큰 차이를 보이지 않았다. 원재료명의 표시에 대해서는 대부분의 응답자가 ‘모든 원재료명의 표기를 원한다’고 답하였으며, 연령(p<.001), 결혼여부(p<.05), 직업(p<.05), 소득 (p<.001)에 따라 유의적 차이를 보였다. 원재료명의 함량 표기는 모든 원재료의 함량 표기를 원하는 응답자가 69.6%로서 가장 많았으며, 연령(p<.001), 결혼여부(p<.001), 직업(p<.001), 소득(p<.01)에 따라 유의적 차이를 나타냈다. 또한 식품 처가물 표기에 대해서는 거의 모든 응답자(92.6%)가 ‘다른 원료와 구별해서 표기해야 한다’고 답하였다. 표시내용에 대한 요구도를 검토한 결과, 유통기한 관련표시 내용으로 ‘개봉상태에서 소비 가능한 기간’의 표기를 가장 원하고 있었으며, ‘유통기간 중 가장 품질이 좋은 기간’의 순으로 요구도가 낮았다. 원재료명 중 식품 첨가물 관련 표시내용으로 가장 필요로 하는 것은 ‘위해성’의 표기였으며, 함량, 명칭, 용도의 순 이었다. 표시형태에 대한 선호도를 조사한 결과, 유통기한은 일괄표시 장소에 보존방법과 같이 표기하는 것을 선호하였으며, 원재료명은 진한 글씨로 다른 표시내용과 구별하여 모든 원재료의 명칭과 함량을 표기하고, 아울러 한 줄에 한가지 원재료를 표기하는 것을 선호하였다.

  • PDF

한-영 자동 음차 복원 (Automatic Korean-English Back-Transliteration)

  • 강병주;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.63-69
    • /
    • 1999
  • 최근 다국어 정보검색, 기계번역 등과 관련하여 자동 음차 표기 및 복원에 대한 필요성이 증대되고 있다. 특히 영어와 한국어 같이 그 음운구조의 차이가 큰 언어 쌍인 경우에는 간단한 문제가 아니다. 더구나 외래어를 영어로 복원하는 것은 표기의 경우보다 훨씬 어렵다. 본 논문에서는 결정트리 학습을 통한 한/영 자동 음차 복원 방법을 제안하고 기존의 방법 및 로마자 표기법에 기반한 방법에 비교하여 매우 정확하게 복원이 가능함을 보인다.

  • PDF

STS 표기법에 의한 CODARTS 방법론 (CODARTS Methodology by the STS)

  • 엄진아;김규년
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권2호
    • /
    • pp.241-250
    • /
    • 1999
  • Gomaa에 의해 제안된 CODARTS(Concurrent Design Approach for Real-Time System)방법론은 COBRA(Concurrent Object-based Real-Time Analysis)을 사용하여 실시간 시스템의 행동 모델을 개발하고 행동 모델에서 병렬 태스크 구조로 변환하는 데 도움을 주는 태스크 구성 지침을 제공한다. CODARTS에서는 태스크 구성 지침을 RTSA(Real-Time System Analysis)표기법으로 표현된 행동 모델에 적용하여 태스크를 구성한다. 그러나 RTSA 표기법에는 태스크를 구성하는데 필요한 실행 성질 및 주기, 이벤트의 병렬성 및 순서와 같은 정보들을 기술하지 않기 때문에 직접 태스크 구성 지침을 적용하는 것은 어렵다. 본 논문에서는 CODARTS 방법론의 분석단게에서 태스크 구성에 필요한 정보를 통합적으로 나타낼 수 있는 STS (Specification for Task Structuring)를 제안한고 이를 이용하여 태스크를 자동적으로 구성할 수 있는 알고리즘과 적용 예제를 보인다.