• 제목/요약/키워드: 한글 입력 방식

검색결과 119건 처리시간 0.032초

열악한 환경의 음성 언어 이해를 위한 정보 추출 접근 방식 (An Information Extraction Approach for Spoken Language Understanding in a Hostile Environment.)

  • 은지현;이창기;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.20-24
    • /
    • 2004
  • 본 논문에서는 환경 잡음과 원거리 음성 입력 그리고 노인 발화 등의 열악한 음성 인식 환경에서의 음성 언어이해(spoken language understanding)를 위한 정보 추출 접근 방식에 대해 논하고 있다. 정보 추출의 목적은 미리 정의된 slot에 적절한 값을 찾는 것이다. 음성 언어 이해를 위한 정보 추출은 필수적인 요소만을 추출하는 것을 목적으로 하는 개념 집어내기(concept spotting) 접근 방식을 사용한다. 이러한 방식은 미리 정의된 개념 구조 slot에만 관심을 가지기 때문에. 음성 언어 이해에서 사용되는 정보 추출은 언어를 완전히 이해한다기보다는 부분적으로 이해하는 방식을 취하고 있다. 음성 입력 언어는 주로 열등한 인식 환경에서 이루어지기 때문에 많은 인식 오류를 가지고 이로 인해 텍스트 입력에 비해 이해하기 어렵다. 이러한 점을 고려하여, 특정 정보에 집중함으로써 음성 언어를 이해하고자 시도하였다. 도로 정보 안내 영역을 대상으로 한 실험에서 텍스트 입력(WER 0%)과 음성 입력(WER 39.0%)이 주어졌을 때, 개념 집어내기 방식의 F-measure 값은 각각 0.945, 0.823을 나타내었다.

  • PDF

복합주파수 전화기의 번호판 매핑에 의한 문자 변환 시스템 구현 (A Character-Converting System Implementation by Keypad Mapping of DTMF Telephone Set)

  • 김용환;장우현;신유식;서광석;김종교;정항근
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.60-65
    • /
    • 1998
  • 전화기의 선택 및 제어 신호는 직류 임펄스의 수에 의한 방법을 사용하였으나 현재 는 복합 주파수 방식을 널리 사용하고 있으며, 음성을 이용한 서비스들도 복합 주파수 방식 에 의해 제공되고 있다. 본 논문에서는 전화기의 복합 주파수 신호를 한글 자소로 변환하는 번호판 매핑 방법을 제시하였으며, 이 방식을 이용하여 상용되는 음성 정보 서비스의 검색 코드 입력 방식을 재구성해 보았다. 즉, 여러 가지 서비스에서도 한글 문장을 사용할 수 있 음을 보였다. 또한, 전화 통화시 사용되는 문장을 번호판 매핑 방식을 적용하여 구성함으로 써 전화기에서의 문장 편집 및 문장 정보 교환의 가능성을 보였다.

  • PDF

코퍼스 확률에 기반한 한국어 표준발음 생성 (The Corpus-probability Based Generation of Korean Standard Pronunciation)

  • 김동성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.210-215
    • /
    • 2007
  • 본 연구에서는 코퍼스 확률에 기반하여 한국어 표준 발음 생성에 대한 연구를 한다. 기존의 이은영 외 (2005)에서 연구된 규칙기반의 한국어 IPA 발음 변환방식과는 달리 본 연구에서는 음운변환 코퍼스를 바탕으로 표준발음을 변환한다. 이 방식을 위해서 Brill(1995)에서 제안한 변형기반 학습방식이 활용되었으며, 단계적인 처리방식이 아닌 입-출력 대응 방식의 확률적 처리 방식이 제안되었다. 음운변환 방식은 음운규칙에 근거한 처리가 아닌 언어자원인 코퍼스를 활용해서 처리하였다는 점에서 기존의 연구방식과 차이가 있다. 또한, 기존 연구에서는 음운규칙을 단계적으로 적용하여서 입력형이 출력형으로 도출되기 위해서 여러 단계를 거쳤지만, 본 연구에서는 입력형과 출력형의 일대일 대응이라는 점에서 차이점을 보인다.

  • PDF

한국어 발음열 자동 생성을 위한 형태소 태그 정보 기반의 텍스트 전처리기 (Text Preprocessor for Generating Korean Automatic Pronunciation Variants Using Morpheme-trg Information)

  • 이경님;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.199-201
    • /
    • 2001
  • 일반적으로 발음열 자동 생성기는 음성 인식 및 음성 합성에 사용되며, 그 주된 역할은 입력된 한글 철자에 대해 발음 나는 데로 표기된 음소열로 출력하는 것이다. 그러나 실제 입력되는 문장에는 특수 기호 및 알파벳. 아라비아 숫자, 영어 단어, 알파벳과 숫자가 혼용된 약어, 기호 단위 명사 등이 포함되어 있다. 게다가 아라비아 숫자의 경우 단위 명사의 종류에 따라서 뿐만 아니라, 문맥에 따라 숫자를 읽는 방식이 달라지게 된다. 이러한 모든 현상들을 발음열 생성기 내부에서 처리하게 되면 선행작업이 상대적으로 크게 되어 과부하 문제 가 발생된다. 또한 어절 내의 문맥 정보만으로 정확한 변환 결과를 얻기 힘들기 때문에 형태소 분석 수행 결과 및 예외처리를 위 한 루틴을 포함하여 한글 자소 단위의 입력형식으로 변환하는 전처리 시스템을 구성하였다.

  • PDF

무작위 문장 삽입 노이징을 적용한 BART 기반의 한국어 문서 추상 요약 (BART with Random Sentence Insertion Noise for Korean Abstractive Summarization)

  • 박주홍;권홍석;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.455-458
    • /
    • 2020
  • 문서 요약은 입력 문서의 핵심 내용을 파악하여 짧고 간결한 문장으로 나타내는 과정이다. 최근에는 문서 요약을 위해 사전 학습된 언어 모델을 이용하는 방식이 여럿 제안되고 있지만, 이러한 언어 모델들은 문서 요약의 특성을 고려하지 않고 설계된 입력 노이즈 방식을 사용하는 한계점이 있다. 본 논문에서는 한국어 문서 추상 요약에 사전 학습 언어 모델인 BART를 도입하고, 입력 문서에 무작위 문장을 삽입하는 노이징 방식을 추가하여 문서 추상 요약 모델의 언어 이해 능력을 향상시키는 방법론을 제안한다. 실험 결과, BART를 도입한 문서 요약 모델의 결과는 다른 요약 모델들의 결과에 비해 전반적으로 품질 향상을 보였으며, BART와 함께 무작위 문장을 삽입하는 노이징 방법은 적은 비율로 삽입하는 경우 추가적인 성능 향상을 보였다.

  • PDF

학습 및 게임 기능을 갖는 자소모아한글단어맞추기(자모한) 안드로이드 앱 개발 (An Android App Development for JAMOHAN with Learning and Game Facilities)

  • 김가영;이효은;김혜수;양창근;강현규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.191-194
    • /
    • 2012
  • 본 논문은 뜻풀이를 통해 한글단어를 맞추는 앱 어플리케이션인 자모한(자소 모아 한글단어 맞추기)의 구현에 대하여 논한다. 학습 형태의 게임방식을 통하여 누구나 쉽게 사용하고 한글 단어를 학습할 수 있는 안드로이드 앱 어플리케이션이다. 자모한은 3가지 특징을 가진다. 첫 번째는 '한글'로, 평소 뜻을 제대로 알고 쓰지 못했던 단어나 잊혀져 가는 순수 우리말과 같은 한글단어의 뜻을 학습 할 수 있다. 두 번째는 '자소'로 한글에서 하나하나의 자소가 모여 단어가 됨을 보여주며 각 단어의 자소 구성을 명확히 인식할 수 있도록 도와준다. 세 번째는 '획수'이다. 게임에서 간접적으로 자소의 획수를 알려주고 있다. 이러한 특징들은 교육적 측면으로서 좋은 특징을 가지고 있다. 그 외에도 자모한은 데이터베이스 파일을 중심으로 작동하기 때문에 파일의 구조와 입력 정보를 변경하여 여러 버전(햇갈리기 쉬운 단어, 순수우리말, 사자성어 등)으로 응용이 가능하다는 산업 및 기술적 측면의 모습도 볼 수 있다.

  • PDF

접속정보를 이용한 한글 철자 및 띄어쓰기 검사기의 설계 및 구현 (A Design and Implementation of Hangul Spelling and Word-spacing Checker using Connectivity Information)

  • 강재우;송춘환;김연배;최기선;권용래;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.3-9
    • /
    • 1989
  • 본 논문은 $UNIX^{TM}$ 환경에서의 한글 텍스트에 대해 일괄 처리 방식으로 한글 철자 및 띄어쓰기를 검사하는 시스템을 설계 및 구현하였다. 본 시스템은 접속 정보를 이용한 최단일치법을 사용하여 한 어절에 대해 형태론적인 분석을 하여 입력된 화일 내의 철자 및 띄어쓰기 오류를 찾아낸다.

  • PDF

사용자에 의한 문형 확장 방식을 이용한 다국어 채팅 시스템의 설계 및 구현 (The Design and Implementation of Multilingual Chatting System Using Exapansion of Sentence Patterns By User)

  • 박홍원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.215-220
    • /
    • 1999
  • 본 연구에서는 정해진 주제내에서 높은 번역율과 빠른 처리 시간을 동시에 수용할 수 있는 효과적인 다국어 채팅 시스템을 구현하기 위해 사용자가 어절 단위로 단어를 입력하거나 선택하여 이미 구축되어 있는 문형에 접근하도록 유도하는 사용자 문형확장 방식을 제안하였다. 사용자 문형확장 방식을 사용하여 다국어 채팅 시스템을 구현할 경우 사용자 입력과 동시에 구문분석, 변환, 생성등 일련의 번역과정을 최소한의 처리시간으로 처리할 수 있으므로 매우 용이하게 실시간 번역 시스템을 구현할 수 있다는 장점이 있다. 사용자 문형확장 방식과 더불어 이와 함께 사용될 수 있는 통합 문형코드와 통합 품사체계도 제안하였다. 이는 번역의 대상이 되는 한국어, 영어, 일본어 각각에 대해 문형코드와 품사코드를 따로 설정하지 않고 통일된 하나의 코드체계를 적용함으로써 기계번역에서의 변환과정을 최소화하기 위해 고안하였다.

  • PDF

음성정보 서비스의 검색 알고리즘 개선 연구 (A Study on Improvement of Retrieval Algorithm for Audio Response Service)

  • 정유현;김순협
    • 한국음향학회지
    • /
    • 제16권5호
    • /
    • pp.92-95
    • /
    • 1997
  • 현재의 음성정보 서비스는 번호(0~9)와 특수 기호(${\ast},# $)의 조합에 의한 메뉴 검색 및 검색코드를 입력하는 방식으로서 서비스되고 있다. 검색코드 입력 방식은 관광 및 증권 정보와 같이 많은 내용을 대상으로 하는 분야의 검색 방법으로 사용되고 있으나 검색코드 번호를 모르는 경우에는 원하는 정보를 검색하기 위해서는 많은 시간과 노력이 소요된다. 따라서 본 논문에서는 검색코드 번호를 모르는 사용자들도 쉽게 원하는 정보를 검색할 수 있도록 전화 번호에 한글 자음코드를 부여하고, 원하는 정보의 고유명사에 대응하는 초성 자음 열의 전화번호를 검색코드로 입력하는 방법을 제안하였다.

  • PDF

擴張된 DP 매칭법에 依한 흘림체 한글 온라인 認識 (On-Line Recognition of Cursive Hangeul by Extended DP Matching Method)

  • 이의동;김태균
    • 대한전자공학회논문지
    • /
    • 제26권1호
    • /
    • pp.29-37
    • /
    • 1989
  • 본 논문은 DP(dynamic programming) 매칭법을 확장하여 흘림체 한글을 온라인으로 인식하는 방법에 대하여 논한 것이다. 한글의 자소는 보다 간단한 자소에 선분이 점차로 추가되어 보다 복잡한 구조로 발전되는 특징이 있다. 자소의 조합에 의해 구성되는 한글에는 유사한 문자 패턴이 많다. 이러한 특성으로 인하여 한글에 대하여 DP매칭법을 적용하여도, 입력문자와 표준문자와의 패턴간 거리를 정확하게 구하는 것이 곤란하다. 본 방식에서는 DP매칭을 행하기 전에, 한글의 최초, 최후선분의 특성을 살린 대분류매칭을 행함으로써 DP매칭의 대상수를 줄였다. 본 방식은 DP매칭법에 자소패턴의 추출기능을 부가함으로써, DP매칭을 확장하여, 한글의 문자패턴간의 거리를 정확하게 측정하는 것을 시도한다. 자소패턴의 추출은, 자소패턴을 구성하는 선분의 ON/OFF, 방향코오드, 방향코오드의 변화, 배치 구조등을 조사함으로써 행한다. 이와같이 하므로써 필기운동 변화의 흡수와 비교적 안정된 스트로크의 분리가 가능함을 확인하였다.

  • PDF