• 제목/요약/키워드: 상위언어인식

검색결과 32건 처리시간 0.022초

구조적 정보를 근거로 최적우선탐색하는 온라인 한글 인식 (An On-Line Hangul Recognition System Based on the Structural Information and the Best-First Search)

  • 권오성;권영빈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.515-523
    • /
    • 1992
  • 일반적으로 한글 인식 과정은 많은 후보들을 생성하며 이 후보들로부터 정확한 인식결과를 얻고 복잡도를 줄이기 위해서는 효과적인 한글 표현과 탐색기법이 요구된다. 이런 목적을 위하여 본 논문에서는 한글에 적합한 구조적 정보들을 4단계 계층적 형태로 표현한다. 그리고 이 정보들을 근거로 후보 문자의 생성과 탐색을 진행하며 전체적으로 최적우선탐색을 이룬다. 인식실험은 다양한 필자들을 대상으로 한글 잦기 상위 422자로 실험한 결과 평균 86% 인식률을 얻을 수 있었다.

  • PDF

음운인식의 언어 간 전이와 한글 및 영어의 읽기 쓰기와의 관계 (Cross-language Transfer of Phonological Awareness and Its Relations with Reading and Writing in Korean and English)

  • 김상미;조증열;김지연
    • 인지과학
    • /
    • 제26권2호
    • /
    • pp.125-146
    • /
    • 2015
  • 본 연구는 초등학교 5학년 학생들을 대상으로 한국어 음운인식이 영어 음운인식에 기여하는지의 여부와, 한국어와 영어의 음운인식이 한글과 영어 읽기 및 쓰기와 관련이 되는지를 살펴보았다. 그 결과, 어휘력과 연령을 통제한 후에 한국어 음운인식은 영어 음운인식의 변량을 유의하게 설명하였다. 구체적으로 한국어 음절과 음소인식은 영어 음절인식을 예측하였고, 한국어 음소인식은 영어 음소인식을 예측하였다. 연령과 어휘력을 통제한 후에 영어 음소인식은 영어와 한글의 읽기와 받아쓰기의 변량을 유의하게 설명하였다. 또한 한국어 음절인식이 한글읽기를 설명하였으며, 영어 음절인식은 한글 받아쓰기를 설명하였다. 본 연구의 결과는 음운인식은 상위언어적 기술(metalinguistic skill)로 한국어에서 영어로 언어 간 전이되는 것을 시사한다. 또한 음소인식이 영어의 읽기와 쓰기에 중요하지만, 음소와 음절인식이 한글의 읽기와 쓰기에 중요한 것을 시사한다.

다중 활자체 한글 문자 인식을 위한 유형 분류 (The Type Clustering for the Multi-Font Hangul Character Recognition)

  • 김민기;권영빈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.194-199
    • /
    • 1997
  • 본 논문에서는 글꼴의 변화와 잡영을 흡수할 수 있도록 자소의 탐색 영역을 정의 하였으며 이 영역에 나타나는 횡모음과 종모음의 주획을 추출하는 방법을 기술하였다. 종모음 영역에서 추출한 수직획들과 횡모음 영역에서 추출한 수평획들을 각각 종모음과 횡모음의 주획이 될 수 있는 후보들로써 이들로 부터 종모음과 횡모음의 존재를 파악하는 것이 한글 유형 분류의 주된 내용이다. 그러나 다양한 글꼴에 나타나는 수평획들로부터 곧바로 횡모음의 존재를 파악하는 것은 쉬운 문제가 아니다 본 논문에서는 기존의 트리 분류기를 확장하여 복잡하고 다양한 특징을 단계별로 단순화시키고 트리 분류기의 상위 노드에서 결정된 정보와 제약 조건을 이용하여 유형을 분류하는 방법을 제안하였다. 제안된 방법은 한글 상위 빈도 1405자, 3가지 글꼴에 대하여 99.8 %의 유형 분류율을 보이고 있다.

  • PDF

통합 사용자 인터페이스에 관한 연구 : 인공 신경망 모델을 이용한 한국어 단모음 인식 및 음성 인지 실험 (A Study on the Intelligent Man-Machine Interface System: The Experiments of the Recognition of Korean Monotongs and Cognitive Phenomena of Korean Speech Recognition Using Artificial Neural Net Models)

  • 이봉규;김인범;김기석;황희융
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.101-106
    • /
    • 1989
  • 음성 및 문자를 통한 컴퓨터와의 정보 교환을 위한 통합 사용자 인터페이스 (Intelligent Man- Machine interface) 시스템의 일환으로 한국어 단모음의 인식을 위한 시스템을 인공 신경망 모델을 사용하여 구현하였으며 인식시스템의 상위 접속부에 필요한 단어 인식 모듈에 있어서의 인지 실험도 행하였다. 모음인식의 입력으로는 제1, 제2, 제3 포르만트가 사용되었으며 실험대상은 한국어의 [아, 어, 오, 우, 으, 이, 애, 에]의 8 개의 단모음으로 하였다. 사용한 인공 신경망 모델은 Multilayer Perceptron 이며, 학습 규칙은 Generalized Delta Rule 이다. 1 인의 남성 화자에 대하여 약 94%의 인식율을 나타내었다. 그리고 음성 인식시의 인지 현상 실험을 위하여 약 20개의 단어를 인공신경망의 어휘레벨에 저장하여 음성의 왜곡, 인지시의 lexical 영향, categorical percetion등을 실험하였다. 이때의 인공 신경망 모델은 Interactive Activation and Competition Model을 사용하였으며, 음성 입력으로는 가상의 음성 피쳐 데이타를 사용하였다.

  • PDF

자연발화상에 나타난 단음절 단일간투사의 길이특성 분석 (Analysis of the durational characteristics of monosyllabic interjections in Natural spoken language)

  • 김기호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.95-98
    • /
    • 1994
  • 자연발화상에 포함되어, 음성언어 인식에 장애를 초래하는 간투사의 음성적 특성 중 가장 뚜렷이 구별되는 길이특성얼 분석하여 음성언어 인식에 도움을 주는 것을 목적으로 한다. 이 연구에서는 간투사의 대부분을 차지하는 단음절 단일 간투사에 한정하여, 실제 대화의 녹음자료에서 나타나는 간투사의 빈도수와, 그 길이특성을 신분별, 성별, 간투사 유형별로 분석하였다. 또 간투사를 위치에 따라, 음운구초 간투사, 음운구말 간투사로 나누고, 그 길이를 음절 평균, 음운 구초 음절이나 음운구말 음절의 길이와 비교하여 간투사의 증가율을 측정하였다. 분석결과 가장 높은 빈도수를 보이는 단음절 단일 간투사는 어 이며, 간투사 길이 증가율은, 음절평균에 대해서는 그가, 음운구초 평균에 대해서는 응이 가장 큰 증가율을 나타낸다. 전체적을 음운구초 음절길이에 대한 간투사 길이 증가율이 음절평균 길이에 대한 간투사 길이 증가율보다 더 크게 나타났다. 이러한 분석결과를 통해 하위레벨에서 제거할 수 있는 간투사와, 통사적 또는 의미론적 분석이 필요한 상위레벨에서 처리해야할 간투사를 구별할 수 있다. 이와 같은 길이 특성외에 간투사에 대한 다양한 음성적 특성과, 다음절 단일 간투사와, 이중 간투사에 대한 연구가 진척된다면 음성언어 인식에 장애가 되는 간투사의 효과적 배제가 가능할 것으로 보인다.

  • PDF

소외계층 영재학생의 인지특성과 학습요구 (Cognitive Characteristics and Learning Needs of Economically Disadvantaged Gifted Students)

  • 박민정;박지연;전동렬;이경숙
    • 영재교육연구
    • /
    • 제26권1호
    • /
    • pp.1-20
    • /
    • 2016
  • 본 연구는 소외계층 영재의 인지적 특성과 학습요구 탐색을 목적으로 한다. 일반영재 99명, 소외영재 43명, 일반학생 50명에게 지능, 창의성, 상위인지, 인식론적 신념, 과제 선호도, 개인시간 활용에 대한 검사를 실시하였다. 소외영재는 지능 검사에서 다른 집단보다 점수 향상이 빠르게 나타나 추상화 능력이 뛰어남을 알 수 있었다. 소외영재는 토랜스 창의성 도형 검사에서 일반영재만큼 높은 점수를 보였으나, 언어 검사에서는 일반영재보다 낮은 점수를 보였다. 소외영재는 노력, 학습 능력, 전체 학습계획, 통합적 지식이 학습에서 중요한 것으로 인식하였지만, 일반영재에 비해 학습관리와 책략 같은 상위인지 기술과 합리적인 작업의 가치에 대한 인식론적 신념이 낮고 학습시간도 적었다. 독창적인 과제는 선호하나 어려운 것을 기피하는 소외영재의 성향을 고려하여 다양하게 접근하는 과제를 활용하거나 과제를 단계적으로 제시할 필요가 있으며, 언어능력 신장, 학습내용의 실제 생활에의 적용, 상위인지 기술 개발 등이 소외계층 영재를 위한 지도 방안으로 제안된다.

대용량 오프라인 한글 글씨 영상 데이터베이스 KU-1의 설계 및 구축 (Design and Construction of a Large-set Off-line Handwritten Hangul Character Image Database KU-1)

  • 김대인;김상엽;이성환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.152-159
    • /
    • 1997
  • 최근 들어 인쇄체 문자 인식 기술의 발전에 힘입어 필기체 한글 인식에 관한 연구가 활발히 진행되고 있다. 인쇄체 문자와는 달리 자연스럽게 필기된 한글 글씨는 동일한 문자라 하더라도 같은 모양을 가지고 있다고 단정하는 것이 불가능할 정도로 필기자의 필기 유형에 따른 다양한 변형을 내포하고 있다. 따라서 효과적인 한글 글씨 인식기를 개발하기 위해서는 다양한 변형을 포함하는 대용량의 한글 글씨 영상 데이터베이스가 필수적이다. 본 논문에서는 시스템공학연구소 주관 국어 정보 베이스 개발 사업의 일환으로 고려대학교에서 구축 중인 오프라인 한글 글씨 영상 데이터베이스, KU-1에 대해 간략히 소개하고자 한다. 본 데이터베이스는 KS C 완성형 한글 사용 빈도순 상위 1,500자에 대하여 다양한 계층, 직업, 연령, 지역 분포를 고려한 1,000명 이상의 필기자가 정서체와 본인의 평소 자유 필체로 필기한 1,000벌의 명도 한글 글씨 영상으로 구성되어 있다.

  • PDF

대용량 오프라인 한글 글씨 데이타베이스의 설계 (Design of Large-set Off-line Handwritten Hangul Database Construction)

  • 이성환;송희헌;김종수;이응재;박희선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.131-136
    • /
    • 1995
  • 최근들어 자연스럽게 필기된 한글을 인식함으로써 정보 입력 과정을 자동화하기 위한 오프라인 한글 글씨 인식에 관한 연구가 활발히 진행되고 있다. 오프라인 한글 글씨 인식에 관한 연구에 있어서 반드시 확보되어야 하는 연구 환경으로 대용량 오프라인 한글 글씨 데이타베이스의 구축을 들 수 있는데, 본 논문에서는 시스템공학연구소 국어공학센터의 국어 정보 베이스 개발사업의 일환으로 추진중인 오프라인 한글 글씨 데이타베이스의 구축현황에 대해 간략히 소개하고자 한다. 오프라인 한글 글씨 데이타베이스의 구축은 크게 글씨 데이타베이스 설계, 글씨 데이타 수집, 용지 스캔 및 문자 단위 분할, 데이타베이스 검증의 4 단계로 구성된다. 본 연구에서는 다양한 변형을 갖는 글씨체의 수집을 데이타베이스 구축시 가장 고려해야 할 요소로 삼았으며, 고품질의 일관성 있는 글씨 데이타베이스 구축을 위해 데이타베이스 설계 단계와 검증 단계에 많은 시간을 할애했다. 마지막으로 본 연구에서는 WWW(World Wide Web)의 HTML(Hyper Text Markup Language)을 이용하여 편리 한 사용자 인터페이스를 구현함으로써 사용자들이 쉽게 한글 글씨 영상을 검색 할 수 있음은 물론 인식 알고리즘의 개발에 사용 가능한 형태의 화일을 제공받을 수 있도록 구성하고 있다. 현재는 KS C 완성형 한글 2,350자 중에서 사용 빈도순 상위 520자에 대한 한글 글씨 1,000벌을 수집하여 명도영상 데이타베이스를 구축 중에 있으며, 향후 2년간 나머지 1,830자에 대한 한글 글씨 데이타를 수집하여 데이타베이스를 완성하고자 한다. 구축된 글씨 데이타베이스는 조만간 국내의 오프라인 한글 글씨 인식 연구자들에게 제공되어 우수한 인식 알고리즘의 개발을 위한 중요한 실험 데이타로서 사용될 예정이며, 개발된 인식 시스템에 대한 객관적인 성능 평가에 있어서도 크게 기여하여 국내의 오프라인 한글 글씨 인식에 관한 연구를 활성화시켜주는 계기가 될 것으로 기대된다.

  • PDF

언어네트워크 분석을 통한 중등교사 임용시험 관련 연구동향 분석 (Research Trend of Secondary-School Teacher's Employment Examination Using Semantic Network Analysis)

  • 권충훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.244-247
    • /
    • 2018
  • 본 연구는 우리나라 중등교사 임용시험의 형태가 개편된 2014년도 이후부터 2018년도 현재까지 진행된 중등교사 임용시험 관련 선행연구들을 언어네트워크 분석 방법론을 활용하여, 그 연구동향을 분석하였다. 본 연구에서는 2014년도 이후 5년간 진행된 중등교사 임용시험 관련 연구 55건을 대상으로 주요 핵심어 추출 및 워드클라우드 제시, 주요 핵심어의 언어네트워크 전체 분석 및 3종 중심성(연결정도, 근접, 매개) 분석, 네트워크 값을 반영한 네트워크 그림 시각화 작업 등을 진행하였다. 중등교사 임용시험 관련 선행연구의 주요 핵심어는 분석, 문항, 출제, 인식, 임용후보자, 교과교육학, 국어과, 선정경쟁시험, 개선, 예비교사, 교과내용학, 기출문항, 임용교사, 제도, 탐색 등이었다. 이들 상위 빈도 핵심어들은 나름 높은 연결정도를 가지고 다른 핵심어들간의 의미연결망을 구축하고 있음을 확인하였다, 이런 연구결과는 중등교사 임용시험 주제 연구 진행을 할 때, 연구주제 선정 및 방향 설정에 도움을 줄 것으로 기대된다.

  • PDF

응용을 위한 품사 태깅 시스템의 매핑 (Application portable Part-Of-Speech tagger mapping)

  • 김준석;차정원;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.368-375
    • /
    • 2000
  • 품사 태깅 시스템은 자연 언어 처리의 가장 기본이 되는 부분으로 상위 자연 언어 처리 분야인 구문분석, 의미분석의 전처리로 사용되거나, 기계번역, 정보검색이나 음성인식 및 합성 등과 같은 많은 응용 시스템을 위해서도 필요하다. 이렇게 여러 가지 목적을 위해 품사 태깅 시스템은 존재하는데, 각각의 응용을 위해서 최적화된 태깅 시스템을 따로 구성하기도 하고, 하나의 태깅 시스템을 여러 가지 응용을 위해서 사용하기도 한다. 이때, 문제가 되는 것 중에 하나는 각 응용마다 요구하는 품사 태그 세트가 다르다는 것이다. 품사 태그세트가 고정되어 있다면 어떤 응용을 위해서는 사용되는 품사 태그세트가 너무 적어서 문제가 되고, 반대로 품사태그세트가 너무 많아서 시스템의 수행속도가 중요시되는 응용에서 성능저하의 요인이 되기도 한다. 본 논문에서는 하나의 태깅 시스템의 품사태그세트를 조절할 수 있도록 하여 몇 가지 응용시스템에 맞게 최적화시킬 수 있는 방법론을 제시하고 실험을 통해서 시스템의 성능, 유지보수 및 시스템의 여러 리소스 관리 측면에서도 가장 효율적인 방법론임을 입증하고자 한다.

  • PDF