• 제목/요약/키워드: 언어적 탐색

검색결과 343건 처리시간 0.025초

음향학적 및 언어적 탐색을 이용한 어휘 인식 최적화 (The Vocabulary Recognition Optimize using Acoustic and Lexical Search)

  • 안찬식;오상엽
    • 한국멀티미디어학회논문지
    • /
    • 제13권4호
    • /
    • pp.496-503
    • /
    • 2010
  • 어휘인식 시스템은 스탠드 얼론(Standalone)으로 개발되어 지고 있으며 휴대용 단말기에서 사용하였을 경우 메모리 공간의 제약과 오디오 압축으로 인해 인식률이 낮게 나타난다. 본 연구에서는 휴대용 단말기의 성능과 인식률 향상을 위하여 음향학적 탐색과 언어적 탐색을 분리하여 어휘 인식 속도를 개선한 시스템을 제안하였다. 음향학적 탐색은 휴대용 단말기에서 수행하고 보다 복잡한 언어적 탐색은 서버에서 처리하는 시스템으로 음성신호로부터 특징벡터를 추출하여 GMM을 이용한 음소인식을 수행하고, 인식된 음소 열을 서버로 전송하여 렉시컬 트리 탐색 알고리즘을 사용하여 언어적 탐색 단계에서 어휘 인식을 수행하였다. 시스템 성능 평가 결과 어휘 종속 인식률은 98.01%, 어휘 독립 인식률은 97.71%의 인식률을 나타냈으며 인식속도는 1.58초로 나타내었다.

MLHF 모델을 적용한 어휘 인식 탐색 최적화 시스템 (Vocabulary Recognition Retrieval Optimized System using MLHF Model)

  • 안찬식;오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.217-223
    • /
    • 2009
  • 모바일 단말기의 어휘 인식 시스템에서는 통계적 방법에 의한 어휘인식을 수행하고 N-gram을 이용한 통계적 문법 인식 시스템을 사용한다. 인식 대상이 되는 어휘의 수가 증가하면 어휘 인식 알고리즘이 복잡해지고 대규모의 탐색공간을 필요로 하게 되며 처리시간이 길어지므로 제한된 연산처리 능력과 메모리로는 처리하기가 불가능하다. 따라서 본 논문에서는 이러한 단점을 개선하고 어휘 인식을 최적화하기 위하여 MLHF 시스템을 제안한다. MLHF는 FLaVoR의 구조를 이용하여 음향학적 탐색과 언어적 탐색을 분리하여 음향학적 탐색에서는 HMM을 사용하고 언어적 탐색 단계에서는 Levenshtein distance 알고리즘을 사용한다. 시스템 성능 평가 결과 어휘 종속 인식률은 98.63%, 어휘 독립 인식률은 97.91%의 인식률을 나타냈으며 인식속도는 1.61초로 나타내었다.

정보검색 기법을 이용한 부분 문서 재사용 고속 탐색 (High Speed Local Text Reuse Detection using IR Approach)

  • 배원식;조명래;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.63-68
    • /
    • 2008
  • 인터넷의 발달로 지식의 재사용이 폭발적으로 증가하였다. 이는 지식의 확산이라는 측면에서는 바람직하지만 지식의 도용이라는 문제점을 안고 있다. 따라서 문서의 전부나 일부분을 재사용한 것인지를 판단하고자하는 요구가 증가하고 있다. 본 논문에서는 정보검색 기술을 이용하여 문서에서 부분 문서 재사용 및 표절을 탐색하는 방법을 제안한다. 본 논문에서는 대용량 문서의 고속 탐색을 위해서 원본 문서와 대상 문서를 색인하여 검색에 이용한다. 또한 한글의 언어적 특성을 맞게 어순 변경 비교, 기능어 생략 비교, 갭(gap) 비교 등의 다양한 처리 조건을 제공하여 문서 재사용을 탐색할 수 있다. 실험을 통해서 기존의 시스템보다 정확하게 고속으로 문서 재사용 탐색이 가능함을 보였다. 특히 비교 문서가 증가하더라도 비교 시간이 급격하게 증가하지 않으며, 정보검색 기법을 사용하는 경우 취약하다고 알려져 있는 부분 문서 재사용 탐색에도 견고하며, 처리 조건에 따라 유연하게 문서 재사용 탐색이 가능하다.

  • PDF

한국어 맞춤법 교정을 위한 초거대 언어 모델의 잠재적 능력 탐색 (Examining the Feasibility of Utilizing a Large Language Model for Korean Grammatical Error Correction)

  • 구선민;박찬준;박정배;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.61-65
    • /
    • 2023
  • 최근, 대부분의 태스크가 초거대 언어 모델로 통합되고 있을 정도로 많은 관심 및 연구되고 있다. 초거대 언어 모델을 효과적으로 활용하기 위해서는 모델의 능력에 대한 분석이 선행되어야 하나, 한국어에 대한 분석 및 탐색은 상대적으로 부족하다. 본 논문에서는 한국어 맞춤법 교정 태스크를 통해 초거대 언어 모델의 능력을 탐색한다. 맞춤법 교정 태스크는 문장의 구조 및 문법을 이해하는 능력이 필요하며, 사용자의 만족도에 영향을 미칠 수 있는 중요한 태스크이다. 우리는 맞춤법 세부 유형에 따른 ChatGPT의 제로샷 및 퓨샷성능을 평가하여 초거대 언어 모델의 성능 분석을 수행한다. 실험 결과 제로샷의 경우 문장부호 오류의 성능이 가장 우수했으며, 수사 오류의 성능이 가장 낮았다. 또한, 예제를 더 많이 제공할수록 전체적인 모델의 성능이 향상되었으나, 제로샷의 경우보다 오류 유형 간의 성능 차이가 커지는 것을 관찰할 수 있었다.

  • PDF

언어 영재교육의 필요성과 방향 탐색 (The necessity and direction of verbally gifted education)

  • 강승희;조석희
    • 영재교육연구
    • /
    • 제14권1호
    • /
    • pp.91-114
    • /
    • 2004
  • 본 연구는 현재 시행되고 있는 영재교육에서 상대적으로 적은 관심을 받고 있는 언어 영재 교육의 필요성과 방향을 탐색하기 위한 시도로써 이루어졌다. 과학 문명의 발전을 위해 과학 영재교육이 필요하다면, 인류 문화의 발전을 위해서는 여러 분야의 영재교육이 골고루 이루어져야 한다. 특히 언어가 주가 되는 여러 분야의 전문가들에 의해 우리의 문화, 예술의 경쟁력을 높일 수 있을 것이다. 본 연구에서는 효과적인 언어 영재 교육이 이루어지기 위한 준비로서 현재 우리나라 언어 영재교육의 현황을 분석하고, 언어 영재교육의 필요성과 방향을 탐색하여, 언어 영재교육의 내실화를 기할 수 있는 기초를 제공하였다. 언어 영재교육이 올바르게 이루어지기 위해서는 무엇보다도 언어 영재들에 대한 잘못된 인식을 변화시켜 언어 영재 교육의 필요성을 깨닫도록 해야 하며, 언어 영재에 관한 기초 연구를 실시하여 언어 영재성 및 특성을 이해할 수 있어야하며, 언어 영재와 기타 다른 영역의 영재들을 위할 프로그램을 개발하여야한다.

KT Test Set을 이용한 우리말 자연언어검색의 효율성에 관한 비교연구 (A Comparative Study on the Effectiveness of Hangul Natural Language Retrieval Using KT Test Set)

  • 이현아;김성혁
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1995년도 제2회 학술대회 논문집
    • /
    • pp.37-40
    • /
    • 1995
  • 본 연구는 자연언어시스템에서 색인어와 탐색어의 특정성에 기인하는 재현율 감소를 극복하기 위한 방법론으로써 탐색어의 확장을 통한 검색효율을 평가하였다. 이를 위하여 우리말 데이터베이스를 대상으로 주제전문가가 자연언어로 작성한 원 질의문 (Q1), 원 질의문에 사용된 탐색어와 데이터베이스내의 색인어간의 유사도를 이용하여 탐색어를 확장한 질의문 (Q2(0.2), Q2(0.3)), 주제전문가인 이용자가 Q1의 의미적인 관계를 고려해서 자연언어로 탐색어를 확장한 질의문 (Q3)을 검색효율면에서 비교하였다. 실험결과, 평균재현율은 Q2(0.2), Q2(0.3), Q3, Q1의 검색의 순이었다. 평균정확율은 Q3, Q2(0.3), Q1, Q2(0.2)검색의 순으로 나타났다.

  • PDF

비주얼 베이직을 이용한 초등 정보과학영재용 프로그래밍 언어 교육내용 탐색

  • 강성원;이재호
    • 한국영재학회:학술대회논문집
    • /
    • 한국영재학회 2003년도 추계학술대회
    • /
    • pp.209-219
    • /
    • 2003
  • 초등 정보과학 영재교육의 핵심이 되는 프로그래밍교육은 창의적 사고와 수준 높은 문제 해결력을 동원하여 새로운 알고리즘을 생성해내는 정보 교육의 중요한 분야임에도 불구하고 초등 정보과학영재의 특성을 고려한 체계적인 교육 내용이 확립되어 있지 못한 상태이다. 본 연구에서는 초등 정보과학영재를 위한 프로그래밍 교육의 필요성을 탐색하여 프로그래밍 교육내용 요소를 추출하였으며, 프로그래밍 언어 선정기준을 통해 비주얼, 베이직을 교육용 프로그래밍 언어로 선정한 후 프로그래밍 교육내용을 제안하였다.

  • PDF

한국어 대화에서의 대명사의 선행사 탐색 -통제된 중심화이론적 접근 (On the Anaphora Resolution in Korean Dialogues -in the Framework of the Controlled Centering Theory)

  • 이익환;이민행
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.382-388
    • /
    • 1999
  • 이 논문은 두 가지 목적을 가진다. 첫째, 대명사의 선행사 탐색을 위한 이론으로 널리 알려진 중심화이론을 필자들이 수정확대한 통제된 중심화 이론(Controlled Centering Theory, 이하 CCT)을 소개한다. 둘째, 한국어의 대화에서 나타나는 대명사의 선행사 탐색문제에 대한 설명력있는 해답을 CCT의 틀안에서 제시한다. 이를 위해 제한된 영역 대화라 할 수 있는 호텔예약대화에 나타나는 영대명사의 특성에 대해 논의하고, 그 선행사 탐색과 관련하여, 정보구조적인 관점에서 슬롯연결성분이 영대명사의 선행사일 가능성이 높기 때문에 중심화이론의 주요 구성요소인 전향적 중심리스트 서열의 최상위에 슬롯성분이 위치해야 한다는 논지를 전개한다. 어떤 영대명사의 선행사가 될 수 있는 후보자가 여럿일 경우에 가장 적합한 선행사를 찾아내기 위해서는 별도로 '개념양립성제약을' 설정할 필요가 있다고 주장한다 광역대화에 나타나는 명시적인 대명사의 선행사 탐색과 관련하여서는 대명사의 선행사는 대명사를 담화통어할 수 있는 위치에 있어야 한다는 담화통어제약을 제안하고, 담화통어 개념을 정의한다.

  • PDF

메타문자를 사용한 한국어 사전 탐색 앱 (Korean Word Search App Using Meta-characters)

  • 권홍석;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.110-113
    • /
    • 2011
  • 스마트 폰의 보급이 대중화됨에 따라 다양한 앱들이 사용되고 있으나 효율적인 사전 탐색에 관한 앱은 그다지 많지 않다. 현재 공개된 한국어 사전 탐색 앱은 완전한 단어이거나 단어의 부분 문자열을 질의로 사용한다. 이 경우 완전한 단어를 기억하지 못하거나 한국어 정보처리를 위한 여러 형태의 음운 정보를 쉽게 탐색할 수 없다. 이러한 문제를 개선하기 위해 본 논문에서는 메타문자를 사용하여 효율적으로 단어를 탐색할 수 있는 앱을 개발한다. 본 논문에서 사용하는 메타문자는 임의의 음절을 표현하는 '*'와 '?'과 종성을 표현하는 ':'를 사용하며 사전구조는 자소 단위의 트라이를 사용한다. 또한 음절은 물론이고 자소(초성, 중성, 종성)로 구성된 질의를 탐색할 수 있다. 더구나 음절과 자소가 혼합된 질의도 사용할 수 있도록 하여 사용자의 편의를 크게 도모하였다.

  • PDF

구조적 정보를 근거로 최적우선탐색하는 온라인 한글 인식 (An On-Line Hangul Recognition System Based on the Structural Information and the Best-First Search)

  • 권오성;권영빈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.515-523
    • /
    • 1992
  • 일반적으로 한글 인식 과정은 많은 후보들을 생성하며 이 후보들로부터 정확한 인식결과를 얻고 복잡도를 줄이기 위해서는 효과적인 한글 표현과 탐색기법이 요구된다. 이런 목적을 위하여 본 논문에서는 한글에 적합한 구조적 정보들을 4단계 계층적 형태로 표현한다. 그리고 이 정보들을 근거로 후보 문자의 생성과 탐색을 진행하며 전체적으로 최적우선탐색을 이룬다. 인식실험은 다양한 필자들을 대상으로 한글 잦기 상위 422자로 실험한 결과 평균 86% 인식률을 얻을 수 있었다.

  • PDF