• Title/Summary/Keyword: 언어적 탐색

Search Result 342, Processing Time 0.031 seconds

The Vocabulary Recognition Optimize using Acoustic and Lexical Search (음향학적 및 언어적 탐색을 이용한 어휘 인식 최적화)

  • Ahn, Chan-Shik;Oh, Sang-Yeob
    • Journal of Korea Multimedia Society
    • /
    • v.13 no.4
    • /
    • pp.496-503
    • /
    • 2010
  • Speech recognition system is developed of standalone, In case of a mobile terminal using that low recognition rate represent because of limitation of memory size and audio compression. This study suggest vocabulary recognition highest performance improvement system for separate acoustic search and lexical search. Acoustic search is carry out in mobile terminal, lexical search is carry out in server processing system. feature vector of speech signal extract using GMM a phoneme execution, recognition a phoneme list transmission server using Lexical Tree Search algorithm lexical search recognition execution. System performance as a result of represent vocabulary dependence recognition rate of 98.01%, vocabulary independence recognition rate of 97.71%, represent recognition speed of 1.58 second.

Vocabulary Recognition Retrieval Optimized System using MLHF Model (MLHF 모델을 적용한 어휘 인식 탐색 최적화 시스템)

  • Ahn, Chan-Shik;Oh, Sang-Yeob
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.10
    • /
    • pp.217-223
    • /
    • 2009
  • Vocabulary recognition system of Mobile terminal is executed statistical method for vocabulary recognition and used statistical grammar recognition system using N-gram. If limit arithmetic processing capacity in memory of vocabulary to grow then vocabulary recognition algorithm complicated and need a large scale search space and many processing time on account of impossible to process. This study suggest vocabulary recognition optimize using MLHF System. MLHF separate acoustic search and lexical search system using FLaVoR. Acoustic search feature vector of speech signal extract using HMM, lexical search recognition execution using Levenshtein distance algorithm. System performance as a result of represent vocabulary dependence recognition rate of 98.63%, vocabulary independence recognition rate of 97.91%, represent recognition speed of 1.61 second.

High Speed Local Text Reuse Detection using IR Approach (정보검색 기법을 이용한 부분 문서 재사용 고속 탐색)

  • Bae, Won-Sik;Jo, Myung-Rae;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.63-68
    • /
    • 2008
  • 인터넷의 발달로 지식의 재사용이 폭발적으로 증가하였다. 이는 지식의 확산이라는 측면에서는 바람직하지만 지식의 도용이라는 문제점을 안고 있다. 따라서 문서의 전부나 일부분을 재사용한 것인지를 판단하고자하는 요구가 증가하고 있다. 본 논문에서는 정보검색 기술을 이용하여 문서에서 부분 문서 재사용 및 표절을 탐색하는 방법을 제안한다. 본 논문에서는 대용량 문서의 고속 탐색을 위해서 원본 문서와 대상 문서를 색인하여 검색에 이용한다. 또한 한글의 언어적 특성을 맞게 어순 변경 비교, 기능어 생략 비교, 갭(gap) 비교 등의 다양한 처리 조건을 제공하여 문서 재사용을 탐색할 수 있다. 실험을 통해서 기존의 시스템보다 정확하게 고속으로 문서 재사용 탐색이 가능함을 보였다. 특히 비교 문서가 증가하더라도 비교 시간이 급격하게 증가하지 않으며, 정보검색 기법을 사용하는 경우 취약하다고 알려져 있는 부분 문서 재사용 탐색에도 견고하며, 처리 조건에 따라 유연하게 문서 재사용 탐색이 가능하다.

  • PDF

Examining the Feasibility of Utilizing a Large Language Model for Korean Grammatical Error Correction (한국어 맞춤법 교정을 위한 초거대 언어 모델의 잠재적 능력 탐색)

  • Seonmin Koo;Chanjun Park;JeongBae Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.61-65
    • /
    • 2023
  • 최근, 대부분의 태스크가 초거대 언어 모델로 통합되고 있을 정도로 많은 관심 및 연구되고 있다. 초거대 언어 모델을 효과적으로 활용하기 위해서는 모델의 능력에 대한 분석이 선행되어야 하나, 한국어에 대한 분석 및 탐색은 상대적으로 부족하다. 본 논문에서는 한국어 맞춤법 교정 태스크를 통해 초거대 언어 모델의 능력을 탐색한다. 맞춤법 교정 태스크는 문장의 구조 및 문법을 이해하는 능력이 필요하며, 사용자의 만족도에 영향을 미칠 수 있는 중요한 태스크이다. 우리는 맞춤법 세부 유형에 따른 ChatGPT의 제로샷 및 퓨샷성능을 평가하여 초거대 언어 모델의 성능 분석을 수행한다. 실험 결과 제로샷의 경우 문장부호 오류의 성능이 가장 우수했으며, 수사 오류의 성능이 가장 낮았다. 또한, 예제를 더 많이 제공할수록 전체적인 모델의 성능이 향상되었으나, 제로샷의 경우보다 오류 유형 간의 성능 차이가 커지는 것을 관찰할 수 있었다.

  • PDF

The necessity and direction of verbally gifted education (언어 영재교육의 필요성과 방향 탐색)

  • 강승희;조석희
    • Journal of Gifted/Talented Education
    • /
    • v.14 no.1
    • /
    • pp.91-114
    • /
    • 2004
  • The purposes of this study were to review the necessity and establish the direction of verbally gifted education. To fulfil purposes, the following studies were carried out: (1) The necessity of verbally gifted education was reviewed based on the social, educational and personal aspect. (2) The concept of verbal talent was reviewed. According to the research of verbal talent, we called a person who has a high level of language intelligence a verbal talent. Or verbal talent can also be a person who accomplished a high level in anyone area among reading, writing, hearing, speaking, and foreign language. (3) The present condition and research states of verbally gifted education were analyzed. (4) The direction of verbally gifted education were proposed.

A Comparative Study on the Effectiveness of Hangul Natural Language Retrieval Using KT Test Set (KT Test Set을 이용한 우리말 자연언어검색의 효율성에 관한 비교연구)

  • 이현아;김성혁
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1995.08a
    • /
    • pp.37-40
    • /
    • 1995
  • 본 연구는 자연언어시스템에서 색인어와 탐색어의 특정성에 기인하는 재현율 감소를 극복하기 위한 방법론으로써 탐색어의 확장을 통한 검색효율을 평가하였다. 이를 위하여 우리말 데이터베이스를 대상으로 주제전문가가 자연언어로 작성한 원 질의문 (Q1), 원 질의문에 사용된 탐색어와 데이터베이스내의 색인어간의 유사도를 이용하여 탐색어를 확장한 질의문 (Q2(0.2), Q2(0.3)), 주제전문가인 이용자가 Q1의 의미적인 관계를 고려해서 자연언어로 탐색어를 확장한 질의문 (Q3)을 검색효율면에서 비교하였다. 실험결과, 평균재현율은 Q2(0.2), Q2(0.3), Q3, Q1의 검색의 순이었다. 평균정확율은 Q3, Q2(0.3), Q1, Q2(0.2)검색의 순으로 나타났다.

  • PDF

비주얼 베이직을 이용한 초등 정보과학영재용 프로그래밍 언어 교육내용 탐색

  • 강성원;이재호
    • Proceedings of the Korean Society for the Gifted Conference
    • /
    • 2003.11a
    • /
    • pp.209-219
    • /
    • 2003
  • 초등 정보과학 영재교육의 핵심이 되는 프로그래밍교육은 창의적 사고와 수준 높은 문제 해결력을 동원하여 새로운 알고리즘을 생성해내는 정보 교육의 중요한 분야임에도 불구하고 초등 정보과학영재의 특성을 고려한 체계적인 교육 내용이 확립되어 있지 못한 상태이다. 본 연구에서는 초등 정보과학영재를 위한 프로그래밍 교육의 필요성을 탐색하여 프로그래밍 교육내용 요소를 추출하였으며, 프로그래밍 언어 선정기준을 통해 비주얼, 베이직을 교육용 프로그래밍 언어로 선정한 후 프로그래밍 교육내용을 제안하였다.

  • PDF

On the Anaphora Resolution in Korean Dialogues -in the Framework of the Controlled Centering Theory (한국어 대화에서의 대명사의 선행사 탐색 -통제된 중심화이론적 접근)

  • Lee, Ik-Hwan;Lee, Min-Haeng
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.382-388
    • /
    • 1999
  • 이 논문은 두 가지 목적을 가진다. 첫째, 대명사의 선행사 탐색을 위한 이론으로 널리 알려진 중심화이론을 필자들이 수정확대한 통제된 중심화 이론(Controlled Centering Theory, 이하 CCT)을 소개한다. 둘째, 한국어의 대화에서 나타나는 대명사의 선행사 탐색문제에 대한 설명력있는 해답을 CCT의 틀안에서 제시한다. 이를 위해 제한된 영역 대화라 할 수 있는 호텔예약대화에 나타나는 영대명사의 특성에 대해 논의하고, 그 선행사 탐색과 관련하여, 정보구조적인 관점에서 슬롯연결성분이 영대명사의 선행사일 가능성이 높기 때문에 중심화이론의 주요 구성요소인 전향적 중심리스트 서열의 최상위에 슬롯성분이 위치해야 한다는 논지를 전개한다. 어떤 영대명사의 선행사가 될 수 있는 후보자가 여럿일 경우에 가장 적합한 선행사를 찾아내기 위해서는 별도로 '개념양립성제약을' 설정할 필요가 있다고 주장한다 광역대화에 나타나는 명시적인 대명사의 선행사 탐색과 관련하여서는 대명사의 선행사는 대명사를 담화통어할 수 있는 위치에 있어야 한다는 담화통어제약을 제안하고, 담화통어 개념을 정의한다.

  • PDF

Korean Word Search App Using Meta-characters (메타문자를 사용한 한국어 사전 탐색 앱)

  • Kwon, Hong-Seok;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.110-113
    • /
    • 2011
  • 스마트 폰의 보급이 대중화됨에 따라 다양한 앱들이 사용되고 있으나 효율적인 사전 탐색에 관한 앱은 그다지 많지 않다. 현재 공개된 한국어 사전 탐색 앱은 완전한 단어이거나 단어의 부분 문자열을 질의로 사용한다. 이 경우 완전한 단어를 기억하지 못하거나 한국어 정보처리를 위한 여러 형태의 음운 정보를 쉽게 탐색할 수 없다. 이러한 문제를 개선하기 위해 본 논문에서는 메타문자를 사용하여 효율적으로 단어를 탐색할 수 있는 앱을 개발한다. 본 논문에서 사용하는 메타문자는 임의의 음절을 표현하는 '*'와 '?'과 종성을 표현하는 ':'를 사용하며 사전구조는 자소 단위의 트라이를 사용한다. 또한 음절은 물론이고 자소(초성, 중성, 종성)로 구성된 질의를 탐색할 수 있다. 더구나 음절과 자소가 혼합된 질의도 사용할 수 있도록 하여 사용자의 편의를 크게 도모하였다.

  • PDF

An On-Line Hangul Recognition System Based on the Structural Information and the Best-First Search (구조적 정보를 근거로 최적우선탐색하는 온라인 한글 인식)

  • Kwon, Oh-Sung;Kwon, Young-Bin
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.515-523
    • /
    • 1992
  • 일반적으로 한글 인식 과정은 많은 후보들을 생성하며 이 후보들로부터 정확한 인식결과를 얻고 복잡도를 줄이기 위해서는 효과적인 한글 표현과 탐색기법이 요구된다. 이런 목적을 위하여 본 논문에서는 한글에 적합한 구조적 정보들을 4단계 계층적 형태로 표현한다. 그리고 이 정보들을 근거로 후보 문자의 생성과 탐색을 진행하며 전체적으로 최적우선탐색을 이룬다. 인식실험은 다양한 필자들을 대상으로 한글 잦기 상위 422자로 실험한 결과 평균 86% 인식률을 얻을 수 있었다.

  • PDF