• Title/Summary/Keyword: 단어 데이터베이스

Search Result 208, Processing Time 0.024 seconds

Comparison of MEL-LPC and LPC-MEL Analysis Method for the Korean Speech Recognition Systems. (한국어 음성 인식 시스템을 위한 MEL-LPC 분석 방법과 LPC-MEL 분석 방법의 비교)

  • 김주곤;김범국;정호열;정현열
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.833-836
    • /
    • 2001
  • 본 논문에서는 한국어 음성인식 시스템의 성능 향상을 위해 청각 주파수 분해능을 가진 MEL-LPC Cepstrum을 음소단위의 HMM(Hidden Markov Model)을 기반으로 하는 인식 시스템에 적용하여 그 결과를 비교 검토하였다. 선형예측(LP) 분석 후에 후처리로서 주파수를 왜곡시킨 LPC-MEL 분석이 계산량이 적고 효과적이라 일반적으로 많이 사용되고 있으나 주파수 분해능은 많이 개선되지 않는다. 따라서 본 논문에서는 주파수 분해능을 개선하기 위해, 원 음성신호로부터 직접적으로 멜주파수로 왜곡시킨 후 선형 예측 분석을 수행하는 MEL-LPC 분석방법을 이용한 음소기반의 화자 독립 음성인식 시스템을 구성하여 기존의 LPC-MEL 분석방법과 비교실험을 통하여 MEL-LPC 분석방법의 유효성을 검토하였다. 실험에 사용한 음성 데이터베이스는 음소 및 단어 인식실험에서는 ETRI 445단어 DB, 연속 숫자음인식 실험에서는 KLE 4연속 숫자음 DB를 사용하였다. 화자 독립 음소인식 실험의 경우, 묵음을 제외한 47개의 유사 음소에 대하여 4상태 3출력의 Left-to-Right 모델을이용하였다. 단어 및 연속 숫자음 인식 실험의 경우, 유한상태 네트워크에 의한 OPDP법을 이용하였다. 화자 독립 음소, 단어 및 4연속 숫자음 인식 실험결과, 기존의 LPC-MEL Cepstrum을 사용한 경우보다 MEL-LPC Cepstum을 사용한 경우가 더 높은 인식률을 나타내어 한국어 음성인식 시스템에서 MEL-LPC 분석방법의 유효성을 확인할 수 있었다.

  • PDF

A Study on the optimal text corpus for company names (한국어최적상호명코퍼스설계에관한연구)

  • Lee, Sun-Jung
    • Journal of the Korea Computer Industry Society
    • /
    • v.5 no.5
    • /
    • pp.747-754
    • /
    • 2004
  • In this paper, we obtain an optimal corpus that can represent its characteristics very well from the baseline corpus which consists of unique 1,566,943 names among company names in a directory assistance serve (114). Two kinds of optimal solutions ared considered to obtain the optimal corpus. The first solution is to find phonetically balanced corpus (PBC), which are the minimum set including all possible triphones in the baseline corpus. The second solution is to find the phonetically distributed corpus (PDC), which is a minimum set representing the frequency characteristics of triphones in the baseline corpus. We can obtain 8,699 words as the PBC and 16,783 words (similarity measure R = 0.92) as PDC, respectively. These corpora can be used for the development of speech recognition and speech synthesis.

  • PDF

An Android App Development for 'Ddut Da Hangul' with Word Learning and Game Facilities (단어 학습 및 게임 기능을 갖는 '떴다 한글' 안드로이드 앱 개발)

  • Woo, Young-Gon;Sim, Eun-Yeong;Chae, Sur-Hwa;Han, Seung-Soo;Kang, Hyun-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.142-146
    • /
    • 2015
  • 본 논문은 뜻풀이를 통해 한글단어를 맞추는 앱 어플리케이션인 '떴다 한글'의 구현에 대하여 논한다. 학습적인 요소와 게임적인 요소를 기반으로 만들어진 이 앱을 통하여 누구나 쉽게 이용하고 한글 단어를 학습할 수 있는 안드로이드 앱 어플리케이션이다. '떴다 한글'은 4가지 특징을 가진다. 첫 번째는 한글의 사전적인 의미를 제공하여 게임이 진행되기 때문에 사용자가 자신이 사용하는 언어의 정확한 뜻을 알 수 있게 하였다. 두 번째는 난이도를 선택할 수 있어 모든 연령대 사람들과 한글에 관심이 많은 외국인 사용자들이 쉽게 이용할 수 있다. 세 번째는 게임적 요소로 중요한 동적인 움직임과 함께 문제를 풀게 하여 사용자가 오랜 시간동안 지루하지 않게 하였다. 네 번째는 순위를 볼 수 있게 하여 자신의 점수를 등록하면 다른 사람들과 경쟁을 할 수 있도록 하여 더욱 이 앱에 관심을 갖도록 하였다. 이러한 특징들은 교육적 측면으로서 좋은 특징을 가지고 있다. 그 외에도 떴다 한글은 데이터베이스 파일을 중심으로 작동하기 때문에 파일의 구조와 입력 정보를 변경하여 여러 버전(헷갈리기 쉬운 단어, 순수우리말, 사자성어 등)의 게임으로 응용이 가능하다는 산업 및 기술적 측면의 모습도 볼 수 있다.

  • PDF

Implementation of Search Method based on Sequence and Adjacency Relationship of User Query (사용자 검색 질의 단어의 순서 및 단어간의 인접 관계에 기반한 검색 기법의 구현)

  • So, Byung-Chul;Jung, Jin-Woo
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.21 no.6
    • /
    • pp.724-729
    • /
    • 2011
  • Information retrieval is a method to search the needed data by users. Generally, when a user searches some data in the large scale data set like the internet, ranking-based search is widely used because it is not easy to find the exactly needed data at once. In this paper, we propose a novel ranking-based search method based on sequence and adjacency relationship of user query by the help of TF-IDF and n-gram. As a result, it was possible to find the needed data more accurately with 73% accuracy in more than 19,000 data set.

기업가정신에 대한 연구동향 분석

  • Jang, Seong-Hui
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2022.04a
    • /
    • pp.73-79
    • /
    • 2022
  • 본 연구는 동시출현단어 분석과 토픽모델링을 통해 기업가정신의 연구주제와 연구 동향을 분석하여 기업가정신 연구에 대한 향후 연구방향을 수립하기 위한 정보를 제공하는 것이 목적이다. 이를 위해 Web of Science 데이터베이스에서 "entrepreneurship"을 기본검색어로 설정하고, 2002년부터 2021년까지 발표한 영어 논문으로 제한하여 기업가정신 논문의 데이터를 다운로드하여 데이터를 확보하였다. 본 연구에서는 VOSviewer 프로그램을 이용하여 동시출현단어 분석을 하였고, R 프로그램을 이용하여 토픽모델링 분석을 하였다. 동시출현단어 분석 결과, 기업가정신과 혁신 클러스터, 기업가정신 교육 클러스터, 사회적 기업가정신과 지속가능성 클러스터, 기업성과 클러스터, 그리고 지식 및 기술이전 클러스터 등 5개의 클러스터로 구분되었다. 토픽모델링 분석 결과, 창업환경 및 경제발전, 국제 기업가정신, 다양한 기업가정신, 벤처기업과 자본조달, 정부정책 및 지원, 사회적 기업가정신, 경영관련 이슈, 지역도시계획 및 개발, 기업가정신 교육, 기업가의 혁신과 성과, 기업가정신 연구, 기업가의 창업의도 등 12개의 토픽으로 분석되었다. 본 연구의 결과는 기업가정신 연구에 대한 전반적인 연구동향을 파악할 뿐만 아니라, 기업가정신과 관련된 어떠한 연구 주제들이 다루어져 왔는지에 대해 분석함으로써 기업가정신에 대한 연구의 이해도를 높이고 기업가정신 연구가 가져올 방향성을 제안하는데 활용할 수 있을 것으로 기대된다.

  • PDF

집중조명 / 성공적인 E-business의 관건 'Web Usability'

  • Lee, Eun-Jong
    • Digital Contents
    • /
    • no.11 s.90
    • /
    • pp.50-57
    • /
    • 2000
  • 무한 경쟁의 E-business시대에서 가장 강력한 경쟁력 제고 수단의 하나로 평가되는 디자인. 디자인이라는 단어는 이제 누구에게나 친밀하며 누구나 디자인의 중요성을 강변하고 있다. 그러나 과연 디자인에 대한 올바른 이해가 이루어지고 있는가에는 의문의 여지가 있다. 웹에서의 디자인의 역할을 외관에서 느낄수 있는 심미성을 향상시키는 것 정도로 인식하고 있기 때문에 디자인에 의한 경쟁력 제고가 단순한 외관의 변화에 그치는 경우가 대부분인 것이 현실이다.

  • PDF

어의의 기술 -중간언어의 관점에서

  • 장석진
    • Proceedings of the Korean Society for Language and Information Conference
    • /
    • 2001.06a
    • /
    • pp.113-139
    • /
    • 2001
  • 중간언어 (interlingua, IL) 구축을 지향하는 시각에서 단어의 다의성 (polysemy) 문제를 각종 워드넷의 기술 방식과 용례를 대비하여 논의하고, 센스(어의) 번호를 부착한 세계 워드넷 (Would Wordnet) 데이터베이스를 구상하고, 이 연장 선상에서 (Pustejvsky 식) 생성 어휘 부와 TMR(텍스트의미표상)이론을 가미한 제약기반 통합문법(CUG)으로 IL구축에 다리를 놓고, 이로부터 개별언어 기술로 변환한다.

  • PDF

2000년 인터넷의 새로운 혁명

  • Yu, Myeong-Won
    • Digital Contents
    • /
    • no.1 s.80
    • /
    • pp.38-46
    • /
    • 2000
  • 너무나 친숙한 단어 인터넷. 삶의 주위에는 언제나 인터넷이 있다. 인터넷이 발전을 거듭하면서 우리 주변의 모든 것을 바꾸어 놓고 있다. 얼마 전부터 TV광고나 언론매체에 각 이동통신 사업자의 무선인터넷에 대한 현란한. 그러나 목숨을 건 광고가 계속되고 있다. 우리들에게 친숙한 핸드폰에서 인터넷을 사용할 수있다는 광고가 바로 이것이다. 핸드폰과 인터넷의 만남으로 대표할 수 있는 무선인터넷의 세계로 들어가보자.

  • PDF

특집 / 시장 특수성 감안한 한국적 퍼블리싱 모델을 찾아라

  • Jeong, Ui-Sik
    • Digital Contents
    • /
    • no.9 s.124
    • /
    • pp.32-37
    • /
    • 2003
  • 언제부터인가 '게임 퍼블리셔'란 단어는 한국 게임산업의 가장 중요한 화두가 돼버렸다. 주요 게임 유통사들과 몇몇 스타급 게임 개발사들이 사용하기 시작한 이 용어는 어느새 게임과는 별 관계없이 보이던 인터넷 포탈/커뮤니티 기업에 이르기까지 퍼져, 이젠 너나 할것없이 "최고의 게임 퍼블리셔가 되겠노라"고 한목소리로 외쳐대고 있다. 과연 '게임 퍼블리셔'는 한국 게임산업의 장밋빛 미래를 약속해주는 만능열쇠 같은 존재일까? 그 해답을 찾아보자

  • PDF

디지털콘텐츠산업 발전 연구회 시샵 민병수 수석 INTERVIEW

  • Sin, Jong-Hun
    • Digital Contents
    • /
    • no.10 s.125
    • /
    • pp.29-29
    • /
    • 2003
  • 디지털콘텐츠 산업이 미래 국가 경쟁력의 척도로 자리매김하면서 국내에서도 디지털콘텐츠에 대한 관심이 점점 높아지고 있다. 게임과 모바일 콘텐츠, 애니메이션 등은 일반인들에게도 더 이상 낯선 단어가 아니며, 이미 각 분야별로 수 많은 커뮤니티들이 생겨나 활발한 활동을 펼치고 있다. 하지만 디지털 콘텐츠 전 분야를 아우르면서 다양한 자료를 제공하는 커뮤니티를 찾기란 그리 쉬운 일은 아니다.

  • PDF