• Title/Summary/Keyword: 핵심단어

Search Result 249, Processing Time 0.032 seconds

Non-Keyword Model for the Improvement of Vocabulary Independent Keyword Spotting System (가변어휘 핵심어 검출 성능 향상을 위한 비핵심어 모델)

  • Kim, Min-Je;Lee, Jung-Chul
    • The Journal of the Acoustical Society of Korea
    • /
    • v.25 no.7
    • /
    • pp.319-324
    • /
    • 2006
  • We Propose two new methods for non-keyword modeling to improve the performance of speaker- and vocabulary-independent keyword spotting system. The first method is decision tree clustering of monophone at the state level instead of monophone clustering method based on K-means algorithm. The second method is multi-state multiple mixture modeling at the syllable level rather than single state multiple mixture model for the non-keyword. To evaluate our method, we used the ETRI speech DB for training and keyword spotting test (closed test) . We also conduct an open test to spot 100 keywords with 400 sentences uttered by 4 speakers in an of fce environment. The experimental results showed that the decision tree-based state clustering method improve 28%/29% (closed/open test) than the monophone clustering method based K-means algorithm in keyword spotting. And multi-state non-keyword modeling at the syllable level improve 22%/2% (closed/open test) than single state model for the non-keyword. These results show that two proposed methods achieve the improvement of keyword spotting performance.

Stack-Pointer Network for Korean Dependency Parsing (Stack-Pointer Network를 이용한 한국어 의존 구문 분석)

  • Cha, Da-Eun;Lee, Dong-Yub;Lim, Heui-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.685-688
    • /
    • 2018
  • 의존 구문 분석은 자연어 문장에 포함된 단어들 간의 의존 관계를 분석하는 과제로 다양한 자연어 이해 과제에 요구되는 핵심 기술 중 하나이다. 본 연구에서는 단어와 문자 자질을 적용한 기존 Stack-Pointer Network의 인코더의 입력 단어 표상을 확장하여, 한국어를 비롯한 형태적으로 복잡한 언어(morphologically rich language)에 적합하도록 음절-태그 단위, 형태소 단위, 형태소 품사 정보 자질을 보강한 의존 구문 분석 모델을 제안한다. 실험 결과 제안하는 모델은 의존 구조로 변환된 세종 구문 분석 말뭉치에서 UAS 90.58%, LAS 88.35%의 성능을, 2018 국어 정보 처리 시스템 경진 대회 평가 데이터에서 UAS 84.69%, LAS 82.02%의 성능을 보였다. 더불어 제안하는 모델은 포함된 문장의 전체 길이가 긴 의존 관계, 의존소와 지배소의 거리가 먼 의존 관계, 의존소를 구성하는 형태소의 개수가 많은 의존 관계에서 기존 Stack-Pointer Network보다 향상된 성능을 보였다.

  • PDF

N3WS : Interactive Newspaper Article Navigation Using Keyword and Summary Extraction (N3WS : 키워드 및 요약문장 추출을 이용한 인터랙티브 신문기사 탐색)

  • Cho, Hee-Jeong;Son, Ji-Youn;Yoon, Byeol-Yi;Cho, A-Hyun;Kim, Myung;Park, Eun-Jeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.694-697
    • /
    • 2017
  • 최근 인터넷 기사 중에는 부정확한 제목이나 자극적인 단어를 사용하는 경우가 많아 구독자에게 불편함을 준다. 본 논문에서는 이러한 기사들의 헤드라인을 삭제하고, 기사의 내용을 3문장으로 요약해 주어, 구독자가 원하는 기사를 효율적으로 파악할 수 있게 하는 시스템을 제안한다. 제안하는 본 시스템은 파이썬 언어의 KoNLPy 패키지를 사용하여 기사의 단어들을 형태소 단위로 분석하며, 추출된 키워드를 토대로 워드 클라우드를 생성한다. 사용자가 클라우드의 특정 단어를 선택하면, 해당 신문기사들의 본문을 분석하여 각 신문 기사만의 핵심적인 문장을 3문장으로 출력해 준다.

An Image-based Word Matching Method for Large volume Printed Hangul Document Retrieval (대용량 인쇄 한글 문서 검색을 위한 영상 기반 단어 매칭 방법)

  • 진영범;오일석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.461-463
    • /
    • 2000
  • 기계 인쇄된 문서 영상에서 주제어를 탐색하는 문제는 여러 응용 분야에 필수적인 핵심 기술이지만 수작업 또는 OCR 소프트웨어를 이용하여 텍스트로 변환하는 방법은 많은 비용 때문에 한계를 가지고 있다. 요즘 영상 형태로 원문을 저장하는 경우가 많으므로 본 논문은 영상-기반 매칭을 통한 검색 방법을 채택하였다. 문자 또는 단어 매칭에서 가장 중요한 요소가 특징인데 본 논문에서는 디지털도서관과 같이 매칭 대상 단어가 수천만∼수십억에 달하는 대용량 한글 문서 검색에 이용될 수 있도록 비교적 간단히 추출할 수 있고 차원수 조절이 용이한 4방향 프로파일 특징을 이용하는 빠른 검색 방법을 제안한다. 실험결과 8-차원 정도의 간단한 특징으로도 의미 있는 검색 성능을 얻을 수 있음을 보였다.

  • PDF

Chunking Annotation Corpus Construction for Keyword Extraction in News Domain (뉴스 기사 키워드 추출을 위한 구묶음 주석 말뭉치 구축)

  • Kim, Tae-Young;Kim, Jeong Ah;Kim, Bo Hui;Oh, Hyo Jung
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.595-597
    • /
    • 2020
  • 빅데이터 시대에서 대용량 문서의 의미를 자동으로 파악하기 위해서는 문서 내에서 주제 및 내용을 포괄하는 핵심 단어가 키워드 단위로 추출되어야 한다. 문서에서 키워드가 될 수 있는 단위는 복합명사를 포함한 단어가 될 수도, 그 이상의 묶음이 될 수도 있다. 한국어는 언어적 특성상 구묶음 개념이 적용되는 데, 이를 통해 주요 키워드가 될 수 있는 말덩이 추출이 가능하다. 따라서 본 연구에서는 문서에서 단어뿐만 아니라 다양한 단위의 키워드 묶음을 태깅하는 가이드라인 정의를 비롯해 태깅도구를 활용한 코퍼스 구축 방법론을 고도화하고, 그 방법론을 실제로 뉴스 도메인에 적용하여 주석 말뭉치를 구축함으로써 검증하였다. 본 연구의 결과물은 텍스트 문서의 내용을 파악하고 분석이 필요한 모든 텍스트마이닝 관련 기술의 기초 작업으로 활용 가능하다.

  • PDF

Development of Serious Game 'Word Collector' for Learning Hangul (한글 학습 기능성게임 '단어수집가' 개발)

  • Lee, Bum-Ro
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.613-614
    • /
    • 2022
  • 전 세계적인 주목을 받기 시작한 한류 콘텐츠의 확산으로 한국어 교육에 대한 수요가 폭발적으로 증가하고 있는 상황에서 효과적인 한국어 학습용 기능성 게임에 대한 가능성이 주목 받고 있다. 본 논문에서는 한국어 교육의 진입 과정에 해당 될 수 있는 한글을 게임 통해 학습하고 익숙해지는 경험을 제공할 수 있는 한글 학습 RPG '단어수집가'개발을 기획하고 해당 게임의 프로토타입을 개발한다. 제안 게임의 주인공은 가상의 공간에서의 체험을 통해 한글의 자음과 모음을 게임 아이템으로 획득하고 이를 조합하여 한글 단어를 합성하여 이를 게임에 활용하는 구조를 가지도록 설계되었고, 전체 게임 시나리오의 학습 적합성과 재미 요소들의 점검을 위해 실제 기획 의 핵심 내용을 적용한 프로토타입을 활용한다. 또한 본 게임에서 기획된 한글 학습용 게임은 미국 워싱턴에 위치한 조지워싱턴대학교에서 발행하는 미국인 대상의 한국어 교재와 스토리 등을 연동하여 온오프라인 연계 한글 교육 실현을 목표로 한다.

  • PDF

A Study of Smart Convergence Design of English Vocabulary Learning Contents Applying the Periodic Repetitive Method (주기적 반복법을 적용한 영단어 학습콘텐츠 스마트 융합 설계 연구)

  • Kim, Young-Sang
    • Journal of the Korea Convergence Society
    • /
    • v.7 no.4
    • /
    • pp.133-140
    • /
    • 2016
  • This paper suggests designing how to acquire English vocabularies on the smart devices based on the research that a ground-breaking English Vocabulary Learning Contents needs developing. The method makes it possible to develop the contents which helps the learners to master English vocabularies effectively on the smart phone. The core idea of this paper is as in the following: 1) English learners learn 30 vocabularies for three minutes 10 times (one is for a new learning and the other nine ones are for reviews about the first learning) a day. 2) Considering Ebbinghaus Forgetting Curve, the reflection study proposes to provide the learners with three times' reviews: one day, 10days, and 30days later from which they learn the first 30 vocabularies. This contents is mainly made up of 5 developing sections (1)to generate App ID, (2)to access App, (3)to set up Alarm, (4)to process Word learning, and (5)to monitor the result of learning. This proposed idea is optimized to enhance the memory by Ebbinghaus Periodic Repetitive Method, which makes the learners satisfied with their English vocabulary learning.

Analysis of Research Trends in Social Responsibility Education of Chinese University Students (중국 대학생 사회적책임 교육 연구동향 분석)

  • ZHAI, LIXIA;Park, Changun
    • Journal of the International Relations & Interdisciplinary Education
    • /
    • v.2 no.1
    • /
    • pp.15-28
    • /
    • 2022
  • College students' perception of social responsibility is directly related to the development of the country. With the development of society, the social responsibility of university students is becoming more important, so research on it is being actively conducted in China. In order to understand the current research status of social responsibility education for Chinese university students, this study analyzed the research trends of the top 22 language networks among the key words that appeared in related studies from January 2015 to December 2021. As a result, many key words such as college student social responsibility (563), social responsibility education (340 times), college students (191), social responsibility (197 times), and responsibility (133 times) appeared a lot. In the case of connection centrality, the connection centrality of social responsibility education, college student social responsibility, college students, and social responsibility was high. In the case of proximity centrality, the proximity centrality of college students' social responsibility, social responsibility education, college students, and social responsibility was high.

IT 기반 융합산업 정책 방향

  • Yu, Su-Geun
    • Information and Communications Magazine
    • /
    • v.25 no.11
    • /
    • pp.7-13
    • /
    • 2008
  • IT'와 '융합'은 최근 사회, 경제, 문화 전반에서 가장 빈번하게 접하는 단어가 되었다. 21세기를 여는 핵심 요소였던 IT는 성장 정체와 위기론을 거쳐 새로운 영역을 창출할 것으로 기대되고 있다. 본고에서는 다양한 모습으로 태동하고 있는 IT기반 융합산업에 의미를 부여하고 그 정책방향을 제시하고자 한다.

A Study on Enhancing Emotional Engagement in Learning Situation - Based on Development Case of English Learning Serious Game 'Word Collectrian' (학습 장면에서 감정 개입을 촉진하기 위한 기능성 게임의 활용 - 단어 시각화 기반의 영어 학습용 기능성 게임 '워드 콜렉트리안' 제작 사례를 바탕으로)

  • Lee, Haksu;Doh, Young Yim
    • Journal of Korea Game Society
    • /
    • v.12 no.6
    • /
    • pp.95-106
    • /
    • 2012
  • Emotion is very important feature in educational situation. Because it has high influence to memory, educational achievement, motivation. This study tried to find out possibility of serious game as emotional engagement tool in educational situation. We did our pilot experiment to elementary school students who are english as second language. In this L2 learning situation, we did our basic experiment with English language learning serious game called 'Word Collectrian". Word Collectrian has some features for emotional engagement. It has interaction for dynamic word visualization, providing context video for word usage, putting visualized word on learner's virtual home. According to experimental result, word Collectrian has possibility for educational achievement and emotional engagement effect.