• Title/Summary/Keyword: 핵심단어

Search Result 249, Processing Time 0.025 seconds

A Similarity-based Dialogue Modeling with Case Frame and Word Embedding (격틀과 워드 임베딩을 활용한 유사도 기반 대화 모델링)

  • Lee, Hokyung;Bae, Kyoungman;Ko, Youngjoong
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.220-225
    • /
    • 2016
  • 본 논문에서는 격틀과 워드 임베딩을 활용한 유사도 기반 대화 모델링을 제안한다. 기존의 유사도 기반 대화 모델링 방법은 형태소, 형태소 표지, 개체명, 토픽 자질, 핵심단어 등을 대화 말뭉치에서 추출하여 BOW(Bag Of Words) 자질로 사용하였기 때문에 입력된 사용자 발화에 포함된 단어들의 주어, 목적어와 같은 문장성분들의 위치적 역할을 반영할 수 가 없다. 또한, 의미적으로 유사하지만 다른 형태소를 가지는 문장 성분들의 경우 유사도 계산에 반영되지 않는 형태소 불일치 문제가 존재한다. 이러한 문제점을 해결하기 위해서, 위치적 정보를 반영하기 위한 문장성분 기반의 격틀과 형태소 불일치 문제를 해결하기 위한 워드 임베딩을 활용하여 개선된 유사도 기반 대화 모델링을 제안한다. 개선된 유사도 기반 대화 모델링은 MRR 성능 약 92%의 성능을 나타낸다.

  • PDF

A Similarity-based Dialogue Modeling with Case Frame and Word Embedding (격틀과 워드 임베딩을 활용한 유사도 기반 대화 모델링)

  • Lee, Hokyung;Bae, Kyoungman;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.220-225
    • /
    • 2016
  • 본 논문에서는 격틀과 워드 임베딩을 활용한 유사도 기반 대화 모델링을 제안한다. 기존의 유사도 기반 대화 모델링 방법은 형태소, 형태소 표지, 개체명, 토픽 자질, 핵심단어 등을 대화 말뭉치에서 추출하여 BOW(Bag Of Words) 자질로 사용하였기 때문에 입력된 사용자 발화에 포함된 단어들의 주어, 목적어와 같은 문장성분들의 위치적 역할을 반영할 수 가 없다. 또한, 의미적으로 유사하지만 다른 형태소를 가지는 문장 성분들의 경우 유사도 계산에 반영되지 않는 형태소 불일치 문제가 존재한다. 이러한 문제점을 해결하기 위해서, 위치적 정보를 반영하기 위한 문장성분 기반의 격틀과 형태소 불일치 문제를 해결하기 위한 워드임베딩을 활용하여 개선된 유사도 기반 대화 모델링을 제안한다. 개선된 유사도 기반 대화 모델링은 MRR 성능 약 92%의 성능을 나타낸다.

  • PDF

A Study of Development on technique for document & image unite (웹 기반 영상과 문서의 자동결합기법에 관한 연구)

  • Na, Jong-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.187-190
    • /
    • 2006
  • 텍스트위주의 자료와 영상회의 자료를 결합하여 통합하고 이를 웹을 통해 서비스 하도록 구현하였다. 멀티미디어 회의정보 등록시 사용자는 DAM실행 파일을 자신의 PC에서 실행하고 프로그램에 내장된 윈도우 탐색기를 통해 등록하고자 하는 회의파일을 선택하면 XML 자동 피싱모듈이 실행되면서 자료 저장을 위한 핵심정보와 검색을 위한 단어색인 및 인덱스를 수행하여 오류시에는 에러메세지를 보여주고 성공시에는 분석된 핵심정보를 제공해준다. 서버로 전송된 멀티미디어 회의자료는 종류/시간/등으로 구분되어 윈도우 탐색기 형태의 트리구조와 사용자가 직접 단어를 입력하여 원하는 회의 정보를 검색하는 2가지 형태의 검색서비스를 제공하게 된다. 사용자는 본인의 서비스 환경에 따라 영상+문서, 문서 등을 자유롭게 선택하여 볼 수 있다. DAM의 경제적인 효과에 대하여 정확한 통계 자료가 국내에 아직 발표되지 않아 유사분야인 WCM시장 분석을 근거로 예상하였으며 시스템이 다양하고 복잡해질수록 투자대비 경제적인 효과가 높아 동기화 기술분야 시장이 확대될 것으로 기대된다.

  • PDF

도서관탐방 - LG상남도서관을 다녀와서

  • Park, Gyeong-A
    • KLA journal
    • /
    • v.45 no.12 s.355
    • /
    • pp.58-60
    • /
    • 2004
  • '도서관문화' 1994년에는 1년 치를 통틀어 보아도 이 단어는 없었다. 그러나 2004년 현재는 1쪽에만도 수 십 개가 보인다. 그 단어는 바로 '디지털'이다. 바로 그 디지털 붐이 일기 시작하던 당시 LG상남도서관은 국내 최초의 디지털도서관으로 이용자뿐만 아니라 국내 도서관계의 주목을 받았다. 그러나 LG상남도서관의 핵심서비스인 원문전송은 2000년 저작권법 개정으로 중단되었다. 그렇다면 그 이후 도서관은 어떤 방식으로 운영되고 있을까, 그 궁금증을 풀기 위해 이번 달에는 LG상남도서관을 찾아가 보았다.

  • PDF

Multimodal interface for Korean inputs using speech and keypad (음성/키 패드를 이용한 한글 단어 입력용 멀티모달 인터페이스)

  • Kim, Won-Woo;Jeon, Ho-Hyun;Park, Sung-Chan
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.417-422
    • /
    • 2007
  • 멀티모달 인터페이스(multimodal interface)는 사람과 기계 사이의 통신을 위해 여러 가지 수단을 사용함을 말한다. 본 고에서는 휴대폰 키 패드를 통한 문자 입력과 마이크를 통한 음성 인식의 두 가지 모드를 함께 사용하여 단어를 입력하는 새로운 인터페이스 방법을 제시함으로써 미래지향적 휴먼 인터페이스의 핵심으로 인지되고 있는 음성인식의 한계, 특히 한국어 인식의 문제점을 해결하고자 한다.

  • PDF

Electric Power_Power Interview - 한국중부발전(주) 보령화력본부 김관행 본부장

  • 대한전기협회
    • JOURNAL OF ELECTRICAL WORLD
    • /
    • s.429
    • /
    • pp.90-93
    • /
    • 2012
  • 지난 8월 22일, 보령화력본부 접견실. 김관행 본부장과의 인터뷰 내내 '안전' 이란 단어가 맴 돌았다. 1호기 화재사고로 인해 뼈에 각인된 아픔을 되풀이 하지 않겠다는 결연한 의지의 표출이리라. 또 하나 화두처럼 인용된 단어가 '기본'. 미래성장 동력 창출 등 발전지향적인 사고와 실천이 시기적으로 필요하지만, '근본'을 더욱 중요시하고 이를 우선시하겠다는 것이 김 본부장의 확고한 방침이다. 핵심 퍼즐조각처럼 줄곧 인용되던 안전, 기본이란 반복어들은 인터뷰 말미 '전화위복', '안정적인 전력공급', '도약' 이란 큐빅으로 조합되면서 인터뷰는 마무리됐다.

  • PDF

Design and Implementation of Keywords Extraction System from CQI Reports by the Analysis of Graph Centrality (그래프 중심성 분석에 의한 CQI 보고서 핵심어 추출 시스템의 설계 및 개발)

  • Pheaktra, They;Lim, JongBeom;Lee, JongHyuk;Gil, Joon-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.256-259
    • /
    • 2019
  • 최근 대학교는 CQI(Continuous Quality Improvement) 등의 방대한 교육 관련 데이터를 수집하고 있고 이를 분석하여 교육 및 경영에 활용하고 있다. 핵심어는 텍스트의 내용을 간결하게 표현할 수 있는 단어이다. 그래서 CQI 보고서의 의미를 파악하기 위해서는 먼저 핵심어 추출이 필요하다. CQI 보고서에서 핵심어를 추출하면 이후 정보 검색, 인덱싱, 분류, 클러스터링, 필터링 등과 같은 많은 응용 작업을 용이하게 수행할 수 있다. 따라서 방대한 양의 CQI 보고서로부터 핵심어 추출을 자동화한다면 이후 요약 및 의미 파악에 많은 도움이 될 것이다. 이 논문에서는 CQI 보고서 요약을 위해 자동적으로 핵심어를 추출하는 방법을 제안한다.

Correlation Analysis of the Arirangs Based on the Informatics Algorithms (정보 알고리즘 기반 아리랑의 계통도 및 상관관계 분석)

  • Kim, Hak Yong
    • The Journal of the Korea Contents Association
    • /
    • v.14 no.4
    • /
    • pp.407-417
    • /
    • 2014
  • An arirang is the most famous Korean folk song and was registered in UNESCO(Unitied Nations Educational, Scientific and cultural Organization) as an intangible cultural heritage in 2012. Most arirangs are composed of text and refrain parts. Genealogy of the arirang was classified in refrain patterns by using multiple sequence alignment algorithm. There are two different refrain patterns, slow and fast melodies. Of 106 arirangs, 38 and 68 arirangs contain fast and slow melodies, respectively. 73 arirangs and 104 their key words were extracted from bipartate arirang network that composed of arirangs, text works, and their relationships. The correlation among the arirangs was analyzed from the selected arirangs and key words by using pairwise comparison matrix. Also, analysis of correlation among the arirnags was performed by stepwise removal of the single degree nodes from the bipartate arirang network In this study, arirangs were analyzed in genealogy and correlation among arirangs by using informatic algorithm and network technology, in which arirang research will be constructed a stepping stone for the popularization and globalization of the arirangs.

Design of Multi-Purpose Preprocessor for Keyword Spotting and Continuous Language Support in Korean (한국어 핵심어 추출 및 연속 음성 인식을 위한 다목적 전처리 프로세서 설계)

  • Kim, Dong-Heon;Lee, Sang-Joon
    • Journal of Digital Convergence
    • /
    • v.11 no.1
    • /
    • pp.225-236
    • /
    • 2013
  • The voice recognition has been made continuously. Now, this technology could support even natural language beyond recognition of isolated words. Interests for the voice recognition was boosting after the Siri, I-phone based voice recognition software, was presented in 2010. There are some occasions implemented voice enabled services using Korean voice recognition softwares, but their accuracy isn't accurate enough, because of background noise and lack of control on voice related features. In this paper, we propose a sort of multi-purpose preprocessor to improve this situation. This supports Keyword spotting in the continuous speech in addition to noise filtering function. This should be independent of any voice recognition software and it can extend its functionality to support continuous speech by additionally identifying the pre-predicate and the post-predicate in relative to the spotted keyword. We get validation about noise filter effectiveness, keyword recognition rate, continuous speech recognition rate by experiments.

Keyword and Network Analysis of University Core Competency Studies (대학 핵심역량 관련 연구들의 주요 키워드와 네트워크 분석)

  • Kwon, Choong-Hoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.133-134
    • /
    • 2021
  • 본 연구는 최근 고등학교기관(대학)의 평가에서 가장 중심 단어가 되고 있는 있는 '핵심역량' 관련 최근 연구들의 주요 키워드들과 그들간의 네트워크를 분석하고자 한다. 본 연구에서는 2011년부터 2020년까지(최근 10년간)의 '대학 핵심역량' 관련 등재지(등재 후보지 포함)에 발표된 총 176건의 관련 연구물들을 언어 네트워크 분석 방법론을 활용하여, 주요 키워드 추출 및 워드클라우드 제시, 주요 핵심어들 간의 관계성(의미망 네트워크) 분석 등을 진행하고자 한다. 이와 같은 연구 결과는 관련 학자들이 연구를 진행할 때, 대학 관계자가 학교단위 교육활동 계획 기획 및 평가활동을 할 때 매우 중요한 기초 자료로 활용될 것으로 기대된다.

  • PDF