• Title/Summary/Keyword: 사전

Search Result 11,885, Processing Time 0.049 seconds

A comparative study on the South and North Korean dictionaries (남북한 통합 국어 사전 구축을 위한 비교 연구)

  • 백지원
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2000.08a
    • /
    • pp.15-18
    • /
    • 2000
  • 남한의 $\boxDr$표준국어대사전$\boxUl$과 북한의 $\boxDr$조선말대사전$\boxUl$을 대상으로 현행 남북한 국어 사전의 통합 유형 및 통합시의 문제점을 분석하여 남북한 통합 국어 사전 구축을 위한 기초 자료를 제공하고자 하였다.

  • PDF

출판사 탐방-사전의 명가 민중서림

  • Kim, Jeong-Sang
    • 프린팅코리아
    • /
    • s.45
    • /
    • pp.112-115
    • /
    • 2006
  • '엣센스 사전'으로 유명한 민중서림은 우리나라 어학 사전계를 대표하는 출판사이다. 오랫동안 최고의 사전을 만들기 위해 노력해 온 민중서림은 지난해 말 한국경제신문이 주최한 한국교육브랜드 대상 시상식에서 엣센스 사전으로 브랜드대상을 수상했다. 언어와 언어사이의 미묘한 차이를 발견하는데 노력해 온 현시대의 찬사라고 할 수 있다.

  • PDF

Generating a Korean Sentiment Lexicon Through Sentiment Score Propagation (감정점수의 전파를 통한 한국어 감정사전 생성)

  • Park, Ho-Min;Kim, Chang-Hyun;Kim, Jae-Hoon
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.9 no.2
    • /
    • pp.53-60
    • /
    • 2020
  • Sentiment analysis is the automated process of understanding attitudes and opinions about a given topic from written or spoken text. One of the sentiment analysis approaches is a dictionary-based approach, in which a sentiment dictionary plays an much important role. In this paper, we propose a method to automatically generate Korean sentiment lexicon from the well-known English sentiment lexicon called VADER (Valence Aware Dictionary and sEntiment Reasoner). The proposed method consists of three steps. The first step is to build a Korean-English bilingual lexicon using a Korean-English parallel corpus. The bilingual lexicon is a set of pairs between VADER sentiment words and Korean morphemes as candidates of Korean sentiment words. The second step is to construct a bilingual words graph using the bilingual lexicon. The third step is to run the label propagation algorithm throughout the bilingual graph. Finally a new Korean sentiment lexicon is generated by repeatedly applying the propagation algorithm until the values of all vertices converge. Empirically, the dictionary-based sentiment classifier using the Korean sentiment lexicon outperforms machine learning-based approaches on the KMU sentiment corpus and the Naver sentiment corpus. In the future, we will apply the proposed approach to generate multilingual sentiment lexica.

A Study on the Flood Limited Level in Agricultural Reservoir Flood Season according to pre-release conditions (사전방류조건에 따른 농업용저수지 홍수기 제한수위 설정에 관한 연구)

  • Yang, Jun Seok;Park, Ki Bum;Ahn, Seung Seop
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.302-302
    • /
    • 2022
  • 최근 태풍, 집중호우로 인한 홍수피해가 빈번히 발생함하고 있다. 특히 상류에 저수지가 있을 경우 홍수조절을 통해 하류지역의 홍수피해를 저감하기도 하지만 급작스런 방류량의 증가 등으로 인해 하류지역의 피해가 증가되는 경우도 있다. 따라서 하류지역 홍수피해 저감을 위해 저수지의 홍수관리기능에 대한 관심도가 높아지고 있다. 대규모 다목적댐의 경우 다양한 저수지운영룰을 통해 수문을 운영하고 있어 홍수조절기능을 충분히 수행하고 있지만, 농업용저수지는 홍수관리에 있어 수문조작 전문성의 부족과 운영룰의 미정립 등으로 인해 취약성을 가지고 있는 상황이다. 본 연구에서는 수문이 설치된 1백만m3이상의 저수지 중 성주저수지를 연구대상저수지로 선정하였다. 비상수문을 통한 사전방류방안과, 저수지운영을 연구하여 농업용저수지의 홍수조절용량 확보를 위한 사전방류방안에 대해 연구하였다. 저수지운영은 Auto ROM을 적용하였고 홍수조절용량 확보를 위하여 홍수기 수위관리기법 중 사전방류기법을 채택하였다. 사전방류기법은 모의기법에 의한 사전방류와 최적화기법에 의한 최적사전방류량을 결정하는 방법으로 연구하였다. 홍수기의 제한수위는 유효저수량의 70%인 EL.179.7m, 65%인 EL.178.8m, 60%인 EL.177.8m로 설정하여 분석하였다. 모의기법에 의한 사전방류방법은 초기수위는 만수위에서부터 1.0m씩 감소하였고, 비상수문은 0.5m씩 개방하여 4.0m까지 개방 하였다. 사전방류의 시간은 24hrs, 48hrs를 적용하였다. 최적화기법에 의한 사전방류방법은 초기수위는 모의기법과 동일하고 목표수위를 제한수위(70%, 65%, 60%)가 되는 최적방류량을 산정하고 최적방류량을 방류할 수 있는 수문의 개방높이를 분석하였다. 2012년, 2020년의 호우사상에 대해 사전방류가 없는 경우와 모의기법, 최적화기법에 의한 사전방류결과를 적용한 경우를 비교하여 검토하였다. 그 결과 제한수위 70%를 유지할 경우 2012년은 모의기법이 5.6%, 최적화기법이 5.4%의 방류량 감소효과가 있으며 2020년은 모의기법이 9.0%, 최적화기법이 8.8%의 방류량 감소효과가 있는 것으로 검토되었다.

  • PDF

An Evaluative Study on Major Korean Encyclopedias (우리나라의 현행 백과사전에 관한 평가적 연구)

  • 김문영
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1998.08a
    • /
    • pp.47-50
    • /
    • 1998
  • 본 연구는 최근 발행 종 수 및 부수가 급격히 증가하고 있고, 그 형태 면에서도 인쇄본, CD-ROM, 온라인, 인터넷 백과사전 등으로 다양화되고 있는 백과사전을 평가하기 위한 기준을 설정하고, 이 기준에 근거하여 현재 국내에서 유통되고 있는 백과사전을 실증적으로 평가, 분석하는데 목적을 두고 있다. 이 연구를 통해 일반 독자나 도서관에서의 백과사전 선택을 위한 실제적인 지침을 마련함과 동시에, 궁극적으로는 백과사전의 편집과 출판을 위한 새로운 기준을 제시하게 될 것이다.

  • PDF

한국어 사전과 동족보어 구문

  • 홍재성
    • Annual Conference on Human and Language Technology
    • /
    • 1990.11a
    • /
    • pp.89-94
    • /
    • 1990
  • 본 발표는 현대 한국어 어휘에 대한 공시적 시각 우위의 총체적 기술을 지향하는 대규모 언어사전의 동사항목 기술에서 고려되어야 할 통사.어휘 정보의 한 가지로 동족보어 구문의 문제를 다룬다. 한국어 동족보이 구문의 언어학적 분석을 바탕으로, (ㄱ) 기간 한국어 사전에서의 처리 현황을 검토하고; (ㄴ) 사전적 정보로서의 동족보어 구문의 속성을 좀 더 따져보며; (ㄷ) 동족보이 구문의 통사. 어휘 속성을 사전에 체계적으로 기록해야할 근거나, 이와 관련된 구체적 사전 기술의 방안을 제시해 본다.

  • PDF

Desambiguation Method based on a Lexicon of Typographical Units (`어절 정보 사전`을 이용한 형태소 분석의 중의성 (Ambiguity) 해결)

  • Nam, Jee-Sun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.75-82
    • /
    • 1997
  • 이글은 한국어 형태소 분석시 발생하는 중의성의 유형에 대해서 논의하고, 그와 같은 여러 유형의 중의성의 발생율을 감소시키기 위한 방법으로써 '어절 정보 사전 시스템'의 구축을 강조하였다. 한국어 문서에 대한 형태소 분석시 발생하는 중의성은, 영어나 유럽어와는 달리, 어휘 형성 정보 뿐아니라 어절 형성 정보, 구문 구조에 관한 부분적인 정보까지도 제공되어야 비로소 해소될 수 있는 경우가 많아 이와 같은 정보를 얻어내기 위해서는 체계적으로 고안된 범용의 사전 (Lexicon)이 필요하다. 여기에서는 접사가 동반되어 구성될 수 있는 '파생 명사(Affixed Noun)'들의 경우에 논의의 범위를 제한하였다. 실제로, 체계적으로 구성된 하나의 파생어 사전은. 주어진 어절에 대한 형태소 분절시 발생할 수 있는 엄청난 수의 중의적 가능성을 해소해 줄 수 있는데. 이와 같은 사전을 구축하기 위해서는 단순어와 접사 사전이 모듈화되어 완성되어야 한다. 같은 방법으로 모든 합성어 유형에 대한 사전이 구축되고, 그러한 기본 형태들에 대한 '변화형' 사전이 결합되면 어절 정보를 갖춘 대용량의 한국어 MRD의 구현이 가능해질 것이다.

  • PDF

Automatic Generation of Domain-Dependent Pronunciation Lexicon with Data-Driven Rules and Rule Adaptation (학습을 통한 발음 변이 규칙 유도 및 적응을 이용한 영역 의존 발음 사전 자동 생성)

  • Jeon, Je-Hun;Chung, Min-Hwa
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2005.05a
    • /
    • pp.233-238
    • /
    • 2005
  • 본 논문에서는 학습을 이용한 발음 변이 모델링을 통해 특정 영역에 최적화된 발음 사전 자동 생성의 방법을 제시하였다. 학습 방법을 이용한 발음 변이 모델링의 오류를 최소화 하기 위하여 본 논문에서는 발음 변이 규칙의 적응 기법을 도입하였다. 발음 변이 규칙의 적응은 대용량 음성 말뭉치에서 발음 변이 규칙을 유도한 후, 상대적으로 작은 용량의 음성 말뭉치에서 유도한 규칙과의 결합을 통해 이루어 진다. 본 논문에서 사용된 발음 사전은 해당 형태소의 앞 뒤 음소 문맥의 음운 현상을 반영한 발음 사전이며, 학습 방법으로 얻어진 발음 변이 규칙을 대용량 문자 말뭉치에 적용하여 해당 형태소의 발음을 자동 생성하였다. 발음 사전의 평균 발음의 수는 적용된 발음 변이 규칙의 확률 값들의 한계 값 조정에 의해 이루어졌다. 기존의 지식 기반의 발음 사전과 비교 할 때, 본 방법론으로 작성된 발음 사전을 이용한 대화체 음성 인식 실험에서 0.8%의 단어 오류율(WER)이 감소하였다. 또한 사전에 포함된 형태소의 평균 발음 변이 수에서도 기존의 방법론에서 보다 5.6% 적은 수에서 최상의 성능을 보였다.

  • PDF

A Study on the Multiple Pronunciation Dictionary for Spontaneous Speech Recognition (대화체 연속음성인식을 위한 확장 다중발음 사전에 관한 연구)

  • Kang ByungOk
    • Proceedings of the KSPS conference
    • /
    • 2003.10a
    • /
    • pp.65-68
    • /
    • 2003
  • 본 논문에서는 대화체 연속음성인식 과정에서 사용되는 다중발음사전의 개념을 확장하여 대화체 발화에 빈번하게 나타나는 불규칙한 발음변이 현상을 포용하도록 한 확장된 발음사전의 방법을 적용하여 대화체 연속음성인식에서 인식성능의 향상을 가져오게 됨을 실험을 통해 보여준다. 대화체 음성에서 빈번하게 나타나는 음운축약 및 음운탈락, 전형적인 오발화, 양성음의 음성음화 등의 발음변이는 언어모델의 효율성을 떨어뜨리고 어휘 수를 증가시켜 음성인식의 성능을 저하시키고, 또한 음성인식 결과로 나타나는 출력형태가 정형화되지 못하는 단점을 가지고 있다. 이에 이러한 발음변이들을 발음사전에 수용할 때 각각의 대표어휘에 대한 변이발음으로 처리하고, 언어모델과 어휘사전은 대표어휘만을 이용해 구성하도록 한다. 그리고, 음성인식기의 탐색부에서는 각각의 변이발음의 발음열도 탐색하되 대표어휘로 언어모델을 참조하도록 하고, 인식결과를 출력하도록 하여 결과적으로 인식성능을 향상시키고, 정형화된 출력패턴을 얻도록 한다. 본 연구에서는 어절단위 뿐 아니라 의사형태소[2] 단위의 발음사전에도 발음변이를 포용하도록 하여 실험을 하였다. 실험을 통해 어절단위의 다중발음사전 구성을 통해 ERR 10.9%, 의사형태소 단위의 다중발음 사전의 구성을 통해 ERR 4.3%의 성능향상을 보였다.

  • PDF