• 제목/요약/키워드: 사전이도

Search Result 6,740, Processing Time 0.035 seconds

Performance of Predistorters for OEDM Systems with a Raised Cosine Transmit Filter and a High Power Amplifier (Raised Cosine 송신 필터와 고출력 증폭기를 사용하는 OFDM 시스템을 위한 사전왜곡기의 성능)

  • 남충진;신요안
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.601-604
    • /
    • 2001
  • 본 논문에서는 고출력 증폭기와 송신 펄스 성형 필터로서 Raised Cosine filter (RCF)를 사용하는 OFDM 시스템에서 비선형 왜곡 보상을 위한 고정점 반복 사전왜곡기를 제안하고 이의 성능을 검증하였다. 제안된 사전왜곡기는 RCF 전단에 위치하나 이의 Zero-Intersymbol Interference 성질을 이용하여 단지 고출력 증폭기에 의한 기억성이 없는 비선형 왜곡만을 보상하는 효율적인 구조이다. 또한 성능 검증을 위해 필터 전단에 위치하는 사전왜곡기와 증폭기 전단에 위치하여 증폭기의 비선형 왜곡만을 보상하는 사전왜곡기를 비교하여, 필터에서 ISI를 제거한 경우에는 사전왜곡기의 위치에 관계없이 비선형 왜곡을 효과적으로 보상할 수 있다는 점을 모의실험을 통해 확인하였다.

  • PDF

A Study on the Microstructure of Terminological Dictionaries (전문용어사전의 미시구조에 관한 연구)

  • 김성진;정동열
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.35 no.1
    • /
    • pp.143-162
    • /
    • 2001
  • As technical intellectual work now has become prolific and various, rapid evolution of technical terms needs to collect and manage them systematically and efficiently. The purpose of this study is to suggest the microstructure for systematic definitions of definiendum in terminological dictionaries. This study reveals specific properties or differences of terminography on the basis of terminology and lexicography, analyzes problems of microstructure in a current terminological dictionary, and, based upon the theoretical and practical analysis, attempts to derive structural and methodical suggestions for microstructure of terminological dictionaries.

  • PDF

말뭉치에 근거한 한국어 사전 표제어 구성

  • Park, Yeong-Hwan;Yun, Jun-Tae;Song, Man-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.58-65
    • /
    • 1991
  • 사전은 자연어를 처리하는 핵심 부분을 이루고 있다. 그러나 기존의 한국어 사전은 기계적인 처리에 직접 이용하기에는 크게 미흡하다. 특히, 사전의 기본을 이루는 표제어 수록에 관한 연구는 더욱 취약한 형편이다. 본 연구는 새로운 한국어 사전의 표제어률 구성하기 위하여 대형 말뭉치를 수집하였다. 이 말뭉치를 이용하여 기존 사전에서 빠져있는 미등록어들을 찾아내어 수록하고, 말뭉치에 나타난 각 단어의 출현 빈도를 조사하였다. 이 연구를 수행하기 위하여 형태소 분석기, 용례 분석기 등의 필수적인 텍스트 처리 도구들을 개발하였다. 또한, 말뭉치에 나타난 어절 단위의 오류 분포를 조사하여 밝히었다.

  • PDF

Construction of Partial Word Morpheme Dictionary based on Tagged Corpus and Korean Morphological Analysis (말뭉치 기반 부분 어절 기분석 사전의 구축과 형태소 분석)

  • Shin, Joon-Choul;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.67-72
    • /
    • 2011
  • 기존의 말뭉치 기반 한국어 형태소 분석 방법은 대용량의 어절 기분석 사전을 사용하여 분석하고, 그 사전에 없는 어절은 코드 변환, 형태소 분리, 원형 복원 규칙 적용 등을 거치는 복잡한 분석 방법을 통해 후보들을 생성했다. 이 복잡한 분석 방법은 제작과 유지보수, 실행 관점 모두에서 효율적이지 못하며 정확률을 낮추고 속도를 느리게 하는 요인이 된다. 이런 문제를 해결하기 위해 부분 어절의 기분석 사전을 구축하여 사용하는 방법이 연구되었다. 본 논문에서는 대용량의 분석 말뭉치를 통해 부분 어절의 기분석 사전을 구축하고 형태소 분석에 사용하는 방법을 제안한다. 세종 말뭉치로 실험한 결과 재현율이 99.05%였으며, 품사 및 동형이의어 태깅 정확률은 96.76%였다.

  • PDF

DDAG: An Efficient Method for Morphological Analysis of Korean (DDAG: 효율적인 한국어 형태소 해석 방법)

  • Kim, Deok-Bong;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.341-353
    • /
    • 1993
  • 기존의 한국어 형태소 해석 시스템들은 철자 변화형 어절에 대한 처리가 매우 효율적이지 못했다. 대개가 문제를 일으키는 형태소들의 변형들을 모두 사전에 등록하여 후처리 형태로 다루려 하거나, 각 형태/음운 규칙을 적용한 다음 거기에 대응하는 후보 단어들을 사전 검색을 통해 확인하는 방법들을 취하고 있다. 그러나 이러한 방법들은 과다한 사전 정보의 중복이나 계산의 중복으로 인하여 비효율적인 면을 많이 내포한다. 또한, 기존의 한국어 형태소 시스템들은 거의 모두가 형태소해석 엔진과 언어학적인 지식(특히, 철자 규칙과 형태소 배열 규칙)이 제대로 분리되지 않아 시스템 확장이 매우 어려웠다. 이 논문에서는, 철자 변화형 어절을 후처리에 의하지 않고, 사전 검색과 함께 하나의 오토마타에 의해 처리하면서, 형태소 해석시 발생하는 중복 계산을 최대한 배경하고, 또한 형태소 해석 엔진과 언어학적인 지식을 완전히 분리하여 시스템의 확장성을 한층 높인, 효율적인 한국어 형태소 해석 시스템 DDAG를 소개한다. 이 시스템의 주요 알고리즘의 계산적인 복잡도는 n이 입력 어절의 길이이고, m이 입력 어절을 이루고 있는 형태소의 최대 수라고 할 때 다음과 같이 분석된다: (1) 철자 변화의 처리와 사전 검색 부분의 계산적인 복잡도는 $O(n^2)$이고, (2) 형태소 배열 검사와 모든 가능한 결과를 출력해 내는 부분은 $O(2^m)$이다. 여기에서 m의 실질적인 값은 복잡한 한국어 용언의 경우 최대 8이다.

  • PDF

Properties and Quantitative Analysis of Bias in Korean Language Models: A Comparison with English Language Models and Improvement Suggestions (한국어 언어모델의 속성 및 정량적 편향 분석: 영어 언어모델과의 비교 및 개선 제안)

  • Jaemin Kim;Dong-Kyu Chae
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.558-562
    • /
    • 2023
  • 최근 ChatGPT의 등장으로 텍스트 생성 모델에 대한 관심이 높아지면서, 텍스트 생성 태스크의 성능평가를 위한 지표에 대한 연구가 활발히 이뤄지고 있다. 전통적인 단어 빈도수 기반의 성능 지표는 의미적인 유사도를 고려하지 못하기 때문에, 사전학습 언어모델을 활용한 지표인 BERTScore를 주로 활용해왔다. 하지만 이러한 방법은 사전학습 언어모델이 학습한 데이터에 존재하는 편향으로 인해 공정성에 대한 문제가 우려된다. 이에 따라 한국어 사전학습 언어모델의 편향에 대한 분석 연구가 필요한데, 기존의 한국어 사전학습 언어모델의 편향 분석 연구들은 사회에서 생성되는 다양한 속성 별 편향을 고려하지 못했다는 한계가 있다. 또한 서로 다른 언어를 기반으로 하는 사전학습 언어모델들의 속성 별 편향을 비교 분석하는 연구 또한 미비하였다. 이에 따라 본 논문에서는 한국어 사전학습 언어모델의 속성 별 편향을 비교 분석하며, 영어 사전학습 언어모델이 갖고 있는 속성 별 편향과 비교 분석하였고, 비교 가능한 데이터셋을 구축하였다. 더불어 한국어 사전학습 언어모델의 종류 및 크기 별 편향 분석을 통해 적합한 모델을 선택할 수 있도록 가이드를 제시한다.

  • PDF

Automatic Extraction and Usage of Terminology Dictionary Based on Definitional Sentences Patterns in Technical Documents (기술문서 정의문 패턴을 이용한 전문용어사전 자동추출 및 활용방안)

  • Han, Hui-Jeong;Kim, Tae-Young;Doo, Hyo-Chul;Oh, Hyo-Jung
    • Journal of the Korean Society for information Management
    • /
    • v.34 no.4
    • /
    • pp.81-99
    • /
    • 2017
  • Technical documents are important research outputs generated by knowledge and information society. In order to properly use the technical documents properly, it is necessary to utilize advanced information processing techniques, such as summarization and information extraction. In this paper, to extract core information, we automatically extracted the terminologies and their definition based on definitional sentences patterns and the structure of technical documents. Based on this, we proposed the system to build a specialized terminology dictionary. And further we suggested the personalized services so that users can utilize the terminology dictionary in various ways as an knowledge memory. The results of this study will allow users to find up-to-date information faster and easier. In addition, providing a personalized terminology dictionary to users can maximize the value, usability, and retrieval efficiency of the dictionary.

The XML-based Web Dictionary Framework (XML 기반 웹 사전 프레임워크)

  • You, Eung-Gu;Koo, Ja-Ryong;Kim, Go-Woon;Lee, Keum-Suk;Kim, Byung-Gu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1025-1028
    • /
    • 2002
  • 인터넷이 널리 사용되면서 인터넷 사용자들의 웹 사전 사용 빈도가 크게 증가하였다. 현재 다양한 형태의 웹 사전들이 다양한 서비스를 제공하고 있지만, 대부분의 웹 사전들은 검색엔진 형태의 단순질의 검색과 인덱스를 이용한 검색 기능을 제공하고, 고정된 표현 형식만을 제공한다. 또한 사전내용, 인덱스, 참조 및 관련 사이트 정보를 관리하기 위한 도구의 부재로 관리가 어렵고, 저장형식으로 HTML 을 사용하기 때문에 사전 데이터의 재사용에 문제가 있다. 따라서 본 논문에서는 기존의 웹 사전들을 사용자-관리자 측면에서 분석하여 문제점을 제시하고, 이를 해결할 수 있도록 카테고리 검색 및 히스토리 검색 서비스를 지원하고, 데이터를 XML 문서로 저장하며, 전용의 사전 관리 도구를 제공하는 XML 기반 웹 사전 프레임워크를 제안하고 구현하였다.

  • PDF

A thesaurus development system with an embedded graphic editor (Graph Editor형식의 통합정보사전 개발 시스템)

  • Nam, Dong-Su;Choi, Yong-Jun;Hwang, Do-Sam
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.341-344
    • /
    • 2000
  • 통합정보사전은 고도의 언어처리 및 이해를 목적으로 한 것이며, 체계적이고 과학적인 방법론을 이용하여 형태소, 구문, 의미정보 등 각종 정보가 통합된 전자사전으로, 이를 개발하는데는 막대한 개발시간과 노력을 필요로 한다. 이러한 특성 때문에 통합정보사전을 구축하기 위해서는 정보를 통합하고 관리하는 사전개발 시스템의 개발이 선행되어야 한다. 현재까지의 사전개발 시스템은 사전 항목을 정의하고, 정의된 항목에 표제어별 정보를 입력하는 시스템으로, 단순한 정렬 및 검색에 의한 표제어 찾기 및 편집을 지원하고 있다. 본 논문에서는 사전의 계층화된 항목정보를 트리 형식으로 나타내어 사전의 개발 및 구축작업을 효율적으로 지원하기 위한 통합정보사전 개발 시스템인 YDK3를 설계하고 구현하였다. 구현한 YDK3는 기존의 각종 사전의 다양한 사전정보를 입력하는 기본적인 기능 외에, 항목정보를 기반으로 한 graph editor형식의 사용자 인터페이스가 제공되어, 사전의 개발, 자료입력 및 검색을 보다 쉽게 할 수 있다는 특징이 있다.

  • PDF