• 제목/요약/키워드: 변환사전

검색결과 348건 처리시간 0.037초

부분 어절의 기분석에 기반한 고속 한국어 형태소 분석 방법 (A High-Speed Korean Morphological Analysis Method based on Pre-Analyzed Partial Words)

  • 양승현;김영섬
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권3호
    • /
    • pp.290-301
    • /
    • 2000
  • 일반적으로 형태소 분석 방법은 실행시에 매 어절마다 코드 변환, 형태소 분리, 원형 복원 규칙 적용을 통한 분석 후보 생성, 사전 탐색을 통한 분석 후보의 여과 등의 절차를 거쳐 형태소 분석을 수행하기 때문에 실행 효율의 관점에서 효율적이지 못하다. 이러한 문제점을 완화시키기 위해 도입된 어절단위 기분석 사전에 의한 분석은 실행시 처리에 소요되는 계산 부하를 크게 줄일 수는 있지만 어절의 수가 사실상 무한하므로 사전의 크기 문제 때문에 완전한 처리 방법이 될 수 없다는 단점이 있다. 본 논문에서는 이상과 같은 문제점을 해결하기 위해 두가지 대비되는 방법론을 결합하여 부분 어절별로 기분석 결과를 구축하여 형태소를 분석하는 방법에 대해 기술하고 있다. 이 방법에 의하면, 형태소 분리, 원형 복원 등 형태소 분석에 필요한 계산의 대부분을 실행시에 행하지 않고 기분석 결과의 구축 시에 행함으로써 실행시 계산 부하를 크게 줄일 수 있고 불필요한 중간 결과가 생성되지 않아 사전 탐색 횟수가 크게 절감되는 효과가 있으므로, 실행 효율을 크게 개선할 수 있다. 아울러 음소별 연산을 하지 않으므로 코드 변환 등에 소요되는 계산량도 전혀 필요치 않다는 특징도 있다.

  • PDF

위상복원문제

  • 김우식
    • 정보와 통신
    • /
    • 제10권5호
    • /
    • pp.53-70
    • /
    • 1993
  • 위상 복원 문제는 어떤 신호의 푸리에 변환의 크기로부터 푸리에 위상, 또는 그 신호 자체를 구하는 문제로서 신호처리, 천문학, X-선 결정학, 전자현미경학, 광학, synthetic aperture radar 등과 같은 많은 물리학의 분야에서 일어난다. 일반적으로, 이 위상 복원 문제는 유일한 해를 갖지 않기 때문에, 이 문제를 풀기 위하여 사전 정보로 주어지는 원하는 신호의 성질을 제한조건으로 주어 이 문제가 유일한 해를 갖도록 한 뒤 이 원하는 신호를 구하는 방법을 사용해왔다. 이 논문에서는 위상 복원 문제를 소개하고, 이 문제의 중요성, 기본 이론 등을 알아보고, 지금까지 제안이 되었던 방법들을 분야별로 묶어 신호처리의 관점에서 소개한다. 먼저 수학적인 기초에 대하여 소개하고, 푸리에 변환의 크기를 보존하는 변환들에 대하여 알아본 뒤, 위상 복원 문제를 풀기 위하여 제안이 되었던 방법들을 1)하나의 푸리에 변환의 크기가 주어졌을 때의 위상 복원, 2)더해지는 기준 신호가 있을 때의 위상 복원, 3)곱해지는 신호(윈도우)를 이용한 위상 복원으로 나누어 소개한다.

  • PDF

XML과 관계형 데이터 모델간의 스키마 변환 방법에 관한 비교론적 고찰 (A Comparative Study on Schema Conversion Methods Between XML and Relational Data Models)

  • 허보진;김형석;김창석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1627-1630
    • /
    • 2003
  • XML이 인터넷상에서 비즈니스 데이터 교환과 저장의 표준으로 자리 잡아감에 파라 많은 데이터베이스 연구자들이 XML과 관계형 보델 간의 스키마 변환 방법에 관한 연구를 수행하게 되었다. 지금까지 두 모델간의 변환 방법이 국내외에서 발표되고 있으나 이들 연구들에 대한 비교 및 고찰에 대한 체계적인 연구가 부족하였다. 본 논문에서는 XML과 관계형 모델간의 스키마 변환 방법에 관한 국내외 연구들을 분류 정리하여 비교 고찰함으로서 향후 XML 스키마와 관계형 데이터베이스간의 데이터교환 및 저장에 관한 연구의 사전(事前) 연구가 되도록 하였다.

  • PDF

XML문서의 자동변환을 위한 스키마 매칭 알고리즘 (A Schema Matching Algorithm for an Automated Transformation of XML Documents)

  • 이준승;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1195-1207
    • /
    • 2004
  • 스키마 매칭은 XML문서의 자동 변환을 위한 전처리 과정으로서 필수적이다. 스키마 매칭에 관한 기존 연구는 의미적으로 대응 가능한 모든 매칭관계를 고려하기 때문에 다대다의 대응관계를 추출한다. 이에 명확한 매칭관계를 필요로하는 XML문서의 자동변환에는 적합하지 않다. 본 논문에서는 스키마 사이의 일대일 대응관계를 추출할 수 있는 효율적인 스키마 매칭 알고리즘을 제안한다. 제안된 알고리즘은 두 단계로 구성된다. 먼저 단발노드 사이의 언어적 유사도와 데이터타입 유사도를 이용하여 후보매칭을 계산한다. 계산된 후보매칭의 경로유사도 비교를 통해 일대일 매칭을 추출하게 된다. 특히 제안된 방법은 보다 정교한 수준의 스키마 매칭을 위하여 축약어 사전, 동의어 사전, 그리고 도메인 온탈로지에 기반한다. 제안된 알고리즘의 성능을 평가하기 위해서 전자상거래 분야에서 사용 중인 스키마를 대상으로 실험한 결과, 평균적으로 97%의 정확률을 보여 기존 연구보다 우수하였다.

  • PDF

LED 전광판의 메모리 효율을 위한 폰트 생성 기법 개발 (Development of Font Creation Technique for Memory Efficiency of LED Display)

  • 안효훈;박예찬;;염상길;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.683-684
    • /
    • 2017
  • 본 논문은 실내용 LED 전광판 시스템에서 문자 출력을 위한 완성형 폰트 기법을 개선하기 위해 비트맵 이미지 픽셀의 색상값을 이용하여 실시간으로 폰트를 생성하는 기법을 제안한다. 본 논문에서 제안한 기법은 출력을 위한 문자 폰트를 사전에 정의해 저장하지 않고 텍스트를 비트맵 이미지로 변환한 후 이진화 하여 각 픽셀의 색상값을 이용해 출력 폰트를 실시간으로 생성하도록 한다. 실시간 폰트 생성 기법은 사전에 정의된 문자와 입력된 데이터를 비교하기 위한 과정이 생략되어 메모리 낭비를 줄일 수 있다. 또한 제안된 기법은 사전에 정의되지 않은 다양한 형태의 문자를 입력받아 출력할 수 있기 때문에 문자 표현 방식이 다양해져 정보 전달 효과를 높인다.

XML 을 이용한 논문 참고문헌 자동 삽입 처리기의 설계 및 구현 (Design and Implementation of Auto Insert Processor For Reference of Paper using XML)

  • 김병규;강무영;박재원;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (3)
    • /
    • pp.283-285
    • /
    • 2003
  • 논문을 작성하기 위해서는 참고문헌을 달아주어야 하는 쉽지 않은 과정이 있다. 일반 사용자가 쉽게 작성하고 적은 노력으로 참고문헌을 삽입시켜줄 수 있는 처리기가 필요하다. 기존의 LATEX 시스템은 고정된 환경과 많은 제약사항으로 사용하기에 불편이 많았다. 본 논문에서는 XML의 구조적인 특성을 이용하여 참고문헌을 자동으로 삽입하는 새로운 어플리케이션을 제안한다. 이를 위해 논문과 참고문헌 사전에 대한 문서타입을 정의하였으며 참고문헌사전의 구조 정보를 검색, 삽입, 수정, 삭제 할 수 있는 사전 관리기를 설계하였다. 이를 바탕으로 참고문헌을 자동 삽입 처리된 논문 곧 XML문서는 논문 구조에 맞게 정의된 XSL을 통해 HTML로 변환되며 자유로운 웹 게시가 가능해진다.

  • PDF

한국어 백과사전에 등장하는 영대명사(Zero Pronoun)의 복원에 관한 전산학적 연구 (Computational Approach to Zero Pronoun Resolution in Korean Encyclopedia)

  • 신효식;강영수;최기선;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.239-243
    • /
    • 2001
  • 이 논문은 한국어 백과사전에 등장하는 질병에 대한 요약문 생성의 일환으로 내용을 비교하고 중복성을 제거하기 위해 논리표현으로의 변환과정에서 중요한 영대명사의 복원을 다룬다. 백과사전의적인 기술 특성상 자주 등장하는 영대명사의 복원을 위해 통사 의미적 혹은 담화적 언어지식에 의존하기보다는 질병에 관한 개념지도를 토대로 복원할 수 있다는 지식기반 방식을 제안한다.

  • PDF

어휘정보구축을 위한 사전텍스트의 구조분석 및 변환 (A Structural Analysis of Dictionary Text for the Construction of Lexical Data Base)

  • 최병진
    • 한국언어정보학회지:언어와정보
    • /
    • 제6권2호
    • /
    • pp.33-55
    • /
    • 2002
  • This research aims at transforming the definition tort of an English-English-Korean Dictionary (EEKD) which is encoded in EST files for the purpose of publishing into a structured format for Lexical Data Base (LDB). The construction of LDB is very time-consuming and expensive work. In order to save time and efforts in building new lexical information, the present study tries to extract useful linguistic information from an existing printed dictionary. In this paper, the process of extraction and structuring of lexical information from a printed dictionary (EEKD) as a lexical resource is described. The extracted information is represented in XML format, which can be transformed into another representation for different application requirements.

  • PDF

Jena 저장소 구조를 TRIPLES 구조로의 사상을 위한 뷰 생성 도구 개발 (A Development of View Generation Tool for Mapping the Jena Storage Structure to TRIPLES Structure)

  • 지종진;손지성;정동원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.411-416
    • /
    • 2009
  • 웹 온톨로지 언어의 개발에 따라 웹 온톨롤지를 저장하기 위한 다양한 저장소들이 개발되었으며 이러한 웹 저장소는 관계형 데이터베이스 모델을 기반으로 하고 있다. 또한 웹 온톨로지 데이터를 검색하기 위한 질의 언어로서 W3C에서 SPARQL을 제안하였다. 웹 온톨로지 저장소로서 관계형 데이터베이스가 활발히 개발되고 SPARQL의 이용이 증가함에 따라 SPARQL을 SQL로 변환 하는 알고리즘의 필요성이 대두되었다. 지금까지 제안된 변환 알고리즘들은 SPARQL-to-SQL 변환 알고리즘이 저장소 구조에 종속적이라는 문제점이 있다. 이를 해결하기 위하여 관계형 뷰를 기반으로 저장소에 독립적인 변환 알고리즘을 활용할 수 있는 모델이 제안되었다. 그러나 제안된 모델에서 변환 알고리즘을 독립적으로 활용하기 위해서는 사전에 사용자가 SQL 문을 작성하여 수동적으로 뷰를 생성해 주어야 한다. 이 경우 수동적인 SQL 작성으로 인한 불편함과 사용자의 실수로 인한 SQL문의 오류가 생길 수 있다는 문제점이 있다. 따라서 이 논문에서는 이러한 문제점을 해결하기 위하여 다양한 웹 온톨로지 저장소 모델 OWL 관련 시스템 개발에 가장 많이 사용되고 있는 Jena 저장소를 이용하여 독립적 저장소 활용을 위한 뷰 생성 독인 Jena-to-TRIPLES 변환 도구를 제안한다.

  • PDF

웹 기반하의 국어의 로마자 전사 표기 자동 변환 시스템 (Automatic translation system for hangul's romanization Based on the World Wide Web)

  • 김홍섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.108-114
    • /
    • 2002
  • 국어의 로마자 표기법 기본원칙을 모르더라도 웹 상에서 한글단어, 문장, 문서를 문자열(String)로 입력받아 국어의 로마자 표기 자동변환이 가능하게 설계 및 구현하였다. 특히, 표음 중심의 전사(Transcription) 표기법의 기계적 변환을 위해 알고리즘(algorithm)화된 음운법칙을 적용하여 소리글자로 자동 변환 후 정부 표준안인 국어 로마자 표기법 테이블에서 대응 글자를 참조하여 기계화 코드 변환이 가능토록 자동변환 알고리즘 설계하였으며, 유니코드(Unicode)와 아스키(ASCII)테이블에서 잘 쓰이지 않는 코드를 반달표(ˇ)와 어깻점(')등 특수부호로 할당하여 글꼴을 제작하였다. 또한 예외어 사전관리를 통한 예외 처리 문제에 대한 해결 방안을 제시하였으며, UML표기와 C++ 언어를 이용하여 사용자 편리성과 구현에 대한 모델을 제안하였다.

  • PDF