• Title/Summary/Keyword: 데이터베이스 사전

Search Result 321, Processing Time 0.023 seconds

Processing of Inflectional forms for the French-Korean Collocational Database (불-한 연어 데이터베이스 구축을 위한 굴절 정보의 처리)

  • Yoon, Ae-Sun;Jeong, Hwi-Woong;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.267-272
    • /
    • 2001
  • 구(phrase) 단위 또는 문장(sentence) 단위의 연어(collocation) 정보는 자연언어 처리를 위한 단일어 또는 이중어 데이터베이스를 구축할 수 있는 중요한 기초 자료가 될 뿐 아니라, 외국어 학습에서도 어휘 단계를 넘어선 학습 자료를 제공할 수 있다. 불어는 굴절 언어(inflectional language)로서 기본형 대 굴절형의 비율이 약 1:9 정도로 비교적 굴절 비율이 높은 언어다. 또한 불어 표제어 중 95% 이상을 차지하는 불어의 동사, 명사, 형용사 중 상당한 비율이 암기해야 할 목록(list)이라는 특성을 갖기 때문에 검색과 학습에 있어 오류가 지속적으로 일어나는 부분이다. 표제어의 검색의 경우 불어 굴절 현상을 지원하는 전자 사전이 개발되어 있지만 아직까지 연어 정보에서 굴절형을 지원할 수 사전 또는 데이터베이스는 개발되어 있지 않다. 본 연구의 목적은 전자 사전과 형태소 분석기를 이용하여 굴절형 처리를 지원할 수 있는 불-한 연어 데이터베이스를 구축하는데 있다. 이를 위해 부산대학교 언어정보 연구실에서 개발한 불어 형태소 분석기 Infection와 불-한 전자 사전 Franco를 사용하였으며, 지금까지 구축된 불-한 연어 정보는 94,965 개이다. 본 고에서는 두 정보를 이용하여 불어 굴절형 정보를 분석 및 생성하는 방식 및 불-한 연어 데이터베이스 구조를 살펴 본다.

  • PDF

알아봅시다 - 정보통신용어사전

  • Korea Database Promotion Center
    • Digital Contents
    • /
    • no.5 s.24
    • /
    • pp.103-107
    • /
    • 1995
  • 지난호까지는 3회에 걸쳐 데이터베이스용어를 게재하였다. 이번호부터는 정보통신용어중 통신에 관련된 용어를 3회에 걸쳐 게재코자 한다.

  • PDF

데이터베이스 용어사전

  • Korea Database Promotion Center
    • Digital Contents
    • /
    • no.9 s.16
    • /
    • pp.122-125
    • /
    • 1994
  • 우리는 흔히 정보통신, ISDN, PC통신, NETWORK 등 수많은 단어들을 접한다. 비록 이 용어자체는 익숙하지만 정확한 의미를 모르는 상태에서 사용하는 경우가 많다. 이번호 부터는 이러한 데이터베이스 관련 용어를 정리함으로 독자들에게 보다 나은 정보를 제공하고자 한다.

  • PDF

Design and Implementation of Dictionary Based Alias Search Modules on KT114 Business Search System (KT114 상호/업종 검색 시스템에서의 사전 기반 통상명 검색 모듈의 설계 및 구현)

  • 신봉근;정희정;김종수;김명호;유병규;유광일;홍희경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.327-329
    • /
    • 1998
  • KT114 상호/업종 검색 서비스에서는 데이터베이스 내의 동일한 개체에 대하여, 사용자가 입력한 상호명과 실제 데이터베이스에 저장된 상호명이 서로 다른 '통상명 검색 문자'가 존재한다. 이는 사용자가 인지하고 있는 상호명이 실제 상호명이 아니라 해당 상호의 대표적인 상표 혹은 상품명 등인 경우 발생한다. 본 논문에서는 이러한 '통상명 검색 문제'의 해결을 위하여 실제 상호와 사용자 인지 상호 간의 관계를 정의한 사전에 기반을 둔 해결 방안을 제안한다. 대용량의 자료에 대한 빠른 검색을 요구하는 시스템 특성상 사전의 구축 방식은 매우 중요한 문제이다. 본 논문에서는 사전을 구축하는 두 가지 서로 다른 접근 방법으로, 'DBMS 내부 구축 방식'과 '외부 사전 구축 방식'에 대하여 설명하고, 시스템 환경을 고려하여 두 접근 방법을 비교 및 분석한다.