• 제목/요약/키워드: dictionary-based

검색결과 551건 처리시간 0.026초

A Document Ordering Support System Employing Concept Structure based on Fuzzy Fish View Extraction

  • Ohashi, Tadashi;Nobuhara, Hajime;Hirota, Kaoru
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.98-101
    • /
    • 2003
  • To classify desired and undesired documents on the web according to each user's view, FOCUS (Fuzzy dOCUment ordering System) is developed based on fuzzy concept extraction, fuzzy fish eye matching, and fuzzy selection. Experiments are done using the concept-system-dictionary by EDR (Electronic Dictionary Research Institute) including 140,000 words and web-based documents related to movie.

  • PDF

PLIB 파트42를 이용한 자동차부품의 데이터사전 (Data Dictionary of Automotive Parts based on PLIB Part 42)

  • 김영범;조준면;한순흥
    • 한국전자거래학회지
    • /
    • 제6권2호
    • /
    • pp.127-142
    • /
    • 2001
  • For the B2B e-commerce and SCM (Supply Chain Management), standardization of electronic catalogue that contains product and business data is important. Especially, standardization of hierarchies that is required for categorization, and standardization of product properties are difficult and costly to maintain. The ability of searching for items and data in databases is critical for successful e-commerce system. This paper introduces the data dictionary of PUB (ISO 13584) part 42 which can establish the standard of product data. The method is applied to develop the data dictionary of automotive parts.

  • PDF

한국어 구어 음성 언어 이해 모델에 관한 연구 (A Study on Korean Spoken Language Understanding Model)

  • 노용완;홍광석
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2435-2438
    • /
    • 2003
  • In this paper, we propose a Korean speech understanding model using dictionary and thesaurus. The proposed model search the dictionary for the same word with in input text. If it is not in the dictionary, the proposed model search the high level words in the high level word dictionary based on the thesaurus. We compare the probability of sentence understanding model with threshold probability, and we'll get the speech understanding rate. We evaluated the performance of the sentence speech understanding system by applying twenty questions game. As the experiment results, we got sentence speech understanding accuracy of 79.8%. In this case probability of high level word is 0.9 and threshold probability is 0.38.

  • PDF

대용량 OWL 온톨로지 자동구축을 위한 세종전자사전 활용 방법론 연구 (A Study of Methodology for Automatic Construction of OWL Ontologies from Sejong Electronic Dictionary)

  • 송도규
    • 한국언어정보학회지:언어와정보
    • /
    • 제9권1호
    • /
    • pp.19-34
    • /
    • 2005
  • Ontology is an indispensable component in intelligent and semantic processing of knowledge and information, such as in semantic web. However, ontology construction requires vast amount of data collection and arduous efforts in processing these un-structured data. This study proposed a methodology to automatically construct and generate ontologies from Sejong Electronic Dictionary. As Sejong Electronic Dictionary is structured in XML format, it can be processed automatically by computer programmed tools into an OWL(Web Ontology Language)-based ontologies as specified in W3C . This paper presents the process and concrete application of this methodology.

  • PDF

사전 정보를 이용한 단어 중의성 해소 모형에 관한 실험적 연구 (An Experimental Study on an Effective Word Sense Disambiguation Model Based on Automatic Sense Tagging Using Dictionary Information)

  • 이용구;정영미
    • 정보관리학회지
    • /
    • 제24권1호
    • /
    • pp.321-342
    • /
    • 2007
  • 이 연구에서는 수작업 태깅없이 기계가독형 사전을 이용하여 자동으로 의미를 태깅한 후 학습데이터로 구축한 분류기에 대해 의미를 분류하는 단어 중의성 해소 모형을 제시하였다. 자동 태깅을 위해 사전 추출 정보 기반방법과 연어 공기 기반 방법을 적용하였다. 실험 결과, 자동 태깅에서는 복수 자질 축소를 적용한 사전 추출 정보 기반 방법이 70.06%의 태깅 정확도를 보여 연어 공기 기반 방법의 56.33% 보다 24.37% 향상된 성능을 가져왔다. 사전 추출 정보 기반 방법을 이용한 분류기의 분류 정학도는 68.11%로서 연어 공기 기반 방법의 62.09% 보다 9.7% 향상된 성능을 보였다. 또한 두 자동 태깅 방법을 결합한 결과 태깅 정확도는 76.09%, 분류 정확도는 76.16%로 나타났다.

A Study on the Academic vocabulary Education for Content-Based Korean Language Education: A Basic Study for Online Dictionary Development

  • Hwang, Shung-eun
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.67-74
    • /
    • 2020
  • 이 연구는 내용 중심 한국어 교육을 위해 학술어휘를 어떻게 교육할 것인지에 대한 방안으로 온라인 학술어휘 사전을 개발할 것을 제안한다. 학문 목적 한국어 학습자가 대학 수학 과정에서 접하게 되는 내용 중심 한국어 교육을 위한 학술적 텍스트에는 다양한 학술어휘가 존재한다. 학술어휘를 모르고서는 학문적 내용을 이해하거나 생산할 수 없다. 따라서 그들이 처한 교육적 환경을 고려하여 그들에게 가장 적합한 방식으로 학술어휘를 교육해 교육적 효율성을 높이는 것이 한국어 교육의 과제 중 하나가 되었다. 이에 대한 대안으로 본고는 온라인 학술어휘 사전 개발에 앞서 온라인 학술어휘 사전에는 어떠한 내용이 어떠한 방식으로 담겨야 하는지에 대한 기초 연구를 수행하고자 한다. 온라인 학술어휘 사전은 교실 안으로 한정되어 있던 교육을 교실 안팎으로 자연스럽게 연결하게 해 교육 현장이 갖는 어휘 교육의 한계를 극복하고 교육적 효과를 극대화할 수 있다.

Classification of Man-Made and Natural Object Images in Color Images

  • Park, Chang-Min;Gu, Kyung-Mo;Kim, Sung-Young;Kim, Min-Hwan
    • 한국멀티미디어학회논문지
    • /
    • 제7권12호
    • /
    • pp.1657-1664
    • /
    • 2004
  • We propose a method that classifies images into two object types man-made and natural objects. A central object is extracted from each image by using central object extraction method[1] before classification. A central object in an images defined as a set of regions that lies around center of the image and has significant color distribution against its surrounding. We define three measures to classify the object images. The first measure is energy of edge direction histogram. The energy is calculated based on the direction of only non-circular edges. The second measure is an energy difference along directions in Gabor filter dictionary. Maximum and minimum energy along directions in Gabor filter dictionary are selected and the energy difference is computed as the ratio of the maximum to the minimum value. The last one is a shape of an object, which is also represented by Gabor filter dictionary. Gabor filter dictionary for the shape of an object differs from the one for the texture in an object in which the former is computed from a binarized object image. Each measure is combined by using majority rule tin which decisions are made by the majority. A test with 600 images shows a classification accuracy of 86%.

  • PDF

확률적 문법규칙에 기반한 국어사전의 뜻풀이말 구문분석기 (A Parser of Definitions in Korean Dictionary based on Probabilistic Grammar Rules)

  • 이수광;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.448-448
    • /
    • 2001
  • The definitions in Korean dictionary not only describe meanings of title, but also include various semantic information such as hypernymy/hyponymy, meronymy/holonymy, polysemy, homonymy, synonymy, antonymy, and semantic features. This paper purposes to implement a parser as the basic tool to acquire automatically the semantic information from the definitions in Korean dictionary. For this purpose, first we constructed the part-of-speech tagged corpus and the tree tagged corpus from the definitions in Korean dictionary. And then we automatically extracted from the corpora the frequency of words which are ambiguous in part-of-speech tag and the grammar rules and their probability based on the statistical method. The parser is a kind of the probabilistic chart parser that uses the extracted data. The frequency of words which are ambiguous in part-of-speech tag and the grammar rules and their probability resolve the noun phrase's structural ambiguity during parsing. The parser uses a grammar factoring, Best-First search, and Viterbi search In order to reduce the number of nodes during parsing and to increase the performance. We experiment with grammar rule's probability, left-to-right parsing, and left-first search. By the experiments, when the parser uses grammar rule's probability and left-first search simultaneously, the result of parsing is most accurate and the recall is 51.74% and the precision is 87.47% on raw corpus.

전략 테이블과 유전 알고리즘을 이용한 LZ77 알고리즘의 성능 개선 (Performance Improvement of LZ77 Algorithm using a Strategy Table and a Genetic Algorithm)

  • 정순철;서동일;문병로
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권12호
    • /
    • pp.1628-1636
    • /
    • 2004
  • 저장 공간이나 전송 시간을 줄여서 비용을 아끼는 데이타 압축 기술은 그 유용성 때문에 오래전부터 연구되어 왔다. Lempel-Ziv 77(LZ77) 알고리즘은 실용적인 사전-기반 비손실 압축 알고리즘이다. 기존의 LZ77 알고리즘에서 알고리즘의 성능에 큰 영향을 미치는, 사전의 크기는 고정되어 있다. 본 논문에서는 사전의 크기를 동적으로 바꾸면서 압축을 하는 동적 LZ77 알고리즘과 동적 LZ77 알고리즘에서 사용하는 전략을 진화시키는 유전 알고리즘을 소개한다. 유전 알고리즘으로 진화시킨 전략을 가지고 동적 LZ77 알고리즘은 기존의 LZ77 알고리즘보다 최대 약 16%까지 더 좋은 압축 효율을 보여 주었다.

손실 영역 분석 기반의 학습데이터 매핑 기법을 이용한 초해상도 연구 (Super Resolution using Dictionary Data Mapping Method based on Loss Area Analysis)

  • 한현호;이상훈
    • 한국융합학회논문지
    • /
    • 제11권3호
    • /
    • pp.19-26
    • /
    • 2020
  • 본 논문에서는 학습된 사전 기반 초해상도 결과를 개선하기 위해 분석한 손실 영역을 기반으로 학습 데이터를 적용하는 방법을 제안하였다. 기존의 학습된 사전 기반 방법은 입력 영상의 특징을 고려하지 않는 학습된 영상의 형태로 출력할 수 있으며, 이 과정에서 인공물이 발생할 수 있다. 제안하는 방법은 입력 영상과 학습된 영상의 일치하지 않는 특징으로 인한 인공물 발생을 줄이기 위해 1차 복원 결과를 분석함으로써 손실 정보를 추정하였다. 추정된 결과의 잡음 및 화소 불균형을 가우시안 기반의 커널로 개선하여 생성된 특징 맵에 따라 학습 데이터를 매핑하였다. 결과 비교를 위해 기존의 초해상도 방법과 제안 방법의 결과를 고화질 영상과 PSNR(Peak Signal to Noise Ratio), SSIM(Structural SIMilarity Index) 으로 비교한 결과 각각 4%와 3%의 향상된 결과를 확인하였다.