• Title/Summary/Keyword: 사전이도

Search Result 6,760, Processing Time 0.035 seconds

Geometry Reconstruction Using Dictionary Learning of 3D Shape Features (3차원 형태 특징의 사전 학습을 이용한 기하 복원)

  • Hwang, Jung-Min;Yoon, Yeo-Jin;Choi, Soo-Mi
    • Journal of the Korea Computer Graphics Society
    • /
    • v.23 no.1
    • /
    • pp.57-65
    • /
    • 2017
  • In this paper, we present a dictionary learning method for reducing errors in point cloud models and reconstructing their geometry. For this, 3D feature information is extracted from the models which have a similar shape characteristic as the target model. Then a dictionary is constructed and the geometry is reconstructed using the dictionary. The presented method in this paper consists of the following three steps. First, a geometric patch is constructed from a similar model. Second, a morphological 3D feature of the acquired patch is learned. Third, a geometry reconstruction is performed using the learned dictionary. Finally, the error between the original model and the reconstruction result is calculated, and the accuracy of the reconstruction result is checked.

LGG-based Phrase-Pattern Dictionaries of Non-Standard Tokens that contain Bound Nouns in Social Media Texts (SNS 텍스트의 비정규토큰 분석 성능 향상을 위한 의존명사 내포 어형의 LGG 기반 패턴문법 사전)

  • Choi, Seong-Yong;Shin, Dong-Hyok;Hwang, Chang-Hoe;Yoo, Gwang-Hoon;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.394-399
    • /
    • 2018
  • 본 연구는 SNS 텍스트에서 형태소 분석기로 분석되지 않는 비정규토큰 유형 중 고빈도로 나타나는 의존명사 내포 어형의 형태소를 인식할 수 있는 LGG 기반 패턴문법 사전 구축과 그 성능을 평가하는 것을 목표로 한다. SNS 텍스트에서는 기존의 정형화된 텍스트와 달리, 띄어쓰기 오류로 인한 미분석어가 매우 높은 빈도로 나타나는데, 특히 의존명사를 포함한 유형이 20% 이상을 차지하며 가장 빈번한 것으로 나타났다. 이에 본 연구에서는 의존명사를 내포한 비정규토큰의 띄어쓰기 오류 문제를 효과적으로 처리하기 위해, 부분 문법 그래프(Local Grammar Graph: LGG) 프레임에 기반한 패턴문법 사전을 구축하였다. 이를 SNS 코퍼스에 적용하여 성능을 평가한 결과, 정확률 91.28%, 재현율 89%, 조화 평균 90.13%의 성능을 통해 본 연구의 접근 방법론의 유용성과 구축 자원의 실효성을 입증하였다.

  • PDF

Effect of the Web Organization and Prior Knowledge on Obtaining Various Kinds of Knowledge (웹 사이트의 구조가 다양한 층위의 지식 형성에 영향을 미치는가 - 이용자의 사전 지식을 중심으로)

  • Joo, Yeon-Kyoung
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02b
    • /
    • pp.575-581
    • /
    • 2007
  • 웹사이트를 어떻게 디자인했을 때 지식을 보다 효율적으로 전달할 수 있는가에 많은 관심이 쏠리고 있다. 최근의 몇몇 커뮤니케이션 연구들은 인터넷의 독특한 정보 전달 구조인 하이퍼텍스트 구조가 정보 전달에 있어서 핵심적인 영향을 끼치고 있으며, 따라서 하이퍼텍스트를 어떤 방식으로 구조화하는지에 따라 지식의 전달 내용도 바뀔 수 있다고 주장하고 있다. 이 연구는 이러한 학자들의 의견과 궤를 같이 하여, 이용자의 사전 지식의 차이에 따라 비선형적 웹사이트 구조가 구조적인 지식과 선언적인 지식을 전달하는 데, 어떠한 차이점을 가지는지를 시험적으로 검증한 예비 조사적 연구이다. 관련된 기존 문헌 연구를 통해, 사전 지식이 높은 이용자는 선형 구조보다는 비선형 웹 구조를 통해서 구조적인 지식을 습득하는 데, 유리할 것이고 사전 지식이 낮은 이용자는 선형 구조보다는 비선형 웹구조를 통해서 학습할 때, 선언적인 지식을 습득할 확률이 높을 것이라고 예상되었다. 이를 소규모 집단 실험으로 검증한 결과, 통계적으로 유의한 수준은 아니었지만 비선형적 웹구조는 구조적인 지식을 증가시키는 경향성이 발견되었다. 또한 사전 지식이 높은 이용자 역시 비선형 구조에서 높은 구조적 지식을 습득하는 경향성이 있었다. 그러나 선언적인 지식의 경우에는 웹 구조의 영향이 크게 상관이 없는 것으로 나타났다.

  • PDF

Processing of Inflectional forms for the French-Korean Collocational Database (불-한 연어 데이터베이스 구축을 위한 굴절 정보의 처리)

  • Yoon, Ae-Sun;Jeong, Hwi-Woong;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.267-272
    • /
    • 2001
  • 구(phrase) 단위 또는 문장(sentence) 단위의 연어(collocation) 정보는 자연언어 처리를 위한 단일어 또는 이중어 데이터베이스를 구축할 수 있는 중요한 기초 자료가 될 뿐 아니라, 외국어 학습에서도 어휘 단계를 넘어선 학습 자료를 제공할 수 있다. 불어는 굴절 언어(inflectional language)로서 기본형 대 굴절형의 비율이 약 1:9 정도로 비교적 굴절 비율이 높은 언어다. 또한 불어 표제어 중 95% 이상을 차지하는 불어의 동사, 명사, 형용사 중 상당한 비율이 암기해야 할 목록(list)이라는 특성을 갖기 때문에 검색과 학습에 있어 오류가 지속적으로 일어나는 부분이다. 표제어의 검색의 경우 불어 굴절 현상을 지원하는 전자 사전이 개발되어 있지만 아직까지 연어 정보에서 굴절형을 지원할 수 사전 또는 데이터베이스는 개발되어 있지 않다. 본 연구의 목적은 전자 사전과 형태소 분석기를 이용하여 굴절형 처리를 지원할 수 있는 불-한 연어 데이터베이스를 구축하는데 있다. 이를 위해 부산대학교 언어정보 연구실에서 개발한 불어 형태소 분석기 Infection와 불-한 전자 사전 Franco를 사용하였으며, 지금까지 구축된 불-한 연어 정보는 94,965 개이다. 본 고에서는 두 정보를 이용하여 불어 굴절형 정보를 분석 및 생성하는 방식 및 불-한 연어 데이터베이스 구조를 살펴 본다.

  • PDF

Evolutionary Learning of Hypernetwork Classifiers Based on Sequential Bayesian Sampling for High-dimensional Data (고차 데이터 분류를 위한 순차적 베이지안 샘플링을 기반으로 한 하이퍼네트워크 모델의 진화적 학습 기법)

  • Ha, Jung-Woo;Kim, Soo-Jin;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.336-338
    • /
    • 2012
  • 본 연구에서는 고차 데이터 분류를 위해 순차적 베이지만 샘플링 기반의 진화연산 기법을 이용한 하이퍼네트워크 모델의 학습 알고리즘을 제시한다. 제시하는 방법에서는 모델의 조건부 확률의 사후(posterior) 분포를 최대화하도록 학습이 진행된다. 이를 위해 사전(prior) 분포를 문제와 관련된 사전지식(prior knowledge) 및 모델 복잡도(model complexity)로 정의하고, 측정된 모델의 분류성능을 우도(likelihood)로 사 용하며, 측정된 사전분포와 우도를 이용하여 모델의 적합도(fitness)를 정의한다. 이를 통해 하이퍼네트워크 모델은 고차원 데이터를 효율적으로 학습 가능할 뿐이 아니라 모델의 학습시간 및 분류성능이 개선될 수 있다. 또한 학습 시에 파라미터로 주어지던 하이퍼에지의 구성 및 모델의 크기가 학습과정 중에 적응적으로 결정될 수 있다. 제안하는 학습방법의 검증을 위해 본 논문에서는 약 25,000개의 유전자 발현정보 데이터셋에 대한 분류문제에 모델을 적용한다. 실험 결과를 통해 제시하는 방법이 기존 하이퍼네트워크 학습 방법 뿐 아니라 다른 모델들에 비해 우수한 분류 성능을 보여주는 것을 확인할 수 있다. 또한 다양한 실험을 통해 사전분포로 사용된 사전지식이 모델 학습에 끼치는 영향을 분석한다.

Implementation of an Open Collaboration Support Service Platform: 'Preparation Phase' Focused on User-defined Relationships between Articles (개방형 협업 지원 서비스 플랫폼 구현: 문헌 간 사용자 정의 관계를 중심으로 한 '사전 단계')

  • Hanmin Jung;Jung Hoon Park;Suhyeon Yoo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.127-130
    • /
    • 2024
  • 본 연구는 기존 포털형 정보 서비스의 한계를 극복하고자, 이전 연구에서 제안된 연구자의 R&D 프로세스 과정에서의 협업을 지원하는 개방형 협업 지원 서비스 플랫폼을 기반으로 하여, 본 연구에서는 R&D 프로세스 중 '사전 단계'에 대한 설계와 구현을 소개한다. 우리는 R&D 프로세스를 문헌 리뷰와 연구 가설 설정 등을 수행하는 '사전 단계,' 실험과 데이터 분석 등을 수행하는 '실행 단계', 논문 작성 및 출판 등을 수행하는 '성과화 단계'로 구분하고, 이 중 '사전 단계'에 대해 프로젝트 뷰, 그룹 뷰, 문헌 뷰, 관계 뷰를 설계하고 구현하였다. 연구자는 이 플랫폼을 통해 문헌 내용 및 문헌 간 복잡한 연관성을 신속하게 파악할 수 있으며, 플랫폼은 연구자에 의해 자연스럽게 생성되는 사용자 정의 관계를 통해 향후 심층적인 문헌 네트워크 구축 및 분석이 가능해질 것으로 기대한다.

  • PDF

한글 단어를 발음 기호로 변환 시키는 인공신경망에 관한 연구

  • Yang, Jae-U;Kim, Doo-Hyeon
    • ETRI Journal
    • /
    • v.10 no.3
    • /
    • pp.113-124
    • /
    • 1988
  • 본 논문에서는 한글 단어를 발음 기호로 변환시키는 인공신경망의 설계와 이를 시뮬레이션한 결과에 대하여 논한다. 이 인공신경망은 multi-layer perceptron 구조를 가지며 error back-propagation 학습 알고리즘을 사용하였다. 이 인공신경망에 한글 발음 사전의 일부를 반복적으로 제시하여 학습시킨 결과, 학습한 단어에 대하여 최고 97%의 정확도로 변환 작업을 수행하였고 학습하지 않은 단어에 대해서는 91%의 정확도를 보였다. 이는 설계된 인공신경망이 발음 사전 내에 포괄적으로 내재되어 있는 발음규칙을 스스로 학습하였음을 나타낸다. 아울러 신경망의 학습 성취도와 입력 코드와의 관계도 연구하였는데, 한글단어를 발음기호로 변환하는 데에 있어서 compact 코드 보다 local 코드일 때 학습 성취도가 높은 것이 실험을 통해 밝혀졌다.

  • PDF

Development of an MT System on Distributed Environment : about lexicon construction and test environment (분산 환경에서의 번역 시스템의 개발 : 사전 구축과 테스트 환경을 중심으로)

  • Lee, Hyun-Ah;Jang, Byung-Gyu;Kang, In-Ho;Lee, Shin-Mok;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.344-349
    • /
    • 2000
  • 본 논문에서는 영한 기계번역 시스템 ALKOL의 개발 과정에서 사용된 분산 환경을 사전구축과 테스트 환경을 중심으로 설명한다. 번역 시스템 개발은 시스템 개발자, 사전 개발자, 검사자(tester)의 세 요소를 중심으로 이루어지는 작업으로, 효율적인 개발을 위해서는 개별 요소의 작업이 독립적으로 진행되면서 유기적으로 연결될 수 있는 환경이 마련되어야 한다. ALKOL에서는 이를 위하여 번역 시스템을 번역 서버, 사전 서버, 사전 편집기, 사용자 인터페이스의 클라이언트/서버 분산 환경으로 구성하고 검사자를 위한 테스트 환경을 제공하여 효율적인 번역 시스템 개발 환경을 구축한다. 번역 시스템을 분산 환경에서 개발하여 시스템 개발자, 사전 개발자, 검사자가 각자의 작업을 병렬적으로 진행할 수 있고 실시간으로 갱신되는 시스템과 사전 정보를 이용하여 작업을 진행할 수 있어 번역 시스템 개발의 효율성을 높일 수 있다.

  • PDF

Selection of Postpositions and Translated Words by Sentence Pattern in the English-Korean Machine Translation (영-한 기계번역에서 문형에 의한 조사 및 대역어 선택)

  • Park, Y.J.;Kim, N.S.;Lee, J.S.;Lee, Y.S.
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.105-109
    • /
    • 1999
  • 영-한 기계번역 중 변환 단계에서 한국어 문장을 생성하기 위해서는 구구조 변환 후 조사 및 대역어 선택으로 이루어진다. 그러나 하나의 영어 단어는 여러 개의 한국어 의미들을 가지고 있기 때문에 문장에서 사용된 영어의 정확한 의미에 해당하는 한국어 대역어를 선택하는 것은 번역의 질을 높이고 시스템의 성능에 매우 중요한 역할을 한다. 특히 용언 및 체언의 대역어 선택은 문장에서 서로 간의 의미적인 관계를 고려하여야 올바른 대역어를 선택할 수 있다. 기존에는 전자 사전에 용언과 체언간의 연어 정보(collocation information)를 구축하여 대역어 선택의 문제를 해결하려고 하였으나 연어 정보가 사전에 존재하지 않을 때 올바른 대역어를 선택할 수 없었다. 또한 용언과 체언의 관계를 나타내는 조사를 선택하기 위하여 격(case)을 세분화하여 사전을 구축하였으나 격의 분류 및 사전을 구축할 경우 격을 선택하는 어려움이 있었다. 이에 따라 본 논문에서는 문형(sentence pattern)에 의한 방법으로 용언의 대역어 및 용언이 갖는 필수격 체언의 조사와 대역어 선택방법을 제안한다. 문형의 구조적인 정보에는 용언과 체언의 의미적 역할(thematic role)을 하는 조사 및 용언이 갖는 필수격 체언의 의미 자질(semantic feature)을 갖고 있다. 이러한 의미 자질을 wordnet과 한/영 및 영/한 사전을 이용하여 의미 지표(semantic marker)를 갖는 문형 사전을 구축한다. 또한 의미 지표를 갖는 문형 사전을 기반으로 조사 및 대역어 선택 알고리즘을 개발한다.

  • PDF

Digital Predistortion Algorithm using Techniques of Temperature Compensation (온도보상 기법을 적용한 디지털 방식의 사전 왜곡제거기 알고리듬)

  • Ko, Young-En;Bang, Sung-Il
    • Journal of the Institute of Electronics Engineers of Korea TC
    • /
    • v.42 no.9 s.339
    • /
    • pp.1-10
    • /
    • 2005
  • In this paper, we proposed predistortion algerian that can compensate temperature distortion by digital. Predistortion algorithm produces compensation value of distortion by temperature as well as system nonlinear distortion by input level, and warps beforehand signal of baseband. To prove excellency of such algorithm we applied predistortion algorithm to Saleh's high power amplifier model, and did computer simulation. As a result, P1dB increased about 0.5 dBm phase shift reduced about $0.8^{o}$ than existent the A&P PD, and predistiortion algorithm to apply temperature compensation techniques improved P1dB about 2dBm and stabilized phase shift by about $0.1^{o}$ low. When approved UMTS's sample signal to this amplifier, IMD3 of amplifier decreased 10dBm than is no temperature compensation techniques, and reduced 19dBm than signal that is no distortion.