• Title/Summary/Keyword: 공간언어

Search Result 661, Processing Time 0.029 seconds

The evaluation of statistic processing on korean compound nouns (복합명사의 통계적 처리에 대한 평가)

  • Nam, Se-Jin;Lee, Ji-Yun;Shin, Dong-Wook;Chae, Mi-Ok
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.36-41
    • /
    • 1996
  • 한글을 대상으로 하는 검색 시스템의 강우 문서의 대부분을 차지하는 복합명사는 원칙적으로 단어와 단어 사이를 띄어 써야 하지만 붙여쓰기 또한 허용하므로 정보 검색 시스템에서는 이를 고려하여야 한다. 본 논문에서는 MIDAS/IR 정보검색 시스템에서 통계적인 정보를 이용하여 복합명사를 처리하는 방법을 구현하고 이를 실험을 통하여 평가하고자 한다. MIDAS/IR은 크게 복합명사의 통계적인 정보를 이용하는 색인 부분과 확장 불리한 모델 및 벡터 공간 모델을 제공하는 검색 부분으로 이루어져 있다. 색인기에서는 복합명사를 처리할 뿐 아니라 고유명사와 같이 사전에 등록되지 않은 명사를 처리하는 작업을 하게 되며 검색 부분은 클래스 라이브러리로 구현되어 있어 임의의 검색 모델도 쉽게 추가 될 수 있도록 설계하였다. 본 연구에서는 KTSET을 이용하여 불리한 모델 및 벡타 공간 모델에서의 성능을 실험을 통하여 평가하였으며, n-그램을 사용한 시스템과 비교 분석하였다.

  • PDF

A Generating Method of Hangul Fonts using Composite Glyph of TrueType (트루타입의 합성 글립을 이용한 새로운 한글 폰트 생성법)

  • Jeong, Geun-Ho;Kim, Eun-Hwe;Choi, Jae-Young
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.368-374
    • /
    • 1999
  • 한글 폰트는 조합형 폰트와 완성형 폰트로 구분된다. 조합형 폰트는 폰트를 제작하는 시간과 노력이 적게 필요하지만 폰트의 품질이 완성형 폰트보다 뒤떨어진다. 완성형 폰트는 조합형과 비교하여 우수한 품질을 가지지만 폰트 제작에 더 많은 시간과 노력을 요구한다. 특히 완성형 폰트는 폰트내의 중복된 자소들의 정보를 중복해서 저장하므로 폰트 저장에 필요한 공간이 더 많이 필요하다. 본 논문에서는 트루타입의 합성 글립(Composite Glyph)을 이용하여 중복된 자소를 최소화한 완성형 폰트를 구성하였다. 중복성을 최소화한 완성형 폰트는 기존 완성형 폰트와 유사한 고수준의 품질을 유지하면서 조합형 폰트와 유사하게 폰트 저장 공간의 크기를 절약할 수 있다.

  • PDF

Improving the Performance of Information Retrieval System by using GPU Parallelism (GPU 병렬성을 이용한 정보 검색 시스템의 성능 개선)

  • Park, Il-Nam;Bae, Byunggurl;Im, Eun-Jin;Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.83-84
    • /
    • 2011
  • 정보 검색 시스템에서 사용되고 있는 벡터 공간 모델은 벡터 유사도 계산 속도에 따라 전체 시스템의 성능에 많은 영향을 미친다. 본 논문에서는 문서 유사도 계산 성능을 향상시키기 위하여 GPU(Graphic Processing Unit)를 이용하는 CUDA프레임워크에서 병렬처리 연산을 구현하였으며, CPU(Central Processing Unit) 환경에서의 연산 속도와 비교했을 때 최대 15배의 성능 향상 효과가 있음을 확인하였다.

  • PDF

Solving Memorize Games via Model Abstraction (모델 추상화를 이용한 네모라이즈 게임 풀이)

  • Lee, Jung-Rim;Kwon, Gi-Hwon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.367-369
    • /
    • 2005
  • 모델 체킹에서 모델의 크기가 커질수록 검사해야 할 상태 공간이 지수적으로 증가하는 것을 상태폭발문제라고 부르며, 이 문제를 해결하기 위해 추상화 기법이 사용된다. 본 논문에서는 네모라이즈 게임을 대상으로 추상화 기법을 적용하여 게임 모델의 상태 공간을 줄설 기존 방법으로 풀지 못했던 게임을 풀었다. 이 게임은 한붓그리기처럼 출발지부터 이동가능한 모든 지점을 한번만 거쳐, 목적지까지 가는 경로를 찾아내는 도달성 게임이다. 이 게임은 Esterel 언어로 모델링 되었다. Esterel은 동기적 언어로써 게임을 유한상태모델로 모델링하고 관련 모델 체커인 Xeve를 사용하여 모델을 검사한다. Xeve는 모델 체킹 후 특정 출력신호를 방출하기 위한 입력신호들의 시퀀스를 생성해준다. 이 시퀀스가 게임의 해답인 경로가 되는데 Xes라는 시뮬레이터를 통해 실제 정확한 해답인지를 확인한다.

  • PDF

On Characteristics of Word Embeddings by the Word2vec Model (Word2vec 모델의 단어 임베딩 특성 연구)

  • Kang, Hyungsuc;Yang, Janghoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.263-266
    • /
    • 2019
  • 단어 임베딩 모델 중 현재 널리 사용되는 word2vec 모델은 언어의 의미론적 유사성을 잘 반영한다고 알려져 있다. 본 논문은 word2vec 모델로 학습된 단어 벡터가 실제로 의미론적 유사성을 얼마나 잘 반영하는지 확인하는 것을 목표로 한다. 즉, 유사한 범주의 단어들이 벡터 공간상에 가까이 임베딩되는지 그리고 서로 구별되는 범주의 단어들이 뚜렷이 구분되어 임베딩되는지를 확인하는 것이다. 간단한 군집화 알고리즘을 통한 검증의 결과, 상식적인 언어 지식과 달리 특정 범주의 단어들은 임베딩된 벡터 공간에서 뚜렷이 구분되지 않음을 확인했다. 결론적으로, 단어 벡터들의 유사도가 항상 해당 단어들의 의미론적 유사도를 의미하지는 않는다. Word2vec 모델의 결과를 응용하는 향후 연구에서는 이런 한계점에 고려가 요청된다.

A Study on the Education System for People Who Don't Have Their Own Letters, SOUL (문자 없는 나라를 위한 문자 교육 시스템(소울)에 관한 연구)

  • Ham, Hye-Ryeong;Noh, Yong-Deok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.377-380
    • /
    • 2010
  • 지식기반 사회에서 교육은 장기적인 발전을 위한 필수 요소이다. 교육을 위해서는 말하기, 듣기, 쓰기, 읽기 능력이 필요하다. 이 중 하나라도 충족하지 못한다면 제대로 된 교육을 받을 수 없다. 하지만 전 세계에 존재하는 약 6900여종의 언어 중 6600여종의 언어는 표기할 수 있는 고유 문자가 없다. 읽기 능력과 쓰기 능력을 기르기 위한 최소 조건조차 마련되어 있지 않은 것이다. 그래서 말은 있지만 문자는 없는 국가에 말을 표기할 수 있는 문자를 보급하여 지식기반 발전의 기반을 마련해 주는 소울(SOUL) 시스템을 제안한다. 소울(SOUL)은 두 가지 기능을 가지고 있다. 문자 교육 기능과, 지식 공유 공간 기능이다. 문자 교육 기능에서는 각 문자가 내는 소리와 조합방법, 그리고 각 문자의 표기법, 표기 순서 등을 익힘으로써 문자를 쉽게 익힐 수 있도록 하였다. SOUL은 말을 표기할 문자로 비교적 익히기 쉬운 언문인 한글을 채택하였다. 그리고 지식 공유 공간 기능에서는 문자를 익힌 사용자가 마치 위키피디아처럼 지식을 기록하고 공유할 수 있어 지식을 축적하도록 도와주도록 설계하였다. 여기서는 소울(SOUL) 시스템의 구조 및 구현을 보인다.

Improving passage retrieval via negative sampling from semantic feature space (의미론적 feature 공간상에서의 negative sampling을 통한 검색 성능 개선)

  • Jeong-Doo Lee;Beomseok Hong;Wonseok Choi;Youngsub Han;Byoung-Ki Jeon;Seung-Hoon Na
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.146-149
    • /
    • 2022
  • 최근 검색 태스크에서는 좋은 negative sample을 얻는 방법론들이 적용되어 큰 성능 향상을 이뤘다. 하지만 좋은 negative sample 대부분의 방법들은 큰 계산 비용이 든다. 따라서 본 논문에서는 계산 비용이 적고 효과적인 negative sample을 얻기 위해 Mixed Gaussian Recurrent Chain (MGRC) sampling을 사용하여 feature 공간상에서 의미론적으로 유사한 feature를 얻고 이를 negative sample로 활용하여 기존 baseline 모델보다 좋은 성능을 얻었다.

  • PDF

Graph Learning System for Analyzing Bias among News Using Keyword Distance Model (주제어 문장거리를 이용한 뉴스 편향성 분석 그래프 학습)

  • Cho Chanwoo;Cho Chanhyung
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.533-538
    • /
    • 2023
  • 문서에서 저자의 의도와 주제, 그 안에 포함된 감성을 분석하는 것은 자연어 연구의 핵심적인 주제이다. 이와 유사하게 특정 글에 포함된 정치적 문화적 편향을 분석하는 것 역시 매우 의미 있는 연구주제이다. 우리는 최근 발생한 한 사건에 대하여 여러 신문사와 해당 신문사에서 생산한 기사를 중심으로 해당 글의 정치적 편향을 정량화 하는 방법을 제시한다. 그 방법은 선택된 주제어들의 문장 공간에서의 거리를 중심으로 그래프를 생성하고, 생성된 그래프의 기계학습을 통하여 편향과 특징을 분석하였다. 그리고 그 그래프들의 시간적 변화를 추적하여 특정 신문사에서 특정 사건에 대한 입장이 시간적으로 어떻게 변화하였는지를 동적으로 보여주는 그래프 애니메이션 시스템을 개발하였다. 실험을 위하여 최근 이슈에 대하여 12개의 신문사에서 약 2000여 개의 기사를 수집하였다. 그 결과, 약 82%의 정확도로 일반적으로 알려진 정치적 편향을 예측할 수 있었다. 또한, 학습 데이터에 쓰이지 않은 신문기사를 활용하여도 같은 정도의 정확도를 보임을 알 수 있었다. 우리는 이를 통하여 신문기사에서의 정치적 편향은 작성자나 신문사의 특성이 아니라 주제어들의 문장 공간에서의 거리 관계로 특성화할 수 있음을 보였다. 할 수 있다.

  • PDF

Implementation of Real-time Transaural Filter for 3D Sound Reproduction (입체 음향 재생을 위한 실시간 트랜스오럴 필터 구현)

  • 이동우
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.269-272
    • /
    • 1998
  • 본 논문에서는 스테레오 스피커를 통해 입체 음향을 재생할 때 발생하는 크로스 토크(corss talk)를 제거하기 위한 트랜스오럴 필터를 실시간으로 구현하였다. 실시간 처리를 위하여 일반적인 트랜스오럴 필터를 재구성하였으며, 범용 DSP(Digital Signal Processor) 칩인 TMS320C40을 사용하였다. 메인 프로그램은 C-언어를 이용하여 작성하였으며, 빠른 연산을 필요로 하는 컨벌루션 함수는 어셈블러 언어를 이용하여 최적화 하였다. 구현된 트랜스오럴 필터의 평가를 위해서 더미 헤드를 이용하여 녹음된 binaural 신호와 DSP를 이용하여 실시간으로 합성된 binaural 신호를 스테레오 스피커를 통해 재생하여 청취 실험하였다. 청취 실험한 결과 머리 밖에서 음상 정위가 이루어지고 공간감과 거리감은 헤드폰으로 청취할 때 보다 우수하게 나타났다.

  • PDF

A Study on a High-Performance VLSI Design of VLC-Based Entropy Decoder for VC-1 (VC-1용 VLC 기반 엔트로피 디코더의 고성능 VLSI 설계에 관한 연구)

  • Song, Hyeong-Don;Sonh, Seung-Il
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2007.11a
    • /
    • pp.829-832
    • /
    • 2007
  • 디지털 비디오 압축 기술은 대역폭과 저장 공간이 제한되는 멀티미디어 데이터의 효율적인 전송과 저장을 가능하게 하는 중요한 역할을 해왔다. 현재 VC-1은 차세대 DVD의 표준으로 채택되어 사용되고 있고 H.264/AVC의 대안으로 제안되고 있다. 이에 본 논문에서는 VC-1의 엔트로피 디코더에 대하여 소프트웨어 검증을 통한 최적화 알고리즘을 사용하여 하드웨어 설계 언어인 VHDL 언어를 이용하여 기술하고 ModeSim6.0a를 이용한 데이터 검증을 수행하였다.

  • PDF