• Title/Summary/Keyword: 의미역 처리

Search Result 145, Processing Time 0.023 seconds

The Design for the fast process in the complex and various information. (복잡하고 다양한 정보 속에서 빠른 정보 처리 디자인 -색의 범주화를 통한 빠른 정보처리)

  • Min, Kyoung-Geun
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.1150-1155
    • /
    • 2009
  • In the information society, the amount of information have been increased by technological development. It is not easy to deal with information for fast data processing because of increasing of the complexity and diversity of data. So this paper will confirm the fact that the color plays the role of the classification of complex information and can make data processing fast. Experiment 1 shows that the searching time of target(line name) is more faster when the color of a subway line is equal to the color of station`s name. Experiment 2 using the task for classification of word mixed in various categories shows that color category processing is more faster rather than semantic category processing and the effect of this task is far better when color difference is more clear.

  • PDF

Annotation Tool for Construction Korean PropBank and Sejong Semantic Tagged Corpus (한국어 PropBank 및 세종 의미 표지 부착 말뭉치 구축을 위한 도구)

  • Han, Dae-Yong;Choi, Han-Gil;Lee, Jung-Kuk;Kim, Jong-Dae;Park, Chan-Young;Song, Hye-Jung;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.35-39
    • /
    • 2012
  • 의미역 결정에 있어 의미 표지 부착 말뭉치는 필수적이지만 한국어 의미 표지 부착 말뭉치는 영어나 중국어와 같은 언어에 비하여 구축이 미비한 상황이다. 본 논문에서는 한국어 의미 분석을 위한 한국어 Proposition Bank(이하 PropBank)와 세종 의미 표지 부착 말뭉치의 구축을 위한 소프트웨어 도구를 개발하였다. 본 논문에서 구현한 도구는 문장 성분의 의존관계를 이용하여 주어진 술어에 대한 논항을 찾아주고, PropBank 프레임 파일과 세종 용언 격틀 사전을 활용하여 사용자가 능률적으로 한국어 PropBank와 세종 의미 표지 부착 말뭉치를 구축할 수 있도록 하였다.

  • PDF

GORank: Semantic Similarity Search for Gene Products using Gene Ontology (GORank: Gene Ontology를 이용한 유전자 산물의 의미적 유사성 검색)

  • Kim, Ki-Sung;Yoo, Sang-Won;Kim, Hyoung-Joo
    • Journal of KIISE:Databases
    • /
    • v.33 no.7
    • /
    • pp.682-692
    • /
    • 2006
  • Searching for gene products which have similar biological functions are crucial for bioinformatics. Modern day biological databases provide the functional description of gene products using Gene Ontology(GO). In this paper, we propose a technique for semantic similarity search for gene products using the GO annotation information. For this purpose, an information-theoretic measure for semantic similarity between gene products is defined. And an algorithm for semantic similarity search using this measure is proposed. We adapt Fagin's Threshold Algorithm to process the semantic similarity query as follows. First, we redefine the threshold for our measure. This is because our similarity function is not monotonic. Then cluster-skipping and the access ordering of the inverted index lists are proposed to reduce the number of disk accesses. Experiments with real GO and annotation data show that GORank is efficient and scalable.

An Approach for Implementing PCI Express Interface Based Storage System for Wideband Observation Data

  • Song, Min-Gyu;Kang, Yong-Woo;Kim, Hyo-Ryung;Nam, Uk-Won
    • The Bulletin of The Korean Astronomical Society
    • /
    • v.40 no.2
    • /
    • pp.57.1-57.1
    • /
    • 2015
  • VLBI에서 관측 대역폭이 n배 증가될 경우 관측감도는 sqrt(n)만큼 향상되고, 이는 관측 연구 측면에서 기존에는 불가능하던 천체에 대한 연구 수행이 가능함을 의미한다. 관측 대역폭의 확대는 관측 데이터의 용량 증가를 의미하며 여기서 해당 데이터의 처리를 위한 초고속 데이터 기록시스템은 핵심적 역할을 한다. 이에 따라 현재 KVN에서는 미국 MIT Haystack 천문대에서 개발된 초고속 기록시스템인 Mark5B/B+와 Mark6를 운용 중에 있다. 하지만 이들 시스템의 경우 사실상 VLBI연구를 위한 목표로 특수 개발되었기에 유지 및 운영 측면에서 여러 불편이 있고, 성능에 있어서도 단일 스트림 기준으로 8Gbps를 넘지 못하는 한계를 안고 있다. 본 발표에서는 기존 시스템을 대체할 수 있는 기술로서 PCI 익스프레스 기반의 데이터 처리를 소개하고자 한다. 나아가 실제 관측 데이터에 대한 입출력 및 기존 시스템과의 성능 비교를 통해 광대역 관측 연구에 최적화된 기록 시스템을 제안하고자 한다.

  • PDF

Synthesis of Korean Predicates in Japanese-Korean MT System Using Semantic Features for Modality (일-한 기계 번역 시스템의 한국어 생성에서 양상류 의미자질을 이용한 술부 처리)

  • Kim, Eun-Ja;Heo, Nam-Won;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.547-557
    • /
    • 1993
  • 본 논문에서는 일-한 기계 번역 시스템에서 한국어 생성에 대한 효율적인 방법을 제안한다. 일본어와 한국어는 대부분의 문법 체계가 비슷하지만 어절 내, 특히 술부 내에서는 문법 형태소의 어순이 일치하지 않고 형태소간에도 일대일 대응이 불가능한 경우가 많다. 또한 일본어 용언에 부정의 조동사가 사용된 문장을 한국어로 번역할 때에도 부정의 뜻을 내포하는 한국어 용언이 존재하면 부정적 역어로 생성하여야 한다. 이러한 점으로 인하여 형태소 대 형태소를 일대일로 대응시켜 생성하면 자연스럽고 올바른 한국어 문장을 얻기 어렵다. 따라서 기본적으로 직접 번역 방시을 이용하면서 술부의 생성을 위하여 양상류 의미자질을 이용하는 방법을 제안한다. 본 논문에서 제안한 한국어 생성 방법은 기존의 방법보다 적은 사전 작업으로 간단하게 자연스러운 한국어 표현을 얻을 수 있었다.

  • PDF

Detecting Errors in Dependency Treebank through XGBoost and Cross Validation (XGBoost와 교차 검증을 이용한 구문분석 말뭉치에서의 오류 탐지)

  • Choi, Min-Seok;Kim, Chang-Hyun;Cheon, Min-Ah;Park, Hyuk-Ro;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.103-107
    • /
    • 2020
  • 의존구조 말뭉치는 자연언어처리 분야에서 문장의 의존관계를 파악하는데 널리 사용된다. 이러한 말뭉치는 일반적으로 오류가 없다고 가정하지만, 현실적으로는 다양한 오류를 포함하고 있다. 이러한 오류들은 성능 저하의 요인이 된다. 이러한 문제를 완화하려고 본 논문에서는 XGBoost와 교차검증을 이용하여 이미 구축된 구문분석 말뭉치로부터 오류를 탐지하는 방법을 제안한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로, 일반적인 분류기로서 오류를 검출할 수 없다. 본 논문에서는 분류기의 결과를 분석하여 오류를 검출하는 방법을 제안한다. 성능을 분석하려고 표본집단과 모집단의 오류 분포의 차이를 분석하였고 표본집단과 모집단의 오류 분포의 차이가 거의 없는 것으로 보아 제안된 방법이 타당함을 알 수 있었다. 앞으로 의미역 부착 말뭉치에 적용할 계획이다.

  • PDF

The Study of Josa Dictionary Construction for Korean-English Machine Translation (한영 기계 번역을 위한 조사 사전 구성에 관한 연구)

  • Choi, Jae-Hyuk;Kim, Kweon-Yang;Park, Sang-Gyu;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.219-224
    • /
    • 1989
  • 본 연구는 한영 기계 번역을 위한 사전 중에서 한국어 조사 사전에 대한 모델을 제시하였다. 특히 정확한 역어 선택을 위한 제약정보를 수집하는데 중점을 두었다. 지금까지의 한국어 조사에 대한 역어 선택 방법은 체언의 속성 정보에 의한 역어 선택과 default 역어의 선택이었다. 그러나 한국어의 한 조사에 대응하는 영어의 전치사의 수가 너무 많음으로 인하여 이러한 기존의 방법을 사용할 경우 고질의 변역은 기대할 수 없다. 따라서 본 논문에서는 정확한 역어의 선택을 위하여 조사의 격 분류와 체언의 속성 정보를 더욱 세분화 시키고, 이를 이용한 용언의 기본 구문 패턴을 재정립하였다. 또한 한 두개의 default 역어로 인한 번역의 부 정확성을 탈피하기 위하여 default 역어 및 체언의 속성 정보에 의한 역어를 용언의 의미적 분류에 의해 더욱 세분화시킴으로써 정확한 역어를 선택하는 방법을 제시하였다.

  • PDF

The Role of Phonology in Access of Semantic Information (단어의 의미 파악에 관여하는 음운 정보의 역할)

  • Park, Kwon-Saeng
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.505-512
    • /
    • 1997
  • 문자로 표기된 단어의 의미를 파악 과정에 음운 정보가 개입하는지를 결정하기 위해 3 개의 실험을 실시하였다. 예컨대, [동닙 신문]과 [목립 신문]을 제시하고 이들이 구(句)가 성립되는지를 판단케 한 실험 1에서는 [동닙 신문]을 "독립 신문"으로 오판한 확률이 [목립 신문]을 "독립 신문"으로 오판한 확률보다 낮았다. [국립]과 [공립] 그리고 [궁닙]과 [공립]을 각각 차례로 제시하고, 두 번째 제시된 단어("공립")를 명명하는 데 소요된 시간을 측정한 실험 2에서는, 앞서 제시된 [궁닙]이 뒤에 제시되는 [공립]의 명명을 다소 용이하게 하였지만 그 정도는 미미하였으며, 앞서 제시된 [국립]이 [공립]의 명명을 촉진시킨 것에 크게 못 미쳤다. 실험 2에서와 동일한 자극 재료에다, 명명과제 대신 어휘판단 과제를 이용한 실험 3에서는 "국립"과 동음인 비단어 [궁닙]이 [정립]보다는 [공립]의 인식을 촉진시켰지만, [국립]이 [공립]인식을 촉진시진 정도에는 크게 못미쳤다. 이들 결과를 종합하면, 음운 정보는 의미 파악에 부수적인 도움 정도만 제공한다는 결론이 도출된다.

  • PDF

The Role of Semantic Representation of Verbs and Inference in the Interpretation of Missing Objects in Korean Discourse (목적어 생략에 대한 동사의 의미표상 및 추론의 역할)

  • Cho, Sook-Whan
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.457-461
    • /
    • 2001
  • 본 논문은 동사의 의미표상과 명사의 한정성의 강호관계를 중심으로 목적어의 생략현상을 검토하였다. 한국어는 영어 같은 언어와 달리 주어, 목적어 등이 자주 생략된다. 이 연구는 한국어의 목적어 생략이 단순히 인간성 (humanness), 주체성 (agency), 한정성(definiteness) 등 명사의 의미자질에 의해서만 결정되는 것이 아니라, 다음 두 가지 제약이 결정적으로 작용함을 제안하고자 한다. 첫째, 목적어 생략은 행동양상 (mold of agent act)과 원인 (cause)을 심층적으로 포함하는 소위 '핵심 타동사 (core transitive)'와 선행사의 한정성 정도에 의해 결정되는데, 구체적으로 목적어 생략은 한정성 자질을 가진 선행사가 없는 담화에서는 허용되지 않는다는 제약이다. 둘째, 타동사와 명사의 한정성과는 독립적으로, 한국어의 목적어 생략은 또한, 추론에 의거하여 보다 더 적절히 해석될 수 있는 경우를 실증적으로 보이고자 한다.

  • PDF

The Declarations Reconstruction Technique for the Symbol Table Verification of the Object-oriented Compiler (객체지향 컴파일러의 심벌 테이블 검증을 위한 선언문 복원 기법)

  • Son, Min-Sung;Kwon, Hyeok-Ju;Kim, Young-Keun;Lee, Yang-Sun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.669-672
    • /
    • 2006
  • 본 연구팀은 유비쿼터스 게임 플랫폼을 위한 Embedded C++ 컴파일러를 개발하였으며, 컴파일러 개발 과정에서 객체지향언어인 C++과 Java 언어를 모두 수용할 수 있는 심벌 테이블을 설계하였다. 심벌 테이블은 컴파일러의 어휘 분석과 구문 분석 과정을 거친 후 SDT(syntax-directed translation)에 의해 생성된 AST(Abstract Syntax Tree)를 분석하여 인식된 명칭(identifier)과 그 속성(attribute)들을 수집하여 저장하는 자료구조로써, 심벌 테이블에 저장된 속성들은 의미 분석(semantic analysis) 단계에서 수집된 속성과 참조된 명칭의 사용이 타당한지를 검사하고, 코드 생성(code generation) 단계에서 올바른 코드가 생성되도록 하는 중요한 요소이다. 따라서 심벌 테이블의 설계가 올바른지와 입력된 속성이 정확한지에 대한 검증과 분석은 필수 불가결하다. 본 논문에서는 컴파일러 개발과정에서 설계한 심벌 테이블을 검증하고 분석하기 위한 목적으로써 심벌 테이블을 이용하여 선언문을 복원시키는 역번역기(detranslator)에 대하여 기술한다. 구현된 역번역기는 C++ 컴파일러와 Java 컴파일러의 선언문 처리 과정에서 심벌 테이블에 입력된 속성들을 본래의 입력 프로그램으로 역번역한다. 따라서 역번역기를 통하여 심벌 테이블의 완전성과 심벌 테이블에 입력된 속성 정보의 정확성을 쉽게 검증할 수 있으며, 역번역과 함께 출력되는 디버그 정보를 이용하여 효율적으로 컴파일러의 개발과 수정을 할 수 있다.

  • PDF