• 제목/요약/키워드: 의미역 처리

검색결과 145건 처리시간 0.024초

복잡하고 다양한 정보 속에서 빠른 정보 처리 디자인 -색의 범주화를 통한 빠른 정보처리 (The Design for the fast process in the complex and various information.)

  • 민경근
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.1150-1155
    • /
    • 2009
  • 정보화 사회에서 정보의 양은 기술의 발달로 급격하게 증가하고 있다. 그로 인해 정보의 다양화와 복잡성 또한 증가하여 빠른 정보처리에 어려움을 주고 있다. 정보의 복잡성 속에 정보의 구조화, 범주화는 사용자가 쉽게 정보에 접근할 수 있게 만들며 처리 속도도 빠르게 해 준다. 본 연구는 정보의 범주화에서 색을 통한 범주화가 정보처리 속도 향상에 어떠한 영향을 주는지를 실험적으로 확인해 보려 한다. 실험 1은 복잡한 정보를 가진 노선도에서 역을 찾는 과제를 시행 하였을 때, target 역 이름의 색과 노선의 색이 동일 할 때 그렇지 않는 경우 보다 탐색시간을 빠름을 보여주고자 한다. 그리고 실험2는 단어 분류 과제에서 색의 범주화가 단어의미 범주화 보다 빨리 처리되며, 색의 대비가 클 때 더 효과적임을 보여 주고자 한다.

  • PDF

한국어 PropBank 및 세종 의미 표지 부착 말뭉치 구축을 위한 도구 (Annotation Tool for Construction Korean PropBank and Sejong Semantic Tagged Corpus)

  • 한대용;최한길;이정국;김종대;박찬영;송혜정;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.35-39
    • /
    • 2012
  • 의미역 결정에 있어 의미 표지 부착 말뭉치는 필수적이지만 한국어 의미 표지 부착 말뭉치는 영어나 중국어와 같은 언어에 비하여 구축이 미비한 상황이다. 본 논문에서는 한국어 의미 분석을 위한 한국어 Proposition Bank(이하 PropBank)와 세종 의미 표지 부착 말뭉치의 구축을 위한 소프트웨어 도구를 개발하였다. 본 논문에서 구현한 도구는 문장 성분의 의존관계를 이용하여 주어진 술어에 대한 논항을 찾아주고, PropBank 프레임 파일과 세종 용언 격틀 사전을 활용하여 사용자가 능률적으로 한국어 PropBank와 세종 의미 표지 부착 말뭉치를 구축할 수 있도록 하였다.

  • PDF

GORank: Gene Ontology를 이용한 유전자 산물의 의미적 유사성 검색 (GORank: Semantic Similarity Search for Gene Products using Gene Ontology)

  • 김기성;유상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.682-692
    • /
    • 2006
  • 유사한 생물학적 특성을 가진 유전자 산물을 검색하는 것은 생물정보학 연구에 필수적인 기술이다. 현재 대부분의 생물학 데이타베이스에서 Gene Ontology의 용어를 사용하여 유전자 산물의 생물학적 특성을 기술하고 있다. 본 논문에서는 이런 유전자 산물의 주석 정보를 사용해 의미적으로 유사한 유전자 산물을 검색하는 방법을 제안한다. 이를 위해 우선 정보 이론에 기반한 유전자 산물간의 의미적 유사도를 정의하였다. 그리고 이 유사도를 이용한 의미적 유사성 검색 알고리즘을 제안하였다. 의미적 유사성 검색을 처리하기 위해 Fagin의 문턱값 알고리즘(threshold algorithm)을 다음과 같이 변형한 기법을 사용하였다. 우선 사용하는 유사도 함수가 단조 증가 성질을 갖지 않기 때문에 유사도 함수에 맞는 문턱값을 재정의 하였다. 또 역색인 리스트의 구조를 사용하여 중간 검색을 생략할 수 있는 클러스터 스키핑 기법과 역색인 리스트 액세스 순서를 제안하였다. 실제 GO와 주석 정보를 이용하여 성능 평가를 했으며 제안한 알고리즘은 효율적인 알고리즘임을 보였다.

An Approach for Implementing PCI Express Interface Based Storage System for Wideband Observation Data

  • Song, Min-Gyu;Kang, Yong-Woo;Kim, Hyo-Ryung;Nam, Uk-Won
    • 천문학회보
    • /
    • 제40권2호
    • /
    • pp.57.1-57.1
    • /
    • 2015
  • VLBI에서 관측 대역폭이 n배 증가될 경우 관측감도는 sqrt(n)만큼 향상되고, 이는 관측 연구 측면에서 기존에는 불가능하던 천체에 대한 연구 수행이 가능함을 의미한다. 관측 대역폭의 확대는 관측 데이터의 용량 증가를 의미하며 여기서 해당 데이터의 처리를 위한 초고속 데이터 기록시스템은 핵심적 역할을 한다. 이에 따라 현재 KVN에서는 미국 MIT Haystack 천문대에서 개발된 초고속 기록시스템인 Mark5B/B+와 Mark6를 운용 중에 있다. 하지만 이들 시스템의 경우 사실상 VLBI연구를 위한 목표로 특수 개발되었기에 유지 및 운영 측면에서 여러 불편이 있고, 성능에 있어서도 단일 스트림 기준으로 8Gbps를 넘지 못하는 한계를 안고 있다. 본 발표에서는 기존 시스템을 대체할 수 있는 기술로서 PCI 익스프레스 기반의 데이터 처리를 소개하고자 한다. 나아가 실제 관측 데이터에 대한 입출력 및 기존 시스템과의 성능 비교를 통해 광대역 관측 연구에 최적화된 기록 시스템을 제안하고자 한다.

  • PDF

일-한 기계 번역 시스템의 한국어 생성에서 양상류 의미자질을 이용한 술부 처리 (Synthesis of Korean Predicates in Japanese-Korean MT System Using Semantic Features for Modality)

  • 김은자;허남원;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.547-557
    • /
    • 1993
  • 본 논문에서는 일-한 기계 번역 시스템에서 한국어 생성에 대한 효율적인 방법을 제안한다. 일본어와 한국어는 대부분의 문법 체계가 비슷하지만 어절 내, 특히 술부 내에서는 문법 형태소의 어순이 일치하지 않고 형태소간에도 일대일 대응이 불가능한 경우가 많다. 또한 일본어 용언에 부정의 조동사가 사용된 문장을 한국어로 번역할 때에도 부정의 뜻을 내포하는 한국어 용언이 존재하면 부정적 역어로 생성하여야 한다. 이러한 점으로 인하여 형태소 대 형태소를 일대일로 대응시켜 생성하면 자연스럽고 올바른 한국어 문장을 얻기 어렵다. 따라서 기본적으로 직접 번역 방시을 이용하면서 술부의 생성을 위하여 양상류 의미자질을 이용하는 방법을 제안한다. 본 논문에서 제안한 한국어 생성 방법은 기존의 방법보다 적은 사전 작업으로 간단하게 자연스러운 한국어 표현을 얻을 수 있었다.

  • PDF

XGBoost와 교차 검증을 이용한 구문분석 말뭉치에서의 오류 탐지 (Detecting Errors in Dependency Treebank through XGBoost and Cross Validation)

  • 최민석;김창현;천민아;박혁로;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.103-107
    • /
    • 2020
  • 의존구조 말뭉치는 자연언어처리 분야에서 문장의 의존관계를 파악하는데 널리 사용된다. 이러한 말뭉치는 일반적으로 오류가 없다고 가정하지만, 현실적으로는 다양한 오류를 포함하고 있다. 이러한 오류들은 성능 저하의 요인이 된다. 이러한 문제를 완화하려고 본 논문에서는 XGBoost와 교차검증을 이용하여 이미 구축된 구문분석 말뭉치로부터 오류를 탐지하는 방법을 제안한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로, 일반적인 분류기로서 오류를 검출할 수 없다. 본 논문에서는 분류기의 결과를 분석하여 오류를 검출하는 방법을 제안한다. 성능을 분석하려고 표본집단과 모집단의 오류 분포의 차이를 분석하였고 표본집단과 모집단의 오류 분포의 차이가 거의 없는 것으로 보아 제안된 방법이 타당함을 알 수 있었다. 앞으로 의미역 부착 말뭉치에 적용할 계획이다.

  • PDF

한영 기계 번역을 위한 조사 사전 구성에 관한 연구 (The Study of Josa Dictionary Construction for Korean-English Machine Translation)

  • 최재혁;김권양;박상규;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.219-224
    • /
    • 1989
  • 본 연구는 한영 기계 번역을 위한 사전 중에서 한국어 조사 사전에 대한 모델을 제시하였다. 특히 정확한 역어 선택을 위한 제약정보를 수집하는데 중점을 두었다. 지금까지의 한국어 조사에 대한 역어 선택 방법은 체언의 속성 정보에 의한 역어 선택과 default 역어의 선택이었다. 그러나 한국어의 한 조사에 대응하는 영어의 전치사의 수가 너무 많음으로 인하여 이러한 기존의 방법을 사용할 경우 고질의 변역은 기대할 수 없다. 따라서 본 논문에서는 정확한 역어의 선택을 위하여 조사의 격 분류와 체언의 속성 정보를 더욱 세분화 시키고, 이를 이용한 용언의 기본 구문 패턴을 재정립하였다. 또한 한 두개의 default 역어로 인한 번역의 부 정확성을 탈피하기 위하여 default 역어 및 체언의 속성 정보에 의한 역어를 용언의 의미적 분류에 의해 더욱 세분화시킴으로써 정확한 역어를 선택하는 방법을 제시하였다.

  • PDF

단어의 의미 파악에 관여하는 음운 정보의 역할 (The Role of Phonology in Access of Semantic Information)

  • 박권생
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.505-512
    • /
    • 1997
  • 문자로 표기된 단어의 의미를 파악 과정에 음운 정보가 개입하는지를 결정하기 위해 3 개의 실험을 실시하였다. 예컨대, [동닙 신문]과 [목립 신문]을 제시하고 이들이 구(句)가 성립되는지를 판단케 한 실험 1에서는 [동닙 신문]을 "독립 신문"으로 오판한 확률이 [목립 신문]을 "독립 신문"으로 오판한 확률보다 낮았다. [국립]과 [공립] 그리고 [궁닙]과 [공립]을 각각 차례로 제시하고, 두 번째 제시된 단어("공립")를 명명하는 데 소요된 시간을 측정한 실험 2에서는, 앞서 제시된 [궁닙]이 뒤에 제시되는 [공립]의 명명을 다소 용이하게 하였지만 그 정도는 미미하였으며, 앞서 제시된 [국립]이 [공립]의 명명을 촉진시킨 것에 크게 못 미쳤다. 실험 2에서와 동일한 자극 재료에다, 명명과제 대신 어휘판단 과제를 이용한 실험 3에서는 "국립"과 동음인 비단어 [궁닙]이 [정립]보다는 [공립]의 인식을 촉진시켰지만, [국립]이 [공립]인식을 촉진시진 정도에는 크게 못미쳤다. 이들 결과를 종합하면, 음운 정보는 의미 파악에 부수적인 도움 정도만 제공한다는 결론이 도출된다.

  • PDF

목적어 생략에 대한 동사의 의미표상 및 추론의 역할 (The Role of Semantic Representation of Verbs and Inference in the Interpretation of Missing Objects in Korean Discourse)

  • 조숙환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.457-461
    • /
    • 2001
  • 본 논문은 동사의 의미표상과 명사의 한정성의 강호관계를 중심으로 목적어의 생략현상을 검토하였다. 한국어는 영어 같은 언어와 달리 주어, 목적어 등이 자주 생략된다. 이 연구는 한국어의 목적어 생략이 단순히 인간성 (humanness), 주체성 (agency), 한정성(definiteness) 등 명사의 의미자질에 의해서만 결정되는 것이 아니라, 다음 두 가지 제약이 결정적으로 작용함을 제안하고자 한다. 첫째, 목적어 생략은 행동양상 (mold of agent act)과 원인 (cause)을 심층적으로 포함하는 소위 '핵심 타동사 (core transitive)'와 선행사의 한정성 정도에 의해 결정되는데, 구체적으로 목적어 생략은 한정성 자질을 가진 선행사가 없는 담화에서는 허용되지 않는다는 제약이다. 둘째, 타동사와 명사의 한정성과는 독립적으로, 한국어의 목적어 생략은 또한, 추론에 의거하여 보다 더 적절히 해석될 수 있는 경우를 실증적으로 보이고자 한다.

  • PDF

객체지향 컴파일러의 심벌 테이블 검증을 위한 선언문 복원 기법 (The Declarations Reconstruction Technique for the Symbol Table Verification of the Object-oriented Compiler)

  • 손민성;권혁주;김영근;이양선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.669-672
    • /
    • 2006
  • 본 연구팀은 유비쿼터스 게임 플랫폼을 위한 Embedded C++ 컴파일러를 개발하였으며, 컴파일러 개발 과정에서 객체지향언어인 C++과 Java 언어를 모두 수용할 수 있는 심벌 테이블을 설계하였다. 심벌 테이블은 컴파일러의 어휘 분석과 구문 분석 과정을 거친 후 SDT(syntax-directed translation)에 의해 생성된 AST(Abstract Syntax Tree)를 분석하여 인식된 명칭(identifier)과 그 속성(attribute)들을 수집하여 저장하는 자료구조로써, 심벌 테이블에 저장된 속성들은 의미 분석(semantic analysis) 단계에서 수집된 속성과 참조된 명칭의 사용이 타당한지를 검사하고, 코드 생성(code generation) 단계에서 올바른 코드가 생성되도록 하는 중요한 요소이다. 따라서 심벌 테이블의 설계가 올바른지와 입력된 속성이 정확한지에 대한 검증과 분석은 필수 불가결하다. 본 논문에서는 컴파일러 개발과정에서 설계한 심벌 테이블을 검증하고 분석하기 위한 목적으로써 심벌 테이블을 이용하여 선언문을 복원시키는 역번역기(detranslator)에 대하여 기술한다. 구현된 역번역기는 C++ 컴파일러와 Java 컴파일러의 선언문 처리 과정에서 심벌 테이블에 입력된 속성들을 본래의 입력 프로그램으로 역번역한다. 따라서 역번역기를 통하여 심벌 테이블의 완전성과 심벌 테이블에 입력된 속성 정보의 정확성을 쉽게 검증할 수 있으며, 역번역과 함께 출력되는 디버그 정보를 이용하여 효율적으로 컴파일러의 개발과 수정을 할 수 있다.

  • PDF