• Title/Summary/Keyword: 존재의 언어

Search Result 711, Processing Time 0.021 seconds

Solution Method and Embodying of Adverb's Positioning Restrictions and Orderings for Korean-English Machine Translation (한.영 기계 번역을 위한 부사의 위치 및 순서제약 해결의 방안 및 구현)

  • Jo, Jun-Mo;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.163-167
    • /
    • 1994
  • 본 논문에서는 한국어 문장을 입력으로 받아 영어문장을 생성해 내는 한 영 기계번역 시스템에서 부사를 처리함으로써 더욱 자연스러운 역어생성을 꾀하였다 특히, 한국어보다 어순의 제약이 심한 영어를 처리함에 있어서 이들 부사의 위치 및 순서는 자연스러운 역어생성을 하기 위해서는 중요한 요소가 된다. 즉, 부사의 종류에 따라서 문장에서의 위치가 다르며, 한 문장내에서 2개 이상의 부사가 존재 할 때는 이를 부사의 순서를 정해 주어야 한다. 또한, 부사의 처리 없이는 이와 관련된 완료시제와 같은 관련 영역의 처리가 어렵다. 이러한 처리를 위해서, 한 영 기계번역 시스템의 목적에 알맞게 부사들의 특성을 조사하여 이들을 분류하였고, 이것을 기초로 하여 부사의 위치, 순서등의 처리를 하도록 하였다.

  • PDF

A Long Sentence Segmentation for the Efficient Analysis in English-Korean Machine Translation (영한 기계번역에서 효율적인 분석을 위한 긴 문장의 분할)

  • Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.89-96
    • /
    • 2005
  • 본 연구에서는 영한 기계 번역에서 20단어 이상의 긴 문장을 보다 정확히 분석하기 위하여 문장을 복수개의 의미 있는 절로 분할하고자 한다. 긴 문장은 구문 분석을 시도할 때, 시간적으로 또는 공간적으로 급격히 증가하는 자원을 소모시킨다. 이러한 문제를 해결하기 위하여, 본 연구에서는 긴 문장에서 분할 가능한 지점을 인식하여 이러한 지점을 중심으로 여러 개의 절을 생성한 후, 이 절을 개별적으로 분석하고자 하였다. 문장을 분할하기 위해서 일단 문장 내부에 존재하고 있는 분할이 가능한 지점을 선택하고, 선택된 지점을 중심으로 문맥 정보를 표현하는 입력 벡터를 생성하였다. 그리고 Support Vector Machine (SVM)을 이용하여 이러한 후보 지점의 특성을 학습하여 향후 긴 문장이 입력되었을 때 보다 정확하게 분할점을 찾고자 하였다. 본 논문에서는 SVM의 보다 좋은 학습과 분류를 위하여 내부 커널로써 다항 커널 (polynomial kernel)을 사용하였다. 그리고 실험을 통하여 약 0.97의 f-measure 값을 얻을 수 있었다.

  • PDF

KorQATeC2.0: Construction of Test Collection for Evaluation of Question Answering System (KorQATeC2.0: 질의/응답 시스템의 성능 평가를 위한 평가집합 구축)

  • Kim, Jae-Ho;Lee, Kyung-Soon;Oh, Jong-Hoon;Chang, Du-Seong;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.397-404
    • /
    • 2001
  • 본 논문에서는 질의/응답 시스템의 평가를 위해 구축된 평가집합 (Korean Question Answering Test Collection 2.0: KorQATeC2.0)에 대하여 기술한다. KorQATeC2.0은 총 120개의 질의와 207,067개의 문서로 구성되어 있으며, 120개의 질의는 질의에 대한 정답을 제시하는 방식에 따라 기본 과제 질의, 나열 과제 질의, 문맥 과제 질의, 요약 과제 질의로 나누어진다. 또한 KorQATeCl.0과는 달리 여러 문서를 참조하여 정답을 구성하는 질의와 문서집합에 정답이 존재하지 않는 질의를 포함시킴으로써 질의/응답 시스템의 평가를 다양하게 할 수 있도록 하였다. 본 논문에서 기술하는 평가집합은 질의/응답 시스템의 객관적 평가를 가능하게 한다는 점에서 그 의의가 있다.

  • PDF

The Study of Automatic Hypertext Generation using the Syntactic and Semantic Similarity (구문적 유사도와 의미적 유사도를 이용한 하이퍼텍스트 자동생성에 관한 연구)

  • Kim, Mun-Seok;Nam, Se-Jin;Shin, Dong-Wook
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.424-429
    • /
    • 1996
  • 본 논문에는 일반문서를 대상으로 하여 그 문사를 하이퍼텍스트(hypertext)로 자동변환하는 기법을 제안하고자 한다. 자동변환의 과정은 대상 문서에서 키워드(keyword)의 인식, 문서를 노드(node) 단위로 분리, 키워드로부터 노드로의 링크(ink) 생성의 3 단계로 이루어 진다. 기존의 연구에서는 문서에서 노드를 분리하는데 구문적 유사도만을 이용하는데, 본 논문에서는 양질의 하이퍼텍스트를 생성하기 위하여 구문적 유사도(syntactic similarity)뿐만 아니라 의미적 유사도(semantic similarity)를 사용한다. 구문적 유사도는 tf*idf와 벡터 곱(vector product)을 이용하고, 의미적 유사도는 시소러스(thesaurus)와 부분부합(partial match)을 이용하여 계산되어 진다. 또 링크 생성시 잘못된 링크의 생성을 막기 위하여 시소러스를 이용하여 시소러스에 존재하는 용어에 한해서 링크를 생성한다.

  • PDF

Korean Spell Correction Using Collocation of Morphemes (형태소간의 의존 관계에 따른 오류 유형 추정 함수를 이용한 한국어 철자 오류 교정)

  • Sim, Chul-Min;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.493-498
    • /
    • 1994
  • 기존 철자 검사/교정기들은 한 어절을 구성하는 형태소들의 품사 정도만을 이용하고 있다. 때문에 철자 검사나 교정의 정확도 면에서 한계를 가진다. 본 논문에서는 한국어의 구문적 연관 관계 및 구문 내에 존재하는 단어들 간의 의미적 연관관계 등을 바탕으로 오류 유형을 추정하는 오류 유형 추정 함수를 제안하고, 이를 이용한 철자 교정기를 구현하였다. 본 논문에서 구현한 오류 유형 추정 함수를 이용한 철자 검사/교정기는 한 어절에 국한되었던 철자 검사/교정의 범위를 여러 어절로 확장하고자 하는 시도의 시발이라 할 수 있다. 따라서 구문 검사 및 의미 검사를 수행하는 문체 검사기의 원형으로서 그 의의를 가진다.

  • PDF

An Agent-Based System Integration and Automation Framework (에이전트 기반 시스템 통합 및 자동화 방안)

  • 이재호;이기훈
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.385-391
    • /
    • 2002
  • 하나의 에이전트로 해결하기 어려운 복잡한 문제를 해결하기 위한 방안으로 여러 에이전트들간의 상호작용과 협동을 통하여 작업이 수행되는 멀티에이전트 시스템을 구현하는 것이 점차 보편화되고 있다. 멀티에이전트 시스템의 중요한 특징 중의 하나는 여러 에이전트들 간의 능력과 정보가 서로 공유된다는 점이다. 멀티에이전트 시스템에서는 한 에이전트의 처리 견과론 다른 에이전트가 이용할 수도 있으며, 그 결과 또한 다시 다른 에이전트에게 제공되기도 한다. 그러나 각각의 에이전트들은 서로 다른 환경 하에서 구축된 이형질성과 원격지에서 작동하는 분산성으로 인해 하나의 시스템으로 통합하기가 용이하지 않다. 이를 해결하기 위한 방법의 하나로 이형질의 에이전트들 간에 정보 교환을 위한 파일랩퍼 (File Wrapper) 이용 방안이 있다. 한 에이전트의 처리 결과가 파일이라는 일반적인 형태로 존재한다고 할 때, 이러한 파일내의 정보를 추출하고 조합 및 가공하는 기능을 담당하는 것을 파일랩퍼(File Wrapper)라고 한다. 본 연구에서는 Java와 JavaCC를 이용하여 에이전트 스크립트 언어로 새롭게 구현된 파일랩퍼를 소개한다. 이 파일랩퍼는 파일에서 정보를 추출하기 위한 명령어들과 출력에 관련한 명령어들 그리고 작업의 효율성을 위한 명령어들로 구성된 텍스트 기반 언어로 구성되어 있다.

  • PDF

An Efficient Approach to Testing Retargetable Compiler Using Intermediate Representation (중간표현을 이용한 재목적 컴파일러의 효율적인 테스트 방법)

  • Jang, Han-Il;Woo, Gyun;Chae, Heung-Seok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.575-579
    • /
    • 2006
  • 컴파일러에 결함이 있다는 것은 곧 잘못된 코드를 생성한다는 것을 의미하므로 양질의 컴파일러 구성은 양질의 소프트웨어 생산을 위한 기본 요구조건이 된다. 임베디드 시스템이 널리 사용되면서 더욱 다양하고 복잡한 임베디드 프로세서가 개발되었고 이는 새로이 설계된 프로세서를 위한 새로운 컴파일러 개발의 필요를 야기하고 있다. 본 논문에서는 프로그램의 중간 표현을 기반으로 하는 효율적인 테스팅 방법을 제안한다. 언어의 구문 규칙을 모두 사용하는 테스트 케이스를 통해 컴파일러를 테스트하는 방법이 이미 연구되었으나, 기존의 소스 코드 수준의 방법으로는 테스트 케이스의 중복성이 존재하는 단점이 있다. 본 논문에서는 중간 표현의 구문 규칙을 이용해서 중복된 테스트 케이스를 제거하여 테스팅 효율을 증가시킬 수 있음을 기술한다. 또한 본 논문에서 제안하는 방법을 GCC의 중간 언어인 RTL에 적용한 예를 통해 설명한다.

  • PDF

Application portable Part-Of-Speech tagger mapping (응용을 위한 폼사 태깅 시스템의 매핑)

  • 김준석;차정원;이근배
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.368-375
    • /
    • 2000
  • 품사 태깅 시스템은 자연 언어 처리의 가장 기본이 되는 부분으로 상위 자연 언어 처리 분야인 구문분석, 의미분석의 전처리로 사용되거나, 기계번역, 정보검색이나 음성인식 및 합성등과 같은 많은 응용 시스템을 위해서도 필요하다. 이렇게 여러 가지 목적을 위해 품사 태깅 시스템은 존재하는데, 각각의 응용을 위해서 최적화된 태깅 시스템을 따로 구성하기도 하고, 하나의 태깅 시스템을 여러 가지 응용을 위해서 사용하기도 한다. 이때, 문제가 되는 것 중에 하나는 각 응용마다 요구하는 품사 태그 세트가 다르다는 것이다. 품사 태그세트가 고정되어 있다면 어떤 응용을 위해서는 사용되는 품사 태그세트가 너무 적어서 문제가 되고, 반대로 품사태그세트가 너무 많아서 시스템의 수행속도가 중요시되는 응용에서 성능저하의 요인이 되기도 한다. 본 논문에서는 하나의 태깅 시스템의 품사태그세트를 조절할 수 있도록 하여 몇 가지 응용시스템에 맞게 최적화 시킬 수 있는 방법론을 제시하고 실험을 통해서 시스템의 성능, 유지보수 및 시스템의 여러 리소스 관리 측면에서도 가장 효율적인 방법론임을 입증하고자 한다.

  • PDF

Multi-Layed Context Modeling Based on Ontology in an Effective Representation of Various Domains (다양한 도메인의 효율적 표현을 위한 온톨로지 기반의 다계층 컨텍스트 모델링)

  • Jung Minsun;Moon Mikyoung;Kim Youngbong;Yeom Keunhyuk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.412-414
    • /
    • 2005
  • 유비쿼터스 컴퓨팅 환경의 실현 가능성이 높아지면서 사용자가 존재하는 장소와 그곳의 환경에 따른 맞춤 서비스의 제공이 요구된다. 이러한 맞춤 서비스를 제공하기 위해서는 사용자 주변 환경을 인지 및 판단하여 서비스를 제공하는 소프트웨어가 필요하다. 소프트웨어가 환경을 인지하여 처리하려면 환경은 소프트웨어가 이해할 수 있도록 모델링 되고 언어로 표현되어야 한다. 기존의 Context 모델링 방법은 특정 상황에 초점이 맞추어져있어 다른 상황에의 적용이 쉽지 않다. 본 논문에서는 다양한 도메인에 적용 가능한 다단계 상황 모델링 방법, 이를 ontology언어 OWL을 사용하여 나타내는 방법, 이것을 적용하기 위한 적응형 소프트웨어 개발 framework를 제시한다.

  • PDF

수 개념의 새로운 시각

  • Park, Yong-Beom
    • Communications of Mathematical Education
    • /
    • v.11
    • /
    • pp.251-258
    • /
    • 2001
  • 인간의 내면에서 일어나는 여러 가지 변화들을 인간의 지식으로써 표현하는 것이 여러 언어적인 표현이다. 그러나 인간이 무엇을 알고 있는가에 대하여, 표현하기란 그 누구도 결코 불가능한 것일 수도 있고 그렇지 않을 수도 있다. 그리고 인간의 지식을 표현하는 언어로서 자문자답한다고 하더라도 그 결과는 역시 알 수 없는 미궁으로 빠지게 됨을 그 누구나 공감하게 된다. 그렇다고 한다면 수를 보는 시각과 인류 문명에 대한 시각, 그리고 인간사고에 대해서도 이제 새롭게 볼 수 있는 시각이 요구되고 있다. 새로운 시각으로 수의 성질을 크게 존재 ${\cdot}$ 법칙 ${\cdot}$ 구조와 질서 ${\cdot}$${\cdot}$ 양과 질 ${\cdot}$ 통일로 분류하여 알아보았다. 다른 한편으로는 개인의 수 개념 형성에 초점을 둔 Piaget이론을 소개하고 있다 그리고 경험주의 선구자인 Dewey의 수 개념을 소개하고 있다. 역사와 수, 인체와 수에서는 동이와 수리사상이 인체와 관련된다는 사실은 동 ${\cdot}$ 서양을 막론하고 확인되고 있다. 인체와 수에 대한 것을 동양인 중국 문화권에서 일(一)부터 십(十)까지의 기호를 인체와 연결시켜 소개하였다. 수의 본질을 알고 이해하는 것이 곧 자연현상의 이해이며 그 자연의 일부인 인간을 이해하고 동시에 역사를 이해하는 기본이라 아니할 수 없을 것이다. 따라서 수를 보는 시각이 달라지지 않으면 수학을 기피하는 현상은 계속될 것이다.

  • PDF