• 제목/요약/키워드: 변환사전

검색결과 351건 처리시간 0.023초

공군 정보 영한 기계번역 시스템 L ALKOL (English-to-Korean Machine Translation System for Air Force Intelligence : ALKOL)

  • 이현아;임철수;최명석;강인호;김길창
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.315-322
    • /
    • 2000
  • 본 논문에서는 공군 정보 번역을 위한 영한 기계번역 시스템 ALKOL에 대해서 소개한다. ALKOL은 어휘화된 규칙에 기반한 번역 시스템으로, 어휘화된 규칙은 어휘-분석-변환-생성의 네 단계의 정보가 연결된 형태로 사전에 저장된다. 이와 같은 사전 구조에 의해 번역 과정의 효율성을 높일 수 있고, 어휘화된 규칙에 의해 정확하고 자연스러운 번역 결과를 얻을 수 있다. ALKOL의 번역 과정은 형태소 분석, 품사 태깅, 분석 전처리, 구문 분석, 변환, 생성의 단계로 이루어진다. 각 단계에서는 전/후처리를 보강하여 실제 번역 환경에서 나타나는 문제들을 해결하고, 하나 이상의 번역 결과를 출력하여 사용자가 원하는 결과를 선택할 수 있게 한다.

  • PDF

Wavelet 변환을 이용한 정면 얼굴 검출에 관한 연구 (A Study on Frontal Face Detection Using Wavelet Transform)

  • 이상범;최영규
    • 인터넷정보학회논문지
    • /
    • 제5권1호
    • /
    • pp.59-66
    • /
    • 2004
  • 대칭 영역 탐색은 대칭 정보를 이용하여 사전 정보 없이 얼굴영역을 추출 할 수 있다. 그러나 눈, 코, 입 등과 같은 얼굴의 특징 부위보다 탐색할 마스크의 크기가 커져야 함으로 이 방법은 계산 시간이 많이 걸린다. 본 논문에서는 얼굴 영상에 대하여 사전 정보 없이, 적은 계산량으로 얼굴 영역 추출이 가능하도록 대칭 영역 탐색 및 웨이블릿 변환을 이용하여 얼굴 영역의 추출과 그 특징에서의 대칭간에 따른 영상을 이용하여 원영상에서는 영역 분할을 통한 얼굴 영역 추출 방법을 제안하고 실험을 통하여 이를 확인하였다.

  • PDF

위치 정보를 위한 기술 모델 (DMLI) 설계 (A Design of DMLI (Description Model for Location Information))

  • 김재원;최오훈;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.34-36
    • /
    • 2006
  • 본 논문은 다양한 위치 획득 시스템에 따라 다른 형식을 가지는 위치 데이터와 이에 따른 표준의 차이를 해결하기 위해 DMLI(Description Model for Location Information)을 제안한다. DMLI는 다른 형식으로 표현된 위치 데이터에 대한 메타데이터를 재정의 하지 않고, 모두의 의미를 포괄하는 메타데이터로 재분류하는 분류체계 모델이다. DMLI는 시설물(Facility), 장소(Place), 서비스(Service) 요소들로 구성된다. 시설물은 공간을 정의하는 최상위 요소로 공간 사용목적과 용도 및 기능에 따른다. 장소는 시설물을 구성하는 최하위 요소다. 서비스는 장소에서 제공 가능한 서비스를 말한다. 또한 위치관련 메타데이터 요소간의 정보를 정의한 사전을 이용하여 기존의 위치 데이터에 대한 메타데이터 요소를 DMLI에서 제안한 메타데이터 요소로 변환이 가능하다. 사전을 이용함으로서 또 다른 형식의 위치 데이터가 입력되어도 DMLI 형식으로의 변환이 용의하다. DMLI 형식으로 재분류된 위치관련 메타데이터들은 공간 사용 목적과 제공 가능한 서비스를 명확히 표현한다. 또한 위치관련 검색, 통계 등의 서비스를 제공하는 어플리케이션을 통하여 다양하게 응용되어 사용된다.

  • PDF

운항사고 자료의 수량화 데이터 작성에 관한 연구 (The Conversion of Transportation Casualty Recording to Numerical Data)

  • 임정빈
    • 해양환경안전학회:학술대회논문집
    • /
    • 해양환경안전학회 2007년도 춘계학술발표회
    • /
    • pp.115-119
    • /
    • 2007
  • 본 연구의 목적은 선박관리회사에서 관리하는 선박의 운항사고를 사전에 예측하여 사고를 미연에 예방 또는 저감하고, 사고 발생시에는 신속 대처하여 사고결과 발생되는 손실을 최소화하기 위한 운항사고 예측 시스템을 개발하는데 있다. 이러한 운항사고 예측 시스템을 개발하기 위해서는 과거 문서로 작성된 사건을 숫자로 변환시킨 수량화 데이터 제작이 우선 필요하다. 수량화 데이터를 이용하면 통계기법을 적용하여 다양한 사건 사이에 숨어 있는 기본적인 요소를 축출할 수 있고, 이러한 요소 사이의 상관관계를 통하여 사고발생 수준을 숫자로 표시할 수 있기 때문에 사전에 해당 위험정도를 알 수 있다. 본 연구에서는 운항사고 예측 시스템 개발의 초보단계로서, 과거 사건기록을 수량화 데이터로 변환하기 위한 절차와 결과를 기술하였다.

  • PDF

중-한 대조분석정보를 이용한 단어정렬 (Word Alignment Using Chinese-Korean Linguistic Contrastive Information)

  • 리금희;김동일;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.40-46
    • /
    • 2002
  • 본 논문에서는 범용 병렬코퍼스에서도 적용할 수 있는 단어정렬의 방법을 제안한다. 단어 단위로 정렬된 병렬코퍼스는 자연언어처리의 다양한 분야에 도움을 준다. 예를 들면 변환기반의 기계번역에서 변환패턴의 구축, MWTU(Multi Word Translation Unit)의 자동추출, 사전 구축, 의미 중의성 해소 등 분야에 적용된다. 중한 병렬 코퍼스의 단어정렬은 서로 다른 어족간의 관계의 규명을 포함하고 있기 때문에 본 논문에서는 통계적인 모델보다 중한 대역어 사전, 단일어 시소러스, 품사정보 및 언어학적 대조분석 정보 등 기존에 있는 리소스를 이용하여 재현율과 정확률을 높이는 방법에 대해 제시한다. 성능 평가를 위해 중앙일보에서 임의로 추출한 500개 대응문장을 이용하여 실험한 결과 82.2%의 정확률과 64.8%의 재현율을 보였다.

  • PDF

공군 정보 영한 기계번역 시스템 : ALKOL (English-to-Korean Machine Translation System for Air Force Intelligence : ALKOL)

  • 이현아;임철수;최명석;강인호;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.315-322
    • /
    • 2000
  • 본 논문에서는 공군 정보 번역을 위한 영한 기계번역 시스템 ALKOL에 대해서 소개한다. ALKOL은 어휘화된 규칙에 기반한 번역 시스템으로, 어휘화된 규칙은 어휘-분석-변환-생성의 네 단계의 정보가 연결된 형태로 사전에 저장된다. 이와 같은 사전 구조에 의해 번역 과정의 효율성을 높일 수 있고, 어휘화된 규칙에 의해 정확하고 자연스러운 번역 결과를 얻을수 있다. ALKOL의 번역 과정은 형태소 분석, 품사 태깅, 분석 전처리, 구문 분석, 변환, 생성의 단계로 이루어진다. 각 단계에서는 전/후처리를 보강하여 실제 번역 환경에서 나타나는 문제들을 해결하고, 하나 이상의 번역 결과를 출력하여 사용자가 원하는 결과를 선택할 수 있게 한다.

  • PDF

한.중 교차언어 검색에서 시소러스를 이용한 질의 확장 (Query Expansion Using Thesaurus for Korean to Chinese Cross- Language Text Retrieval)

  • 김풍;강인수;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.538-540
    • /
    • 2003
  • 본 논문은 한.중 교차언어 검색을 위한 효과적인 질의 확장에 대해 기술하고 있다. 한.중 교차언어 검색은 한국어 질의로 중국어 문서를 검색하는 것이고 본 논문에서는 대역어 사전을 이용하여 한국어 질의를 중국어 질의로 변환하는 방식을 사용한다. 질의 확장을 위한 방법으로 중국어 시소러스인“동의사사림”을 사용하였다. 그리고 동의어들과 주변 단어간의 상호 정보를 비교함으로서 재현률과 정확률을 높였다. 실험을 통하여 검증한 결과 사전만 사용하여 변환하는 방법에 비하여 검색 성능이 향상되었다.

  • PDF

LEXml을 이용한 기계가독형 전자사전의 표식 (Describing a MachineReadable Electronic Dictionary using LEXml)

  • 정휘웅;윤애선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2006년도 춘계학술대회
    • /
    • pp.103-109
    • /
    • 2006
  • XML(extensible Markup Language)이 1996년 등장한 이후, 기존의 정보를 XML 기반으로 나타내기 위한 연구가 활발하게 이루어지고 있다. 언어자원(language Resource)과 관련된 분야는 80년대부터 그 연구가 있었으나, XML의 등장 이후, 보다 다양하고 특화된 영역의 정보를 구조화하기 위한 연구결과가 최근 소개되기 시작하였다. 본 연구에서는 이러한 분야 중 전자사전을 표식(markup)하는 XML기반 표준언어인 LEXml(Presentation/Representation of Entries in Dictionaries: LEXml)에 대하여 살펴보고, 기존에 XML로 구축된 전자사전을 LEXml로 변환하여, 그 구조의 확장성과 유효성을 검증할 것이다. 기반자료로써 2000년도에 구축된 MultiDICO의 불어 정보를 이용하였다. 이를 위해 MultiDICO의 XML문서 구조와 LEXml 구조 사이의 각 요소(element)별 대응표를 만들었으며, 이를 바탕으로 XSL(Extensible Style sheet Language)를 작성하였다. 본 연구결과 LEXml이 기존에 구축된 전자사전들을 표식하는데 어려움이 없을 뿐만 아니라, 기계가독성을 높일 수 있는 구조적 유연성이 매우 높은 것을 확인할 수 있었다.

  • PDF

WordNet을 이용한 한국어 시소러스 자동 구축 (Using WordNet for the Automatic Construction of Korean Thesaurus)

  • 이창기;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.156-163
    • /
    • 1999
  • 최근의 자연어 처리 분야의 연구들에서 광범위하고 완전한 어휘 지식 베이스의 필요성이 입증되었다. 영어권의 경우, 이에 대한 연구가 오래 전부터 있어 왔고, 그 결과로 현재 주로 사용되고 있는 개념체계에는 Roget's Thesaurus와 WordNet 등이 있다. 이러한 개념체계들은 자연어 처리의 여러 응용 분야에서 중요한 역할을 담담하고 있지만, 다른 언어의 경우 널리 사용되고 있는 개념체계가 없는 실정이다. 본 논문에서는 Princeton 대학의 WordNet을 기반으로 한영 사전과 국어 사전을 이용하여 한국어 명사의 개념체계를 자동으로 구축함으로써, 이미 구축되어진 다른 언어의 개념체계를 이용하여 새로운 언어의 개념체계를 자동으로 구축할 수 있음을 보인다. 먼저 한영 사전과 국어 사전으로부터 뽑아낸 한국어 단어 일부의 의미를 다양한 WSD(Word Sense Disambiguation) 방법을 적용시켜 WordNet의 synset에 자동으로 연결시킬 수 있음을 보인다. 그리고 각각의 자동변환으로 나온 결과들에 대해서 적용율과 정확도를 비교하도록 한다.

  • PDF

정보검색을 위한 자연언어 질의어의 불리언 질의로의 변환 (A System for converting natural language queries Into boolean queries for Information Retrieval)

  • 서광준;최기선;나동열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.258-261
    • /
    • 1994
  • 자연언어 인터페이스는 초보자나 비숙련가의 입장에서는 새로운 시스템의 적응에 있어서 어떤 학습도 필요하지 않다는 장점이 있다. 이 연구에서는 불리언 질의를 처리하는 정보검색 시스템의 자연언어 인터페이스를 구혐하였다. 즉, 한국어 자연언어 질의를 불리언 질의로 변환해주는 시스템이다. 접근 방법은 먼저 자연언어 질의를 구문 해석한 후에, 그 결과인 문자의 의존 구조와 불용어 정보를 사용하여 기본적인 불리언 질의를 만든다음, 시소러스를 이용하여 불리언 질의를 확장한다. 여기에서 사용한 구문 해석 방법은 기존 문법에 기반한 방법이다. 변환 시스템은 SPARC-II 호환기종에서 구현되었으며, 약 5만 단어의 사전을 사용한다. 가공된 120 개의 질의를 대상으로 실험한 결과, 전체 소요시간은 13.5초가 걸렸다. 그리고, 변환된 불리언 연산식중에 110개가 적절하게 변환된 것으로 조사되었다.

  • PDF