• Title/Summary/Keyword: 언어자원 구축

검색결과 136건 처리시간 0.042초

한국어 수분류사 어휘의미망 KorLexClas 1.5 (KorLexClas 1.5: A Lexical Semantic Network for Korean Numeral Classifiers)

  • 황순희;권혁철;윤애선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권1호
    • /
    • pp.60-73
    • /
    • 2010
  • 본 연구의 목적은 한국어 수분류사 체계를 설정하고, 수분류사와 공기명사 간 의미관계 정보를 제공하는 한국어 수분류사 어휘의미망 "KorLexClas 1.5"의 정보구조와 구축방식을 소개하는 데 있다. KorLex 명사, 동사, 형용사, 부사가 영어 워드넷(Princeton WordNet)을 기반으로 참고구축 방식으로 개발된 것에 비해, KorLexClas 1.0버전과 이를 확장한 1.5버전은 직접구축 방식으로 개발하였다는 점에서, 수분류사의 계층구조와 언어단위 간 의미관계 설정은 매우 방대한 시간과 정교한 구축 방식을 요구한다. 따라서 작업의 효율성을 기함과 동시에, 구축된 어휘의미망의 신뢰성 및 확장성을 높이기 위해, (1) 다양한 기구축 언어자원을 활용하되 상호 검증하는 절차를 거치고, (2) 부분문장 분석방법을 이용하여, 수분류사 및 공기명사 목록을 확장하며, (3) 언어학적 준거를 기준으로 수분류사의 계층구조를 설정하고, (4) 수분류사와 공기명사 간 의미관계 정보를 제공하되 확장성을 확보하기 위해, KorLexNoun 1.5에 '최하위 공통상 위노드(LUB : Least Upper Bound)'를 설정하는 방식을 택한다. 이러한 특성을 가진 KorLexClas 1.5는 기계번역을 비롯한 한국어정보처리의 제 분야에 응용될 수 있다.

클라우드 컴퓨팅 기반 가상 자원 관리를 위한 모니터링 시스템 설계 및 구현 (Development and Implementation of Monitoring System for Management of Virtual Resource Based on Cloud Computing)

  • 조대균;박석천
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.41-47
    • /
    • 2013
  • 본 논문에서는 개방 시스템 기반 가상 자원 모니터링 시스템을 CPU, 메모리, 디스크, 네트워크 부분으로 세분화 하고 각각 모듈화하여 설계 및 구현하였다. 설계한 시스템을 구현하기 위해 Windows, Linux, Xen 운영체제를 이용하였고, 구현 언어로는 C++를 사용하였다. 그리고 시스템의 구조는 기능 업그레이드 및 추가 등의 확장성을 고려하여 가능한 기능별로 모듈화 하여 클라우드 컴퓨팅 환경에서 적용 가능한 클라우드 컴퓨팅 가상 자원 모니터링 시스템을 구현하였다. 본 논문에서 설계 및 구현한 클라우드 컴퓨팅 가상 자원 모니터링 시스템의 동작성 검사를 위해 테스트베드를 구축하여 Xen, ESX 하이퍼바이저 운영체제에서 테스트 한 결과 실시간으로 CPU, 메모리, 디스크, 네트워크 정보를 정상적으로 모니터링 함을 확인 하였다.

국가바람지도 데이터베이스화 및 가시화를 위한 IDL 활용 (Application of IDL for Establishing the Database and Visualization System of National Wind Map)

  • 김현구;이순환;이상우;이종혁
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 한국신재생에너지학회 2010년도 춘계학술대회 초록집
    • /
    • pp.185.2-185.2
    • /
    • 2010
  • 한반도 국가바람지도(김현구, 2009)는 한국에너지기술연구원에서 지식경제부의 부처임무사업으로 구축되었으며 현재 웹서비스(http://www.kier-wind.org)를 통하여 정보를 제공하고 있다. 국가바람지도는 수치기상예측(NWP; Numerical Weather Prediction) 모델을 이용하여 영토, 영해에 대해 $1km{\times}1km$의 고해상도로 작성한 뒤(이순환 등, 2009) 풍력자원 정보로 재가공되었다. 한반도 국가바람지도는 5년의 장기간에 대한 시계열 수치기상예측에 의하여 구축되었기 때문에 데이터베이스(DB; database)의 효율적 관리가 필연적으로 요구된다. MM5 또는 WRF 모델의 고유 출력포맷의 자료구조는 풍력자원분석에 필요한 기상요소 외에도 대기과학자에게 필요한 수많은 기상인자를 종합적으로 포함하고 있다. 따라서 2차원 층(layer) 또는 3차원 공간분포 분석 및 계산격자인 셀(cell)에서의 1차원 시계열 분석 등 다양한 자료축출에는 비효율적인 자료구조가 된다. 이러한 자료구조의 불편을 해소하기 위해서는 기상요소별로 독립적이고 빈번한 시계열 자료 추출에 효율성을 가지며 어떤 프로그래밍 언어를 사용하든지 직관적으로 쉽게 사용할 수 있는 바람지도 데이터베이스의 재구성이 요구된다. 이에 대용량 수치자료의 처리 측면에서 장점을 가지는 과학기술 프로그래밍 언어인 IDL을 기반으로 국가바람지도의 자료구조를 효율화하여 데이터베이스화 하였으며 IDL에 내재된 그래픽 기능을 활용하여 가시화를 구현함으로써 연구개발자의 입장에서 국가바람지도의 활용성 및 효율성을 향상시키고자 하였다.

  • PDF

온톨로지 구축 및 단어 의미 중의성 해소에의 활용 (Ontology Construction and Its Application to Disambiguate Word Senses)

  • 강신재
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.491-500
    • /
    • 2004
  • 본 논문은 기존의 다양한 언어자원들을 이용하여 온톨로지를 구축하고, 이를 단어의미 중의성 해소에 활용하는 방법을 제시하고 있다. 온톨로지를 실용적으로 구축하기 위해서는 가도카와 시소러스의 개념 체계에 격 관계와 기타 의미관계와 같은 다른 의미관계를 추가하여 확장하는 방법을 선택하였다. 구축된 온톨로지를 단어 의미 중의성 해소에 활용하기 위해서는, 결합가 정보를 포함하고 있는 전자사전을 먼저 이용하여 단어의 의미를 결정하고, 결정하지 못한 단어의 의미는 온톨로지를 이용하여 결정하는 절차를 거친다. 이를 위해 온톨로지 내 개념들간의 상호정보가 말뭉치의 통계 정보에 근거하여 계산되는데, 이를 가중치로 간주하면 온톨로지는 가중치 그래프로 생각할 수 있으므로 개념간 경로를 통하여 개념간 연관도를 알아 볼 수 있다. 실제 기계번역 시스템에서 본 방법은 온톨로지를 사용하지 않은 방법보다 9%의 성능 향상을 가져오는 결과를 얻을 수 있었다.

Glossary에 기초한 시스템에서의 적형태 영어문장 생성을 위한 한영 대역에 전자사전구축 (Constructing A Korean-English Bilingual Dictionary For Well-formed English Sentence Generations In A Glossary-based System)

  • 신효필
    • 인지과학
    • /
    • 제14권2호
    • /
    • pp.1-13
    • /
    • 2003
  • 본 논문은 자연언어처리 (Natural Language Processing), 특히 한영 기계번역에서 필수적 인 한영 대역어 사전을 구축함에 있어 영어 생성시 정확한 문장형태를 도출하기 위한 방법에 대해 논의한다. 기간의 연구는 주로 한국어와 영어의 의미적 모호성이 해결된 정확한 번역을 위한 대역어 내지 변환사전 구조에 초점이 맞추어져 왔고 상대적으로 형태적 또는 구문적으로 정확한 영어문장을 생성하는 것은 간과되어져 왔다. 기존 자원의 황용이라는 측면에서는 텍스트화된 한영사전을 그대로 이용한다고 하면 그 기술방식과 영어표현은 다양한 형태로 나타나기 때문에 정확한 의미의 대역어 뿐만 아니라 적격한 영어문장의 생성을 위해서는 어떠한 정보들이 대역어 사전에 기술되어야 하는지 고려해 볼 필요가 있다 따라서 본 논의에서는 기존의 인쇄된 한영사전을 구조분석하여 자동으로 변환하여 최소한의 인간의 간섭으로 정확한 영어생성에 필요한 형태적 정보를 자질로 부여하는 방법을 기술한다. 기본적으로 이 방법은 단어 대 단어 번역시스템 둥 glossary에 기초한 얕은 층위의 번역이 필요한 시스템을 위한 사전을 구축에서 시작하며 더 나아가 대규모의 전자사전 구축작업에서 어떻게 응용될 수 있는지 논의한다.

  • PDF

시멘틱 컴퓨팅 기반의 동적 작업 스케줄링 모델 및 시뮬레이션 (Semantic Computing-based Dynamic Job Scheduling Model and Simulation)

  • 노창현;장성호;김태영;이종식
    • 한국시뮬레이션학회논문지
    • /
    • 제18권2호
    • /
    • pp.29-38
    • /
    • 2009
  • 이기종의 자원들로 이루어진 컴퓨팅 환경에서 효율적인 자원 활용과 대용량의 데이터를 고속으로 처리하기 위해서는 실시간으로 변화하는 자원의 상태에 따라 대처 할 수 있는 동적인 작업 스케줄링 모델이 필요하다. 현재 이기종의 자원들에게 작업을 어떻게 분배 및 할당 할 것인지에 대하여 많은 자원 평가 방법 및 휴리스틱 기법들이 연구되었으나 이러한 방법들은 표준언어를 사용하지 않기 때문에 시스템 호환 및 확장에 어려움이 많다. 또한 다양한 자원들의 상태가 실시간으로 동적으로 변화하기 때문에 기존 연구에서 제안한 방법으로는 효율적인 처리가 불가능하거나 자원의 상태 변화에 동적으로 대처할 수 없다. 본 논문은 이러한 기존 연구들의 문제에 대한 해결책으로 W3C에서 제정한 온톨로지 표준 언어인 OWL을 이용하여 자원 온톨로지를 구축함으로써 이기종의 자원 관리를 손쉽게 할 수 있으며, 자원의 동적인 변화에 따라 작업 스케줄링하는 방법을 지식기반의 다양한 규칙들로 정의하여 추론을 통해서 최적의 자원에게 작업을 할당하는 시멘틱 컴퓨팅 기반의 동적 작업 스케줄링 모델을 제안한다. 시뮬레이션 실험 결과는 본 논문에서 제안한 작업 스케줄링 모델이 기존 모델에 비하여 낮은 작업 손실과 높은 작업 처리율 및 짧은 응답시간을 제공함으로써 이기종의 자원들로 구성된 시스템 전반에 걸쳐 안정적이고 고속의 데이터 처리를 제공할 수 있다는 사실을 증명한다.

아시아 인터넷 공공 도서관(Internet Public Library Asia) 구축에 관한 연구 (Construction of Internet Public Library Asia)

  • 이원숙;일본명;일본명;일본명;일본명
    • 한국비블리아학회지
    • /
    • 제13권2호
    • /
    • pp.59-73
    • /
    • 2002
  • 본 연구에서는, 우선 인터넷의 보급에 의해 변화되어진 전통적인 공공 도서관 서비스를 몇가지의 예를 통하여 조사하였다. 이 과정에서 아시아지역에서 발신되어진 양질의 정보 자원을 아시아어로 소개하는 다언어 서브젝트 게이트웨이의 필요성에 대하여 깨달았다. 그리하여 본 연구에서는 한국어. 일본어, 중국어로 쓰여져 있는 정보 자원중 공공 도서관의 이용자들에서 유용하다고 생각되어지는 자료를 웹으로부터 수집하여, 각각의 정보 자원에 관한 소개를 전술한 3개 언어와 영어로 기술하는 Internet Public Library Asia의 구축을 진행해왔다. 본 시스템에서 사용하는 메타 데이터 스키마는DC(Dublin Core Metadata Element Set)$^{1)}$와 IEEE LOM$^{2)}$을 기본으로 만들어졌고, 다언어 메타 데이터는 각각의 언어를 모국어로 하는 메타 데이터 작성자들에 의하여 협동으로 작성되어졌다. 또 본 시스템에서는 메타 데이터뿐만 아니라 이용자 인터페이스도 다언어로 제공하여 이용자가 언어에 구애받지 않고 검색할 수 있도록 돕고 있다. 메타 데이터의 기술에는 XML을 사용하였고, 기술되어진 메타 데이터는 PostgreSQL를 이용하여 데이터 베이스화 하였다. 다언어 이용자 인터페이스의 실현에는 XSLT등의 기술을 사용하고 있다.

  • PDF

부트스트래핑 알고리즘을 이용한 한국어 격조사의 의미역 결정 (Bootstrapping for Semantic Role Assignment of Korean Case Marker)

  • 김병수;이용훈;나승훈;김준기;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.4-6
    • /
    • 2006
  • 본 논문은 자연언어처리에서 문장의 서술어와 그 서술어가 가지는 명사 논항들 사이의 문법관계를 의미 관계로 사상하는 즉 논항이 서술어에 대해 가지는 역할을 정하는 문제를 다루고 있다. 의미역 결정은 단어의 의미 중의성 해소와 함께 자연언어의 의미 분석의 핵심 문제 중 하나이며 반드시 해결해야 하는 매우 중요한 문제 중 하나이다. 본 연구에서는 언어학적으로 유용한 자원인 세종전자사전을 이용하여 용언격틀사전을 구축하고 격틀 선택 방법으로 의미역을 결정한 후. 결정된 의미역들에 대한 확률 정보를 확률 모델에 적용하여 반복적으로 학습하는 부트스트래핑(Bootstrapping) 알고리즘을 사용하였다. 실험 결과, 기본 모델에 대해 10% 정도의 성능 향상을 보였다.

  • PDF

키워드 기반 자동 테스트 구현 및 적용 사례 (Software Testing by a keyword driven test automation method and Effects)

  • 이영석;하영민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.604-606
    • /
    • 2001
  • 소프트웨어의 본질인 변경 문제로 인해 상용 테스트 도구의 단순 적용만으로는 자동 테스트의 실질적인 효과를 기대하기 어려운 것이 현실이다. 이러한 문제를 해결하기 위해 변경에 영향 받지 않는 다양한 자도 테스트 기법이 시도되어 오고 있다. 그 중에서 가장 주목받는 것으로 키워드 기반 자동 테스트(Keyword Driven Automated Test)를 들 수 있으며 이 방법의 궁극적인 목적은 대상 소프트웨어의 변경에 따른 테스트 자원의 유지보수를 쉽게 하기 위한 것이라 할 수 있다. 테스트 자원의 구축, 실행 및 발생하는 변경으로 인한 유지보수까지의 전 과정에서 키워드 기반 자동 테스트가 보다 효율적이며 다른 프로젝트, 제품 테스트에서도 일부 함수 추가, 재정의만으로 재사용 가능한 장점을 가지고 있다. 키워드 기반 자동 테스트를 위해서는 기존의 테스트 도구를 사용하여 대상 소프트웨어에 맞게 테스트 도구가 제공하는 자체 프로그래밍 언어를 사용하여 개발해야 한다.

  • PDF

시맨틱 웹과 MPEG-7 메타데이타를 이용한 비디오 검색 시스템 (Video Search System using Semantic Web and MPEG-7 Metadata)

  • 이성우;한종형;안철범;나연묵
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.165-168
    • /
    • 2006
  • 본 논문에서는 시맨틱 웹을 위한 마크업 언어인 RDF와 MPEG-7 표준을 따르는 XML 문서를 이용하여 구축된 비디오 검색 시스템에 대한 연구결과를 기술한다. 본 논문에서 제안된 시스템은 RDF를 통해 비디오 파일에 대한 정보를 웹 자원의 관점으로 정의/저장한다. 또한 비디오에 대한 내용기반 검색을 위해 비디오를 구성하는 중요 프레임들을 추출하여 그림 파일로 저장하는 한편 각 프레임에 대한 정보를 MPEG-7 표준에 따라 XML 형태로 저장한다. 이렇게 구축된 정보들을 바탕으로 비디오 검색 엔진은 사용자의 질의요청을 수행한다. 본 논문에서 제안하는 비디오 검색 시스템은 비디오에 대한 다양한 검색은 물론 비디오에 대한 내용기반 검색이 가능한 장점을 가진다.

  • PDF