• 제목/요약/키워드: Korean Parser

검색결과 168건 처리시간 0.025초

토큰기반 변환중심 한일 기계번역을 위한 변환사전 (Transfer Dictionary for A Token Based Transfer Driven Korean-Japanese Machine Translation)

  • 양승원
    • 한국산업정보학회논문지
    • /
    • 제9권3호
    • /
    • pp.64-70
    • /
    • 2004
  • 한국어와 일본어는 동일한 어족에 속하며 비슷한 문장구조를 가지고 있어 변환중심 기계번역 방법이 효율적이다. 본 논문에서는 토큰 단위의 변환중심 한일 기계번역 시스템을 위한 변환 사전을 생성하는 방법에 관하여 기술하였다. 변환 사전이 잘 구성되면 구문분석 단계에서는 대역어를 선정하기에 적합한 정도까지의 의존트리를 생성하는 간이 파싱 만을 함으로써 필요 없는 노력을 경감시킬 수 있다. 게다가 구문해석 시에 최종의 결과 트리를 만들지 않아도 되므로 문어체 문장은 물론 입력 형태가 비정형적인 대화체 문장에서 더욱 큰 효과를 볼 수 있다. 본 논문의 변환 사전은 한국전자통신 연구원이 수집한 음성 데이터베이스로부터 추출한 말뭉치를 사용해 구성하였다. 구현한 시스템은 여행 계획영역에서 수집된 900여 발화 안의 문장을 대상으로 시험하였는데 제한된 환경에서 $92\%$, 아무런 제약이 없는 환경에서는 $81\%$의 성공률을 보였다.

  • PDF

생산현장의 유연성 및 다양성을 지원하기 위한 설비정보 수집 시스템의 설계 (Design of Information Acquisition System for Equipments on Shop Floor)

  • 이재경;이승우;남소정;박종권
    • 대한기계학회논문집A
    • /
    • 제35권1호
    • /
    • pp.39-45
    • /
    • 2011
  • 제품에 따라 상이한 생산공정과 각 공정에서 발생하는 다양한 정보를 관리하는 제조실행시스템(MES) 구현을 위해서는 제조 시스템의 특성을 고려한 데이터 수집 시스템(Data Acquisition System)이 필요하다. 본 논문에서는 작업지시부터 작업실적보고 사이에서 발생하는 생산현장 정보를 실시간으로 수집하고 처리하여 MES 에 제공하는 설비정보 수집 시스템을 소개한다. 제안 시스템은 다양한 설비 정보를 실시간으로 처리하는 데이터 파서 모듈, 이를 작업실적정보로 생성하는 데이터 맵퍼 모듈, 생성된 작업실적정보를 상위 시스템인 MES, ERP 에 제공하는 SOA 기반 데이터 연동 모듈로 구성된다. 시스템의 시범적용 결과, 설비나 공정의 추가, 변경에도 쉽게 재구성 가능하고 유지보수가 용이하였다.

문법성과 어휘 응집성 기반의 영어 작문 평가 시스템 (An English Essay Scoring System Based on Grammaticality and Lexical Cohesion)

  • 김동성;김상철;채희락
    • 인지과학
    • /
    • 제19권3호
    • /
    • pp.223-255
    • /
    • 2008
  • 본 논문에서 우리는 문장의 문법성과 텍스트의 어휘 응집성 측정을 위주로 하는 영어 작문 자동평가시스템을 소개하려고 한다. 문법 검사를 위해서는 링크 파서를 사용하고 어휘 연쇄를 측정하기 위해서는 로제 시소러스를 사용한다. 자동 평가 시스템의 채점 신뢰도를 측정하기 위해서 자동 채점과 수동 채점의 결과를 통계적으로 비교한다. 카파 통계와 다국면 Rasch 모형에 따른 분석 결과 자동 채점은 수동 채점과 유사성이 크며 수동 채점과 비교해서 신뢰성에 특별한 문제가 없다는 결론을 내리게 된다. 본 연구의 가장 큰 의의는 다양한 종류의 기술과 도구를 바탕으로 신뢰할 만한 수준의 영작문 자동 평가 시스템을 개발했다는 것이다. 평가 대상이 문장 단위를 넘어 선 텍스트 단위이며, 단어나 문법 등의 형식적 측면만 검사하는 것이 아니라 내용적 측면도 평가한다.

  • PDF

CCD/CCR 중심의 표준진료문서 관리 도구의 개발 (Development of a Management Tool of CCD/CCR-centric Standard Clinical Document)

  • 이인근;조훈;김화선
    • 한국지능시스템학회논문지
    • /
    • 제22권4호
    • /
    • pp.507-514
    • /
    • 2012
  • PHR(Personal Health Record)의 표현, 통합, 교류를 위해 CCD(Continuity of Care Document)와 CCR(Continuity of Care Record)과 같은 XML 기반의 표준들이 개발되었고, 이들 표준에 기반하여 PHR 교환을 위한 다양한 연구들이 수행되고 있다. 이들 연구에서는 각기 다른 방법으로 CCD/CCR 문서의 처리 도구를 개발하여 사용하고 있으나, 이들 표준이 구조적으로 복잡하여 도구의 개발 및 수정이 쉽지 않다. 또한 PHR 관련 의료정보시스템의 상호운용을 위해서는 CCD와 CCR 문서간의 상호 변환이 필요하다. 따라서 본 논문에서는 XML에 기반하여 작성된 CCD와 CCR과 같은 의료정보 표준 문서를 처리하고 관리하기 위한 프로그램 설계 방법을 제안하였다. 그리고 제안한 방법에 기반하여 CCD/CCR 처리 도구를 개발하고, 이 도구를 이용하여 CCD를 CCR로 변환하기 위한 변환기를 개발하였다. 개발한 도구의 효용성 확인을 위해 경북대학교병원에서 만성질환 입원자를 대상으로 수집한 개인건강정보를 이용하여 CCD 문서를 생성하고, CCD 문서를 CCR 문서로 변환하는 실험을 수행하였다.

메시지 후킹 메커니즘을 이용한 적응형 하이퍼미디어 시스템과 외부 응용 프로그램의 결합 (Combination of an adaptive hypermedia system and an external application using a message hooking mechanism)

  • 정효숙;박성빈
    • 컴퓨터교육학회논문지
    • /
    • 제8권4호
    • /
    • pp.107-114
    • /
    • 2005
  • 사용자는 적응형 하이퍼미디어를 항해하면서 적응형 하이퍼미디어가 아닌 다른 응용 프로그램을 함께 사용할 수도 있다. 만일 사용자가 그 응용 프로그램을 통해 적응형 하이퍼미디어와 관련된 정보에 접근하였다면, 이러한 사용자의 행동은 적응형 하이퍼미디어가 제공하는 내용에 대한 사용자의 지식이나 흥미에 영향을 줄 수 있다. 그러나 적응형 하이퍼미디어 시스템은 페이지 접근과 같은 탐색 활동을 통해 사용자 행동을 이해하며, 다른 응용 프로그램에서 발생한 사용자의 행동을 인식하여 사용자 속성을 변화시키기 어렵다. 본 논문에서는 적응형 하이퍼미디어 시스템이 다른 응용프로그램에서 발생한 사용자 행동을 인식하여 사용자 프로파일을 갱신시킬 수 있도록 함으로써 현재 사용자의 특성을 보다 정확하게 파악하여 적응형 내용 제시와 적응형 항해를 제공하고자 한다. 후킹 메커니즘을 이용하여 다른 응용 프로그램에서 발생한 사용자 이벤트를 분석하고, XML 번역기를 이용하여 시스템에 저장된 사용자의 프로파일을 갱신할 것이다.

  • PDF

다양한 생산 설비와의 인터페이스를 고려한 설비정보 수집 (Acquisition of Data of Equipments on Shop Floor Using Interface Between Various Equipments)

  • 남소정;이재경;이승우;박종권
    • 대한기계학회논문집A
    • /
    • 제35권2호
    • /
    • pp.149-156
    • /
    • 2011
  • 다양한 생산 설비에 따른 설비정보를 MES 등의 생산시스템에 효율적으로 제공하기 위해 설비 정보 수집 시스템은 생산현장의 설비 및 공정특성을 고려한 다양한 설비 인터페이스에 따른 정보 수집이 필요하다. 본 연구에서는 생산현장의 다양한 생산 설비의 정보를 수집하기 위해 설비 인터페이스를 통한 설비정보 수집 방법을 제안한다. PLC 기반의 인터페이스, Sensor 기반의 I/O 인터페이스, 작업자 Key-In 에 의한 인터페이스 등 다양한 설비 인터페이스를 통해 생산 현장의 정보를 1 차 수집할 수 있다. 데이터 수집 시스템은 H/W Communication Module 과 Operator Key-In Module을 이용하여 설비 인터페이스를 통해 수집되는 설비 정보를 2 차 가공하며, 데이터 파서(Data Parser)를 통해 수집 정보의 유연성을 높일 수 있다.

Constructing a Metadata Database to Enhance Internet Retrieval of Educational Materials

  • Oh Sam-Gyun
    • 한국문헌정보학회지
    • /
    • 제32권3호
    • /
    • pp.143-156
    • /
    • 1998
  • 이 논문은 미국 초중고교 교사들을 이용 대상자로 인터넷 상에 산재해 있는 강의안 및 교육자료의 메타데이터 DB를 구축한 GEM 프로젝트에 대한 보고이다. GEM 프로젝트에서는 현재 거의 표준으로 간주되는 더블린 코어의 15개 요소(Elements)를 채택하였고, 여기에 8개 요소를 첨가하여 검색을 원활히 하고자 하였다. GEM 메타데이터 DB의 구축에는 메타데이터 요소들간의 관계를 좀 더 명확히 표현할 수 있는 개념적 데이터 마들링을 사용하였고 메타데이터는 Sybase라는 관계형 데이터베이스에 저장했으며, 이 DB에 웹 인터페이스를 장착하는데에는 Microsoft 액티브 서버 페이지 (ASP) 기술을 이용하였다. GEM 메타데이터의 실제목록은 미국 전역에서 참가하고있는 컨소시엄 회원들에 의해서 이뤄지고 있으며, 그 결과는 인터넷을 통해 Sybase 관계형 데이터베이스에 자동적으로 입력된다. 이 논문에서는 더블린코어, GEM의 개념 및 논리 스키마들을 제시하는 한편, 메타데이터 DB의 구축에 개념적 데이터 마들링을 사용함으로써 얻어지는 장점들을 논하였다. GEM 프로토타입 시스템이 가동되고 있는 URL은 다음과 같다: http://lis.skku.ac.kr/gem/.

  • PDF

LL($textsc{k}$) 커버링 문법의 확장 (An Extension of LL($textsc{k}$) Covering Grammers)

  • 이경옥;최광무
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권8호
    • /
    • pp.1028-1038
    • /
    • 1999
  • 본 논문에선 LR 문법의 부분 클래스를 동치인 LL 문법으로 변환하는 방법을 제시한다. 이 변환이 적용 가능한 문법을 확장된k`-transformable 문법이라 정의한다. 변환된 문법은 left-to-right 커버의 성질을 만족한다. 기존 연구에서 제시한 변환 방법은 LR 문법의 부분 클래스인 {{{{k`-transformable 클래스와 PLR 클래스를 LL 문법으로 바꾼다. 이 논문에서 제시하는 새로운 변환 방법의 적용 가능한 문법의 범위는 k`-transformable 클래스와 PLR 클래스를 포함한다. 기존의 커버링 성질을 만족하는 LL로의 문법 변환은 보편적인 LR 파서의 행동을 시뮬레이션하여 얻어진다. 이 과정에서 쉬프트, 리듀스 행동 이외에 무한의 가능성을 가진 스택 스트링의 유한 표현을 위해 리덕션 심볼에 대한 예상 행동이 추가된다. 본 논문에서는 파싱 문맥을 나타내는 LR 아이템들을 기존의 스택 스트링 표현 형태에 추가하여 스택 스트링 표현법을 정제하고, 리덕션 심볼에 대한 예상 방법을 확장하는 정형식을 제시한다. 이에 근거하여 LL 커버링 문법이 존재하는 클래스를 확장된 {{{{k`-transformable 문법으로 확장시킨다.Abstract A new transformation of a subclass of LR(k`) grammars into equivalent LL(k`) grammars is studied. The subclass of LR(k`) grammars is called extended k`-transformable. The transformed LL(k`) grammars left-to-right cover the original LR(k`) grammars. Previous transformations transform k`-transformable and PLR(k`) into LL(k`). The new transformation is more powerful in that it handles the extended k`-transformable subclass of LR(k`), which strictly includes k`-transformable and PLR(k`) classes. The previous covering transformations into LL grammars are obtained by simulating the actions of the conventional LR parser. Specially, a predict action of reduction goals is added to the action set in order to finitely represent stack string. In this paper, the stack string representation is refined by adding LR items to represent a parsing context, and the prediction of reduction goal is extended by generalizing the prediction formalism. Based on them, the previous grammar classes with LL({{{{k`) covering grammars are extended to extended k`-transformable grammars.

스토리 정보의 검색을 위한 웹 기반의 협업적 스크립트 분석 플랫폼 개발 (Development of Collaborative Script Analysis Platform Based on Web for Information Retrieval Related to Story)

  • 박승보;김현식;백영태;유은순
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권9호
    • /
    • pp.93-101
    • /
    • 2014
  • 영화의 스토리에 대한 분석은 영화의 설계도와 같은 스크립트를 분석하여 용이하게 이루어질 수 있다. 영화의 스크립트는 파이널 드래프트(Final Draft)의 형식화된 구조로 기술되어 있지만, 웹상에 공개된스크립트들은 대부분 형식이 파괴되어 문장 내용에 대한 분석이 없으면 형식을 복원하기 힘든 상황이다. 이를 위해 자동으로 스크립트를 파싱한 후에 사용자들이 협업적으로 결과물의 오류를 자유롭게 점검하고 수정할 수 있도록 웹기반의 스크립트 분석 소프트웨어를 개발하고 제공할 필요가 있다. 따라서 본 논문에서는 사용자에 의해 스크립트의 형식 오류가 수정되고 걸러지게 하여 완성도 높은 영화 데이터 축적을 가능케 하는 웹 기반의 협업적 스크립트 분석 플랫폼의 구조를 제시하고, 구현 결과에 대한 성능평가를 진행하였다. 실험을 통해 자동 파싱 성공률이 64.95%로 나타났고, 협업적 오류 수정은 5단계를 거친 후에 대부분의 오류가 수정되어 99.58%의 파싱 정확도를 보여주었다.

XML 기반 강건 타입형 유전자 프로그램의 이식${\cdot}$독립적 표현 (XML-based Portable Self-containing Representation of Strongly-typed Genetic Program)

  • 이승익
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권4호
    • /
    • pp.277-289
    • /
    • 2005
  • 선택과 재생산을 특징으로 하는 계통적 학습에서 유전자 프로그램이 가지는 긴 설계시간/높은 계산노력/낮은 계산효율을 극복하고자, 이 논문은 XML에 기반을 둔 유전적 표현 방법을 제안한다. 이 방법에서 유전자 프로그램과 유전자 연산은 기성 DOM 파서의 API 호출에 의하여 관리되기 때문에, 유전자 프로그램을 설계하는데 소비되는 시간이 상당히 단축되는 특징이 있다. 또 표준 XML 스키마를 기반으로 의미적으로 올바른 유전자 프로그램만을 다루기 때문에 탐색공간과 계산노력이 감소된다. 그리고 이형 분산 컴퓨팅 환경에서 유전자 프로그램의 이주에 적합한 시스템 및 형식인 XML을 사용하기 때문에 유전자 프로그램이 병렬적으로 수행될 수 있고, 이에 따라 계산효율이 향상된다. 제안된 방법의 검증을 위하여 포식자-피식자 문제에서 다중 에이전트의 사회적 행동의 진화에 적용한 결과, 유전자 프로그램에 대한 계산시간이 단축됨을 .보인다