• Title/Summary/Keyword: Korean parsing

Search Result 326, Processing Time 0.027 seconds

A study on the Restoration of Feature Information in STEPAP224 to Solid model (STEP AP224에 표현된 특징형상 정보의 솔리드 모델 복원에 관한 연구)

  • 김야일;강무진
    • Proceedings of the Korean Society of Precision Engineering Conference
    • /
    • 2001.04a
    • /
    • pp.367-372
    • /
    • 2001
  • Feature restoration is that restore feature to 3D solid model using the feature information in STEP AP224. Feature is very important in CAPP, but feature information is defined very complicated in STEP AP224. This paper recommends the algorithm of extraction the feature information in physical STEP AP224file. This program import STEP AP224 file, parse the geometric and topological information, the tolerance data, and feature information line-by-line. After importation and parsing, store data into database. Feature restoration module analyze database including feature information, extract feature information, e.g. feature type, feature's parameter, etc., analyze the relationship and then restore feature to 3D solid model.

  • PDF

Knowledge Extractions, Visualizations, and Inference from the big Data in Healthcare and Medical

  • Kim, Jin Sung
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.23 no.5
    • /
    • pp.400-405
    • /
    • 2013
  • The purpose of this study is to develop a composite platform for knowledge extractions, visualizations, and inference. Generally, the big data sets were frequently used in the healthcare and medical area. To help the knowledge managers/users working in the field, this study is focused on knowledge management (KM) based on Data Mining (DM), Knowledge Distribution Map (KDM), Decision Tree (DT), RDBMS, and SQL-inference. The proposed mechanism is composed of five key processes. Firstly, in Knowledge Parsing, it extracts logical rules from a big data set by using DM technology. Then it transforms the rules into RDB tables. Secondly, through Knowledge Maintenance, it refines and manages the knowledge to be ready for the computing of knowledge distributions. Thirdly, in Knowledge Distribution process, we can see the knowledge distributions by using the DT mechanism.Fourthly, in Knowledge Hierarchy, the platform shows the hierarchy of the knowledge. Finally, in Inference, it deduce the conclusions by using the given facts and data.This approach presents the advantages of diversity in knowledge representations and inference to improve the quality of computer-based medical diagnosis.

Design and Implementation of Proposal Registration and Estimation System based on XML (XML 기반의 제안서 접수 및 평가 시스템의 설계 및 구현)

  • 권석훈;나재열;유정연;이강찬;이규철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.139-141
    • /
    • 2001
  • 기존의 제안서 접수 및 평가 방식은 수작업이 대부분을 차지하여 많은 인력과 시간이 소요되며 정확성도 완전히 보장할 수 없는 단점을 가지고 있다. 이러한 비효율적인 방식을 개선하기 위해서 접수 및 평가과정을 웹상에서 자동화하여, 문서 작성자, 접수자, 평가자 및 관리자들이 좀 더 편리하게 관련 작업을 처리할 수 있게 하였다. 자동화를 도입하기 위한 방법으로 HWP 문서의 구조 정보를 표현할 수 있는 마크업(markup) 언어인 HWPML(HWP Markup Language : 이하 HML)을 사용하였으며, HML 문서를 파싱(parsing)하여 필요한 정보만을 추출하여 XML(eXtensible Markup Language) 문서를 생성하였다. 이렇게 생성된 XML 문서는 논리적인 구조 정보를 가지고 있고 플랫폼 및 소프트웨어 중립적이기 때문에 효과적인 검색, 관리 및 공유가 가능한 시스템 환경을 제공한다. 이 기법으로 표준 언어로 부각되고 있는 XML 형태의 문서 관리를 기존의 워드 프로세서 형태의 문서 관리에 확장 적용할 수 있다. 본 논문에서는 이러한 자동화 시스템의 구조와 문서 변환 기법을 제안하였다.

  • PDF

Research on a Model of Extracting Persons' Information Based on Statistic Method and Conceptual Knowledge

  • Wei, XiangFeng;Jia, Ning;Zhang, Quan;Zang, HanFen
    • Proceedings of the Korean Society for Language and Information Conference
    • /
    • 2007.11a
    • /
    • pp.508-514
    • /
    • 2007
  • In order to extract some important information of a person from text, an extracting model was proposed. The person's name is recognized based on the maximal entropy statistic model and the training corpus. The sentences surrounding the person's name are analyzed according to the conceptual knowledge base. The three main elements of events, domain, situation and background, are also extracted from the sentences to construct the structure of events about the person.

  • PDF

Automatic Acquisition of Lexical-Functional Grammar Resources from a Japanese Dependency Corpus

  • Oya, Masanori;Genabith, Josef Van
    • Proceedings of the Korean Society for Language and Information Conference
    • /
    • 2007.11a
    • /
    • pp.375-384
    • /
    • 2007
  • This paper describes a method for automatic acquisition of wide-coverage treebank-based deep linguistic resources for Japanese, as part of a project on treebank-based induction of multilingual resources in the framework of Lexical-Functional Grammar (LFG). We automatically annotate LFG f-structure functional equations (i.e. labelled dependencies) to the Kyoto Text Corpus version 4.0 (KTC4) (Kurohashi and Nagao 1997) and the output of of Kurohashi-Nagao Parser (KNP) (Kurohashi and Nagao 1998), a dependency parser for Japanese. The original KTC4 and KNP provide unlabelled dependencies. Our method also includes zero pronoun identification. The performance of the f-structure annotation algorithm with zero-pronoun identification for KTC4 is evaluated against a manually-corrected Gold Standard of 500 sentences randomly chosen from KTC4 and results in a pred-only dependency f-score of 94.72%. The parsing experiments on KNP output yield a pred-only dependency f-score of 82.08%.

  • PDF

Construction of an PFT database with various clinical information using optical character recognition and regular expression technique

  • Park, Man Young;Park, Rae Woong
    • Journal of Internet Computing and Services
    • /
    • v.18 no.5
    • /
    • pp.55-60
    • /
    • 2017
  • The pulmonary function test (PFT) is an essential data source for evaluating the effect of drugs on the lungs or the status of lung function. However, the numeric values of PFT cannot be easily used for clinical studies without labor-intensive manual efforts, because PFTs are usually recorded as image files. This study was aimed at constructing a de-identified, open-access PFT database with various clinical information. For constructing the PFT database, optical character recognition (OCR), regular expression, and the parsing technique were used to extract alphanumeric data from the PFT images in a Korean tertiary teaching hospital. This longitudinal observational database contains 413,000 measurements of PFT from 183,000 patients.

Kernel-based sentence classification for protein-protein interaction (커널 기반의 '단백질-단백질 작용' 의미 포함 문장 분류)

  • Kim Seong-Hwan;Eom Jae-Hong;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.286-288
    • /
    • 2005
  • 본 논문에서는 tree kernel을 이용 '단백질-단백질 작용' 내용 포함 문장의 추출 방법을 제시한다. Tree kernel은 convolution kernel의 하나로서, 이를 이용하여 파싱 트리(parsing tree)로 표현된 문장을 데이터로 하여 '단백질-단백질 작용' 내용을 포함하고 있는 문장을 그렇지 않은 문장으로부터 분류할 수 있다. 문장 전체를 데이터로 사용하는 것보다 관련 영역을 서브트리(sub-tree)로 추출하여 사용한 것이 더 효과적임을 확인할 수 있었고, kernel계산에 있어 파싱 트리의 태그 내용이 중요한 역할을 하기 때문에 이를 '단백질-단백질 작용'의 의미를 반영할 수 있도록 semantic하게 변환한 효과 및 트리의 길이에 따른 영향도 실험해 보았다. 문제에 사용된 데이터의 양이 다소 적었지만, 데이터 표현 방식에 따라 파싱이나 패턴기법을 이용한 기존의 방법과 비교해 좋은 성능을 보일 수 있다는 가능성을 확인할 수 있었다.

  • PDF

Digital Item Creation and Parsing of Digital Item for Broadcasting Contents based on MPEG-21 (MPEG-21 기반 방송용 컨텐츠의 디지털 아이템 생성 및 파싱)

  • 김천석;한희준;김욱중;조용주;남제호;홍진우;노용만
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2002.11a
    • /
    • pp.151-156
    • /
    • 2002
  • 본 논문에서는 MPEG-21 프레임워크 기반 하에 방송용 멀티미디어 컨텐츠를 디지털아이템 선언에 의해 디지털 아이템을 생성하고 이를 소비하기 위한 시스템에 대해 제안하였다. 제안된 시스템은 디지털 아이템을 XML 문서로 생성하고, 이 생성된 디지털 아이템을 소비하기 위한 관련 Parser 모듈들, 브라우저 및 리소스와 관련 데이터 DB로 구성되어 있다. 제안된 시스템을 방송용 컨텐츠에 대해 적용하였으며, 디지털 아이템의 기술을 위해 국제 표준 규격인 PEG-7 MDS 기술자를 이용 적용하였다. 예상 가능한 사용자의 여러 환경 조건을 가상하여 다양한 미디어 리소스를 적용하였다.

  • PDF

An Efficient Node Reuse inIncremental Parsing Algorithms (효율적인 노드 재사용을 위한 점진적 파싱 알고리즘)

  • 박정윤;김영철;김상헌;유재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.401-403
    • /
    • 1998
  • 점진적 파싱 알고리즘은 사용자 중심의 시스템 구현을 위한 핵심적인 기술의 하나이다. 오늘날 속성문법에서 사용되는 트리에는 노드에 파스서 상태와 심볼외에 평가된 속성 정보가 포함되므로 이 정보를 재사용하는 것이 바람직하다. 따라서 효율적인 점진적 파서는 파스트리상에서 생성된 노드를 효율적으로 재사용 할 수 있어야 한다. 본 연구에서는 이전의 파싱과정에서 생성된 노드를 효율적으로 재사용할 수 있는 쓰레드 트리를 기반으로 한 점진적 파싱 알고리즘을 제안하였다. 이전에 생성된 파스결과를 쓰레드 트리로 보관하고 이를 이용하여 효율적으로 노드를 재사용할 수 있도록 하였다. 제안된 알고리즘은 LR 기반의 파싱 방법에서 확장형 파싱표와 쓰레드 트리를 이용해 생성된 트리의 노드를 효율적으로 유지할 수 있다. 본 연구에서 제시된 알고리즘은 구문분석이 필요한 대화식 환경에서 효율적으로 사용될 수 있다.

Design of Multi-document Parsing System for Mobile Device (휴대단말용 다중 마크업 문서 파싱 시스템 설계)

  • 최은정;손지연;한동원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.247-249
    • /
    • 2002
  • 본 논문에서는 휴대단말용 유무선 통합 브라우저를 위한 다중 문서 파싱 시스템을 제안한다. 현재 유무선 인터넷 서비스를 지원하기 위해 단일화된 표준 마크업 언어가 없다. 따라서, 유무선 통합 브라우저를 설계하려면 이들 각기 다른 마크업 언어의 지원을 생각하지 않을 수 없다. 이를 지원하기 위해 본 논문에서는 모든 마크업의 공통 분모 격인 파서를 설계하였으며, 각기 다른 사양의 휴대단말에 적합하게 표현하기 위해 그래픽 사용자 인터페이스 객체를 생성하는 방법을 제안하기로 한다. 이를 위해, 파서는 마크업 언어의 그래픽 기능을 휴대단말에서 지원 가능한 그래픽 사용자 인터페이스 객체 형태의 결과물을 만들어 내다. 이 결과물은 추후에 브라우저의 사용자 인터페이스 모듈과 연동될 것이다. 이러한 파싱 시스템은 브라우저로 하여금 모든 언어를 파싱할 수 있도록 하는 한편, 여러 언어 표준을 지원하려는 브라우저에 부담을 최소화시키는 기법이다.

  • PDF