• Title/Summary/Keyword: 데이터 부분 중복

Search Result 79, Processing Time 0.025 seconds

A Korean Analysis based on Argument Structures for Spoken Language Translation (대화체 번역을 위한 논항 구조에 기반한 한국어 분석)

  • Jeong, Cheon-Yeong;Seo, Yeong-Hun
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.4
    • /
    • pp.380-387
    • /
    • 2001
  • 본 논문에서는 대화체 번역을 위한 논항 구조에 기반한 한국어 분석에 대하여 기술한다. 논항구조 기반 문법은 순서에 관계없이 기술된다. 따라서 한국어 부분 자유 어순 특성으로 문법이 방대해지는 문제점을 해결할 수 있다. 또한, 서술어가 지배하는 논항이 문법으로부터 선택됨으로서 대화체가 갖는 특성인 간투어나 중복 발화 현상 등을 효과적으로 해결할 수 있다. 실험을 위하여 사용된 데이터는 ‘여행 안내’ 영역 중에서 1,335개의 훈련된 발화문과 420개의 훈련되지 않은 발화문이다. 실험 결과 훈련된 발화문에서는 99.7%, 훈련되지 않은 발화문에서는 93.3%의 분석 성공률을 보였다.

  • PDF

OCTOPUS : 다중링크상태분석기

  • Lee, Geun-U
    • ETRI Journal
    • /
    • v.14 no.3
    • /
    • pp.16-30
    • /
    • 1992
  • SMX-1 시스팀과 같이 다수의 신호링크들이 운용되면서 신호망의 시험 및 운용이 이루어질 때 부분적인 분석 검증이 아닌 시스팀의 전반적인 검증에서부터 망차원에서의 동작여부를 판단하여 시스팀을 수정, 보완해가야 할 필요성이 있다. 그러나, 범용의 링크상태분석기를 사용하는 것은 한정된(1 또는 2 링크)신호링크만을 제공하기 때문에 다수의 신호링크에 대한 실시간 상태분석을 할 수 없는 점, 이미 정해진 메시지만을 추출/검색할 수 있기때문에 사용자가 원하는 형태의 니모닉 검색/추출이 되지 않는 기능상의 미비점, 다수의 신호링크를 제공하기 위해서 고가의 링크상태 분석기를 여러대 구입하는 것은 중복구매로 인한 예산문제 등 많은 문제점들이 있다. OCTOPUS는 이러한 문제점들을 해결하기위해 제안된 다중링크상태분석기로서, 상태분석시 다수의 신호링크를 제공할 수 있고, 사용자가 원하는 형태의 니모닉 검색/추출이 가능하며, SMX-1 연구결과인 부산물을 이용한다는 측면과, No. 7 레벨2 프로토콜을 이용한 레벨2 비가용원인이유 파악기능제공, 유사한 형태의 HDLC(데이터링크 프로토콜) 처리기능등을 제공할 수 있다는 것이 장점이다. OCTOPUS의 하드웨어는 자체 개발된 SMX-1시스팀의 하드웨어를 사용하며 그위에 링크상태 분석기용 소프트웨어를 탑재하게 된다.

  • PDF

Distributed Algorithm to search paths in distributed metabolic pathway networks (분산된 대사 네트워크에 대한 경로탐색을 위한 분산 알고리즘)

  • Lee Sun-a;Lee Keon-Myoung
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.04a
    • /
    • pp.349-352
    • /
    • 2005
  • 이 논문에서는 분산된 생물학의 대사 네트워크들이 있을 때, 이를 통합하지 않은 상태에서 경로검색을 하는 분산 알고리즘을 제안한다. 대사 네트워크는 여러 데이터베이스에 존재하며 서로 중복되는 데이터를 가지고 있다. 제안한 방법은 네트워크 사이의 중첩이 있는 부분을 하이퍼 노드로 하고, 네트워크 자체는 하이퍼 에지로 하는 추상 하이퍼 그래프를 만들어서, 이를 이용한 상위수준의 경로를 구축한다. 각 네트워크내의 중첩된 영역간의 경로를 미리 계산해 둔 다음, 상위수준의 경로에 기반하여 분산된 대사네트워크 간에 존재하는 경로를 검색한다. 추상 하이퍼 그래프는 데이터베이스를 하이퍼 노드로 하는 것에 대한 경로탐색을 한 다음, 그 경로에 따라 데이터베이스 내에 존재하는 대사경로를 탐색한다. 이때 존재하는 대사경로가 많기 때문에 각각의 대사경로를 하이퍼 노드로 하는 추상 하이퍼 그래프를 만들어 경로를 탐색하고 나서 그 하위 노드에 대해 경로탐색을 한다. 이는 분산된 네트워크를 통합할 저장 공간 및 탐색시간을 줄일 수 있다는 장점이 있다.

  • PDF

Comparison Between OWL and Topic Maps Using Ontology Development Tool (온톨로지 저작도구를 이용한 OWL과 토픽맵의 비교)

  • Park Soo-Min;Kim Hoon-Min;Yang Jung-Jin
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.211-213
    • /
    • 2006
  • 시맨틱 웹과 에이전트 시스템을 위한 지식 기반(Knowledge Base)을 구축하기 위해 W3C의 RDF와 ISO의 토픽맵(Topic Maps)이 사용되고 있다. 이 두 표준은 표현력 상에서 중복되는 부분이 많음에도 불구하고 서로 다른 방면을 추구하였지만, 최근 W3C에서는 Task Force 팀을 구성하여 둘 사이의 상호운용성을 확보하려는 시도를 보이고 있다. 이에 따라 단순히 자원에 대한 메타 데이터를 구축하는 RDF에 semantic을 부여하는 RDF Vocabulary인 OWL과 토픽맵 간의 상호운용도 관심을 받기 시작하였다. 본 논문에서는 이러한 OWL과 토픽맵의 상호운용 가능성을 확인하기 위해 두 표준을 지원하는 각 저작 도구를 활용하여 표현력과 기능적 비교를 수행하고 이를 통하여 둘 사이에 어떠한 차이점이 있는가와 기능적인 극복을 위한 대안을 제시한다.

  • PDF

Design of Roving Nightingales Supporting System based on PDA for Mobile Computing (무선 이동 환경을 위한 PDA 기반의 방문형 간호정보 시스템 설계)

  • Kim, Hyo-Ju;Joo, Kyung-Soo
    • Proceedings of the KAIS Fall Conference
    • /
    • 2003.06a
    • /
    • pp.185-188
    • /
    • 2003
  • 오늘날 많은 병원이 전산화를 통해 병원 경영을 개선하고자 병원정보시스템을 구축하고 있다. 병원정보시스템의 한 부분으로 간호사들의 업무수행을 지원하는 도구인 간호정보시스템은 환자 간호에서 효율성의 증가와 환자의 안전과 만족도가 증가하는 데 한 몫을 한다. 그러나 기존의 의료정보시스템에서는 전산 시스템과 실제 간호업무가 분리되어, 업무가 이중적으로 이뤄지고 있다. 이런 비효율적인 사례의 개선방법으로 PDA로의 업무 전환을 연구 하고자 한다. 본 논문에서는 무선 Online 시스템과, 데이터 동기화 기반의 Offline 시스템을 선택적으로 사용이 가능하도록 하여 모든 업무처리를 방문한 간호 현장에서 실시함으로써 시간 및 비용을 절감하고, 신속한 의사전달 체계를 확립함으로써 간호 업무의 효율을 향상시킬 수 있으며, 업무의 중복과 오류의 가능성을 줄일 수 있도록 할 것이다.

  • PDF

A Design on the Vector-Processor of 2048 Point MDCT/IMDCT for Digital Audio (디지털 오디오를 위한 2048포인트 MDCT/IMDCT 벡터프로세서 설계)

  • Gu, Dae Seong;Jeong, Yang Gwon;Kim, Jong Bin
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.28 no.9C
    • /
    • pp.851-859
    • /
    • 2003
  • 최근 사용자들의 멀티채널 선호도는 급속도로 전파되고 있다. MPEG은 동영상 및 음향시스템의 데이터 압축기술을 제공하는데, 현재 각광을 받고있는 것이 디지털 오디오이다. MPEG 표준안은 MPEG-1오디오 알고리즘을 MPEG-2 알고리즘에 동일하게 사용해도 멀티채널 및 5.1채널 사운드륵 제공한다. MDCT(Modified Discrete Cosine Transform)는 TDAC(Time Domain Aliasing Cancellation)에 기반을 두고있는 변형이산 여현 변환을 나타낸 것이다. 본 논문에서는 오디오 부분의 핵심이라 할 수 있는 MDCT/IMDCT(Inverse MDCT) 알고리즘을 최적화하여 효율적인 알고리즘을 제안하였다. 그리고 연산과정에서 중복되는 영역을 묶음으로써 연산에 필요한 계수를 줄였다. 최적화 전에 비해 코사인 계수를 0.5%이하로 최적화하였고, 승산에서 0.098%, 가산에서 0.58% 효율을 보였다. 알고리즘 검증은 C언어를 사용하여 검증하였고, 최적화된 알고리즘을 적용하여 마이크로 프로그램 방식의 하드웨어 구조론 설계하였다.

The Generation of Control Rules for Data Mining (데이터 마이닝을 위한 제어규칙의 생성)

  • Park, In-Kyoo
    • Journal of Digital Convergence
    • /
    • v.11 no.11
    • /
    • pp.343-349
    • /
    • 2013
  • Rough set theory comes to derive optimal rules through the effective selection of features from the redundancy of lots of information in data mining using the concept of equivalence relation and approximation space in rough set. The reduction of attributes is one of the most important parts in its applications of rough set. This paper purports to define a information-theoretic measure for determining the most important attribute within the association of attributes using rough entropy. The proposed method generates the effective reduct set and formulates the core of the attribute set through the elimination of the redundant attributes. Subsequently, the control rules are generated with a subset of feature which retain the accuracy of the original features through the reduction.

The study of integration techniques for storing XML documents efficiently based on structures and semantics (구조 및 의미적 유사성에 기반한 XML 문서들의 효율적인 저장을 위한 통합 기법)

  • 김연희;김병곤;이재호;임해철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.590-592
    • /
    • 2003
  • 최근 XML이 웹 상의 데이터의 표현, 교환, 중재의 표준으로 각광받으면서 이러한 XML 문서를 효과적으로 저장, 접근 및 검색하기 위한 기법에 대한 연구가 많았으나, 기존의 연구들은 하나의 XML 문서를 저장 및 검색의 대상으로 하는 경우가 대부분이였다. 그러나 XML 문서를 데이터의 표현과 교환의 표준으로 이용하는 애플리케이션의 개발이 점차 활성화됨에 따라 저장해야하는 XML 문서의 수가 크게 증가하면서 의미나 구조적으로 많은 유사성을 지니는 XML 문서들을 함께 효율적으로 저장하고 검색하기 위한 기법의 연구가 요구된다. 따라서 본 논문에서는 의미 및 구조적으로 유사성을 가지는 여러 XML 문서들을 통합하는 기법을 제안한다. 제안된 통합 기법은 같은 DTD나 XML Schema를 가지는 경우와 다른 DTD나 XML Schema를 가지는 경우를 모두 고려한다. 또한 특별한 구조적 정보를 가지지 않는 XML 문서의 경우도 다른 DTD나 XML Schema를 가지는 경우와 마찬가지로 처리함으로써 다양한 XML 문서들에 대한 통합이 가능하도록 한다. 이러한 통합 기법은 중복되는 엘리먼트나 애트리뷰트에 대한 저장 공간의 낭비를 최소화한다. 또한 의미적으로 또는 구조적으로 관련성있는 여러 XML 문서의 부분들을 디스크 상의 페이지내에 서로 가까이 저장할 수 있기 때문에 사용자의 일반적인 질의에 대해 효율적이고 빠른 검색 결과를 유도할 수 있고, I/O 횟수를 줄임으로써 그에 따른 오버헤드를 줄일 수 있는 장점이 있다.

  • PDF

A Study on Common Interface providing among Heterogeneous Terminal in Ubiquitous (유비쿼터스 환경에서 이기종 단말기 간의 공통 인터페이스 제공에 관한 연구)

  • Park, Jung-Yeon
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.11a
    • /
    • pp.391-394
    • /
    • 2006
  • This paper deals with the method will be able to support a common interface softly for the different with each other operating system users in next generation ubiquitous network. To controls in proxy servers that data portion be able to use commonly such as each different instruction, metaphor, image based on operating system, icons, it will be able to increases the efficiency of bandwidth use and minimizes a duplication transmission data from inside the bandwidth which is limited. Also it will be able to do method of common user interface provision to support seamless connectivity with each different network devices in the next generation.

  • PDF

Classifying Cancer Using Partially Correlated Genes Selected by Forward Selection Method (전진선택법에 의해 선택된 부분 상관관계의 유전자들을 이용한 암 분류)

  • 유시호;조성배
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.41 no.3
    • /
    • pp.83-92
    • /
    • 2004
  • Gene expression profile is numerical data of gene expression level from organism measured on the microarray. Generally, each specific tissue indicates different expression levels in related genes, so that we can classify cancer with gene expression profile. Because not all the genes are related to classification, it is needed to select related genes that is called feature selection. This paper proposes a new gene selection method using forward selection method in regression analysis. This method reduces redundant information in the selected genes to have more efficient classification. We used k-nearest neighbor as a classifier and tested with colon cancer dataset. The results are compared with Pearson's coefficient and Spearman's coefficient methods and the proposed method showed better performance. It showed 90.3% accuracy in classification. The method also successfully applied to lymphoma cancer dataset.