• 제목/요약/키워드: 데이터 부분 중복

검색결과 79건 처리시간 0.03초

대화체 번역을 위한 논항 구조에 기반한 한국어 분석 (A Korean Analysis based on Argument Structures for Spoken Language Translation)

  • 정천영;서영훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권4호
    • /
    • pp.380-387
    • /
    • 2001
  • 본 논문에서는 대화체 번역을 위한 논항 구조에 기반한 한국어 분석에 대하여 기술한다. 논항구조 기반 문법은 순서에 관계없이 기술된다. 따라서 한국어 부분 자유 어순 특성으로 문법이 방대해지는 문제점을 해결할 수 있다. 또한, 서술어가 지배하는 논항이 문법으로부터 선택됨으로서 대화체가 갖는 특성인 간투어나 중복 발화 현상 등을 효과적으로 해결할 수 있다. 실험을 위하여 사용된 데이터는 ‘여행 안내’ 영역 중에서 1,335개의 훈련된 발화문과 420개의 훈련되지 않은 발화문이다. 실험 결과 훈련된 발화문에서는 99.7%, 훈련되지 않은 발화문에서는 93.3%의 분석 성공률을 보였다.

  • PDF

OCTOPUS : 다중링크상태분석기

  • 이근우
    • ETRI Journal
    • /
    • 제14권3호
    • /
    • pp.16-30
    • /
    • 1992
  • SMX-1 시스팀과 같이 다수의 신호링크들이 운용되면서 신호망의 시험 및 운용이 이루어질 때 부분적인 분석 검증이 아닌 시스팀의 전반적인 검증에서부터 망차원에서의 동작여부를 판단하여 시스팀을 수정, 보완해가야 할 필요성이 있다. 그러나, 범용의 링크상태분석기를 사용하는 것은 한정된(1 또는 2 링크)신호링크만을 제공하기 때문에 다수의 신호링크에 대한 실시간 상태분석을 할 수 없는 점, 이미 정해진 메시지만을 추출/검색할 수 있기때문에 사용자가 원하는 형태의 니모닉 검색/추출이 되지 않는 기능상의 미비점, 다수의 신호링크를 제공하기 위해서 고가의 링크상태 분석기를 여러대 구입하는 것은 중복구매로 인한 예산문제 등 많은 문제점들이 있다. OCTOPUS는 이러한 문제점들을 해결하기위해 제안된 다중링크상태분석기로서, 상태분석시 다수의 신호링크를 제공할 수 있고, 사용자가 원하는 형태의 니모닉 검색/추출이 가능하며, SMX-1 연구결과인 부산물을 이용한다는 측면과, No. 7 레벨2 프로토콜을 이용한 레벨2 비가용원인이유 파악기능제공, 유사한 형태의 HDLC(데이터링크 프로토콜) 처리기능등을 제공할 수 있다는 것이 장점이다. OCTOPUS의 하드웨어는 자체 개발된 SMX-1시스팀의 하드웨어를 사용하며 그위에 링크상태 분석기용 소프트웨어를 탑재하게 된다.

  • PDF

분산된 대사 네트워크에 대한 경로탐색을 위한 분산 알고리즘 (Distributed Algorithm to search paths in distributed metabolic pathway networks)

  • 이선아;이건명
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.349-352
    • /
    • 2005
  • 이 논문에서는 분산된 생물학의 대사 네트워크들이 있을 때, 이를 통합하지 않은 상태에서 경로검색을 하는 분산 알고리즘을 제안한다. 대사 네트워크는 여러 데이터베이스에 존재하며 서로 중복되는 데이터를 가지고 있다. 제안한 방법은 네트워크 사이의 중첩이 있는 부분을 하이퍼 노드로 하고, 네트워크 자체는 하이퍼 에지로 하는 추상 하이퍼 그래프를 만들어서, 이를 이용한 상위수준의 경로를 구축한다. 각 네트워크내의 중첩된 영역간의 경로를 미리 계산해 둔 다음, 상위수준의 경로에 기반하여 분산된 대사네트워크 간에 존재하는 경로를 검색한다. 추상 하이퍼 그래프는 데이터베이스를 하이퍼 노드로 하는 것에 대한 경로탐색을 한 다음, 그 경로에 따라 데이터베이스 내에 존재하는 대사경로를 탐색한다. 이때 존재하는 대사경로가 많기 때문에 각각의 대사경로를 하이퍼 노드로 하는 추상 하이퍼 그래프를 만들어 경로를 탐색하고 나서 그 하위 노드에 대해 경로탐색을 한다. 이는 분산된 네트워크를 통합할 저장 공간 및 탐색시간을 줄일 수 있다는 장점이 있다.

  • PDF

온톨로지 저작도구를 이용한 OWL과 토픽맵의 비교 (Comparison Between OWL and Topic Maps Using Ontology Development Tool)

  • 박수민;김훈민;양정진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.211-213
    • /
    • 2006
  • 시맨틱 웹과 에이전트 시스템을 위한 지식 기반(Knowledge Base)을 구축하기 위해 W3C의 RDF와 ISO의 토픽맵(Topic Maps)이 사용되고 있다. 이 두 표준은 표현력 상에서 중복되는 부분이 많음에도 불구하고 서로 다른 방면을 추구하였지만, 최근 W3C에서는 Task Force 팀을 구성하여 둘 사이의 상호운용성을 확보하려는 시도를 보이고 있다. 이에 따라 단순히 자원에 대한 메타 데이터를 구축하는 RDF에 semantic을 부여하는 RDF Vocabulary인 OWL과 토픽맵 간의 상호운용도 관심을 받기 시작하였다. 본 논문에서는 이러한 OWL과 토픽맵의 상호운용 가능성을 확인하기 위해 두 표준을 지원하는 각 저작 도구를 활용하여 표현력과 기능적 비교를 수행하고 이를 통하여 둘 사이에 어떠한 차이점이 있는가와 기능적인 극복을 위한 대안을 제시한다.

  • PDF

무선 이동 환경을 위한 PDA 기반의 방문형 간호정보 시스템 설계 (Design of Roving Nightingales Supporting System based on PDA for Mobile Computing)

  • Kim, Hyo-Ju;Joo, Kyung-Soo
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 춘계학술발표논문집
    • /
    • pp.185-188
    • /
    • 2003
  • 오늘날 많은 병원이 전산화를 통해 병원 경영을 개선하고자 병원정보시스템을 구축하고 있다. 병원정보시스템의 한 부분으로 간호사들의 업무수행을 지원하는 도구인 간호정보시스템은 환자 간호에서 효율성의 증가와 환자의 안전과 만족도가 증가하는 데 한 몫을 한다. 그러나 기존의 의료정보시스템에서는 전산 시스템과 실제 간호업무가 분리되어, 업무가 이중적으로 이뤄지고 있다. 이런 비효율적인 사례의 개선방법으로 PDA로의 업무 전환을 연구 하고자 한다. 본 논문에서는 무선 Online 시스템과, 데이터 동기화 기반의 Offline 시스템을 선택적으로 사용이 가능하도록 하여 모든 업무처리를 방문한 간호 현장에서 실시함으로써 시간 및 비용을 절감하고, 신속한 의사전달 체계를 확립함으로써 간호 업무의 효율을 향상시킬 수 있으며, 업무의 중복과 오류의 가능성을 줄일 수 있도록 할 것이다.

  • PDF

디지털 오디오를 위한 2048포인트 MDCT/IMDCT 벡터프로세서 설계 (A Design on the Vector-Processor of 2048 Point MDCT/IMDCT for Digital Audio)

  • 구대성;정양권;김종빈
    • 한국통신학회논문지
    • /
    • 제28권9C호
    • /
    • pp.851-859
    • /
    • 2003
  • 최근 사용자들의 멀티채널 선호도는 급속도로 전파되고 있다. MPEG은 동영상 및 음향시스템의 데이터 압축기술을 제공하는데, 현재 각광을 받고있는 것이 디지털 오디오이다. MPEG 표준안은 MPEG-1오디오 알고리즘을 MPEG-2 알고리즘에 동일하게 사용해도 멀티채널 및 5.1채널 사운드륵 제공한다. MDCT(Modified Discrete Cosine Transform)는 TDAC(Time Domain Aliasing Cancellation)에 기반을 두고있는 변형이산 여현 변환을 나타낸 것이다. 본 논문에서는 오디오 부분의 핵심이라 할 수 있는 MDCT/IMDCT(Inverse MDCT) 알고리즘을 최적화하여 효율적인 알고리즘을 제안하였다. 그리고 연산과정에서 중복되는 영역을 묶음으로써 연산에 필요한 계수를 줄였다. 최적화 전에 비해 코사인 계수를 0.5%이하로 최적화하였고, 승산에서 0.098%, 가산에서 0.58% 효율을 보였다. 알고리즘 검증은 C언어를 사용하여 검증하였고, 최적화된 알고리즘을 적용하여 마이크로 프로그램 방식의 하드웨어 구조론 설계하였다.

데이터 마이닝을 위한 제어규칙의 생성 (The Generation of Control Rules for Data Mining)

  • 박인규
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.343-349
    • /
    • 2013
  • 러프집합에서는 동치류와 근사공간의 개념을 이용하여 데이터 마이닝 분야에서 중복되는 정보로부터 특징점을 효율적으로 추출하여 최적화된 제어규칙을 유도할 수 있다. 이러한 추출과정에서 가장 중요하게 고려되어져야 할 부분은 많은 속성에 대한 감축이다. 본 논문에서는 속성간의 관계에서 러프엔트로피를 이용하여 가장 신뢰도가 우수한 속성을 구할 수 있는 정보이론적인 척도를 제시한다. 제안된 방법은 러프엔트로피를 기반으로 불필요한 속성을 제거함으로써 유용한 리덕트를 생성하고 이들에 대한 코어를 형성한다. 결과적으로 원시정보의 내용은 변하지 않으면서 지식감축을 통하여 간소화된 제어규칙을 구축할 수 있음을 보인다.

구조 및 의미적 유사성에 기반한 XML 문서들의 효율적인 저장을 위한 통합 기법 (The study of integration techniques for storing XML documents efficiently based on structures and semantics)

  • 김연희;김병곤;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.590-592
    • /
    • 2003
  • 최근 XML이 웹 상의 데이터의 표현, 교환, 중재의 표준으로 각광받으면서 이러한 XML 문서를 효과적으로 저장, 접근 및 검색하기 위한 기법에 대한 연구가 많았으나, 기존의 연구들은 하나의 XML 문서를 저장 및 검색의 대상으로 하는 경우가 대부분이였다. 그러나 XML 문서를 데이터의 표현과 교환의 표준으로 이용하는 애플리케이션의 개발이 점차 활성화됨에 따라 저장해야하는 XML 문서의 수가 크게 증가하면서 의미나 구조적으로 많은 유사성을 지니는 XML 문서들을 함께 효율적으로 저장하고 검색하기 위한 기법의 연구가 요구된다. 따라서 본 논문에서는 의미 및 구조적으로 유사성을 가지는 여러 XML 문서들을 통합하는 기법을 제안한다. 제안된 통합 기법은 같은 DTD나 XML Schema를 가지는 경우와 다른 DTD나 XML Schema를 가지는 경우를 모두 고려한다. 또한 특별한 구조적 정보를 가지지 않는 XML 문서의 경우도 다른 DTD나 XML Schema를 가지는 경우와 마찬가지로 처리함으로써 다양한 XML 문서들에 대한 통합이 가능하도록 한다. 이러한 통합 기법은 중복되는 엘리먼트나 애트리뷰트에 대한 저장 공간의 낭비를 최소화한다. 또한 의미적으로 또는 구조적으로 관련성있는 여러 XML 문서의 부분들을 디스크 상의 페이지내에 서로 가까이 저장할 수 있기 때문에 사용자의 일반적인 질의에 대해 효율적이고 빠른 검색 결과를 유도할 수 있고, I/O 횟수를 줄임으로써 그에 따른 오버헤드를 줄일 수 있는 장점이 있다.

  • PDF

유비쿼터스 환경에서 이기종 단말기 간의 공통 인터페이스 제공에 관한 연구 (A Study on Common Interface providing among Heterogeneous Terminal in Ubiquitous)

  • 박정연
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.391-394
    • /
    • 2006
  • 본 논문은 차세대 유비쿼터스 네트워크에서 서로 다른 운영체제 사용자 간의 공통 인터페이스를 유연하게 지원할 수 있는 방법을 제시하였다. 각기 다른 명령이나 메타포, 운영체제에 기반하는 이미지, 아이콘들처럼 공용으로 사용할 수 있는 데이터 부분을 각기 코드값화하여 프록시 서버에서 처리함으로써, 한정된 대역안에서의 대역폭 사용 효율증가와 중복전송 데이터를 최소화할 수 있다. 또한 차세대 이기종 장치간의 지속적인 연결성을 지원하기 위한 공통 사용자 인터페이스를 제공 방안으로 활용될 수 있겠다.

  • PDF

전진선택법에 의해 선택된 부분 상관관계의 유전자들을 이용한 암 분류 (Classifying Cancer Using Partially Correlated Genes Selected by Forward Selection Method)

  • 유시호;조성배
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.83-92
    • /
    • 2004
  • 유전 발현 데이터는 생명체의 특정 조직에서 채취한 샘플을 마이크로어레이상에서 측정한 것으로, 유전자들의 발현 정도가 수치로 나타난 데이터이다. 일반적으로 정상조직과 이상조직에서 관련 유전자들의 발현 정도는 차이를 보이기 때문에 유전 발현 데이터를 통하여 암을 분류할 수 있다. 그러나 분류에 모든 유전자가 관여하지는 않으므로 효율적인 암의 분류를 위해서는 관련성 있는 소수의 유전자만을 선별해내는 작업인 특징선택 방법이 필요하다. 본 논문에서는 회귀분석의 변수선택방법중 하나인 전진 선택법(forward selection method)을 사용하여 유전자들을 선하고 분류하는 방법을 제안한다. 이 방법은 선택되는 유전자들의 중복된 정보를 최소화시켜 암의 분류에 있어 보다 효과적인 유전자 선택을 한다. 실험데이터는 대장암 데이터(Colon cancer dataset)를 사용하였고, 분류기는 k-최근접 이웃(KNN)을 사용하였다. 이 방법과 상관계수를 이용한 특징 선택방법인 피어슨 상관계수와 스피어맨 상관계수방법과 비교해본 결과 전진 선택법에 의한 특징선택 방법이 암의 분류에 있어서 더 효과적인 유전자 선택을 한다는 사실을 확인하였다. 실험결과 90.3%의 높은 인식률을 보였다. 추가적으로 림프종 데이터에 대한 실험을 하였고, 그 결과 전진 선택법의 유용성을 확인할 수 있었다.