• 제목/요약/키워드: 대용화

검색결과 1,122건 처리시간 0.026초

대용량 데이터를 위한 전역적 범주화를 이용한 결정 트리의 순차적 생성 (Incremental Generation of A Decision Tree Using Global Discretization For Large Data)

  • 한경식;이수원
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.487-498
    • /
    • 2005
  • 최근 들어, 대용량의 데이터를 처리할 수 있는 트리 생성 방법에 많은 관심이 집중되고 있다 그러나 대용량 데이터를 위한 대부분의 알고리즘은 일괄처리 방식으로 데이터를 처리하기 때문에 새로운 데이터가 추가되면 이 데이터를 반영한 결정 트리를 생성하기 위해 처음부터 트리를 다시 생성해야 하다. 이러한 재생성에 따른 비용문제에 보다 효율적인 접근 방법은 결정 트리를 순차적으로 생성하는 접근 방법이다. 대표적인 알고리즘으로 BOAT와 ITI를 들 수 있으며 이들 알고리즘은 수치형 데이터 처리를 위해 지역적 범주화를 이용한다. 그러나 범주화는 정렬된 형태의 수치형 데이터를 요구하기 때문에 대용량 데이터를 처리해야하는 상황에서 전체 데이터에 대해 한번만 정렬을 수행하는 전역적 범주화 기법이 모든 노드에서 매번 정렬을 수행하는 지역적 범주화보다 적합하다. 본 논문은 수치형 데이터 처리를 위해 전역적 범주화를 이용하여 생성된 트리를 효율적으로 재생성하는 순차적 트리 생성 방법을 제안한다. 새로운 데이터가 추가될 경우, 전역적 범주화에 기반 한 트리를 순차적으로 생성하기 위해서는 첫째, 이 새로운 데이터가 반영된 범주를 재생성해야 하며, 둘째, 범주 변화에 맞게 트리의 구조를 변화시켜야한다. 본 논문에서는 효율적인 범주 재생성을 위해 샘플 분할 포인트를 추출하고 이로부터 범주화를 수행하는 기법을 제안하며 범주 변화에 맞는 트리 구조 변화를 위해 신뢰구간과 트리 재구조화기법을 이용한다. 본 논문에서 피플 데이터베이스를 이용하여 기존의 지역적 범주화를 이용한 경우와 비교 실험하였다.

실제 멀티모달 환경에서의 지시 대용어 처리 (Resolution of Deictic Anaphora in Real Multimodal Environments)

  • 최맹식;이세희;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.151-155
    • /
    • 2008
  • 언어기반 대화 시스템에서는 시스템과 사용자의 대화가 발화 자체만으로 이루어지기 때문에 사용자가 사람과 대화하는 것처럼 지시 대용어를 사용할 수 없어서 불편하다. 그리고 사용자의 발화 의미를 시스템이 정확하게 해석하기가 어렵다. 하지만 이런 언어기반 대화 시스템과는 달리 멀티모달 대화 시스템에서는 발화 자체의 정보뿐만이 아닌 제스처와 같은 발화 이외의 행위 정보들이 포함되는데 이 정보를 이용하면 지시 대용어의 처리가 가능해짐으로 시스템과의 대화가 좀 더 자연스러워진다. 본 논문에서는 군집화와 격틀을 이용하여 여러 사물들 중에서 지시 대용어가 될 가능성이 있는 지시 후보 선정을 한다. 그리고 특출성 점수와 엔트로피를 이용하여 후보 사물들 중에서 지시 대용어가 될 수 있는 대상을 선택하는 알고리즘을 제안한다. 시뮬레이션 환경에서의 실험결과 평균 2.8번의 상호작용으로 지시 대용어를 처리할 수 있었다.

  • PDF

구문 정보와 비용기반 중심화 이론에 기반한 자연스러운 지시어 생성 (Generation of Natural Referring Expressions by Syntactic Information and Cost-based Centering Model)

  • 노지은;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권12호
    • /
    • pp.1649-1659
    • /
    • 2004
  • 텍스트 생성(text generation)은 언어가 아닌 다양한 지식원으로부터 텍스트를 생성해 내는 언어 처리의 한 분야로, 여러 가지 복합적이고 단계적인 과정을 통해 이루어진다. 본 논문에서는 자연스러운 텍스트 생성을 위한 여러 과정 중, 한번 언급된 대상(entity)을 자연스럽게 지시(refer)하기 위한 지시어 생성(referring expression generation), 특히 한국어에 두드러진 영형(zero pronoun)에 의한 대용화(pronominalization) 과정에 초점을 맞춘다. 이를 위해, 구문 정보와 비용기반 중심화 이론(cost-based centering model)을 바탕으로, 한국어에 적합한 지시어 특히 영형의 생성에 영향을 미치는 다양한 자질(feature)들온 규명하고, 기계 학습을 통해 지시어 생성 모델을 구축하였다. 세 개의 장르 - 묘사문(설명문), 뉴스, 짧은 우화 - 에서 총 95개의 텍스트로부터 학습이 이루어 졌으며 이론 대상으로, 제안된 자질들이 지시어의 생성, 특히 영형의 생성에 효율적으로 적용될 수 있음을 보였다. 또한, 지시어 생성과 관련된 기존의 방법론들과 본 논문에서 제안한 모델을 비교하여 성능이 크게 향상되었음을 보이고, T-test를 통해 99.9%의 신뢰 구간에서 그 성능 향상이 통계적으로 의미가 있음을 확인하였다.

Oracle 기반의 대용량 지도 서비스를 위한 XServer의 설계 및 구현 (Design and Implementation of the XServer for Oracle-based Mass Map Services)

  • 신중수;김동오;강홍구;박춘걸;한기준
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 추계학술대회
    • /
    • pp.47-54
    • /
    • 2005
  • 정보 사회가 발전하고 정보의 활용이 늘어남에 따라 공간 데이타가 다양한 분야에서 활용되고 있다. 그리고, 공간 데이타가 널리 활용됨에 따라 ESRI와 같은 다양한 지리 정보 시스템(Geography Information System)이 발전하게 되었다. 그러나, 기존의 지리 정보 시스템은 다양한 분야에서의 활용을 위해 많은 기능을 제공함으로 인해 일반적으로 대용량 공간 데이타에 대한 검색이 비효율적이다. 특히, 네트워크 환경이 발전하고 컴퓨팅 파워가 증가함에 따라 점차 대용량의 지도 서비스를 제공하는 분야에서 기존의 지리 정보 시스템 적용 시공간 데이타 검색 속도가 저하되는 문제가 발생한다. 따라서, 본 논문에서는 안정적인 상용 DBMS인 Oracle을 기반으로 대용량 공간 데이터를 효율적으로 검색할 수 있는 Oracle 기반의 대용량 지도 서비스를 위한 XServer를 설계 및 개발하였다. XServer는 다양한 클라이언트의 질의를 효율적으로 처리하기 위한 질의 처리 관리자, 대용량의 공간 데이타를 빠르게 검색하기 위한 공간 인덱스 관리자 및 데이타 버퍼 관리자, 대용량의 공간 데이타를 안정적으로 저장하기 위해서 Shape 화일에서 추출한 공간 데이타를 Oracle에 저장 및 관리하기 위한 수입/수출 관리자와 DB 관리자로 구성되어있다. 마지막으로, 본 연구에서 개발한 Oracle 기반의 대용량 지도 서비스를 위한 XServer와 Oracle Spatial을 비교함으로써 기능을 검증하고 성능의 우수함을 입증하였다.

  • PDF

모바일 환경에서 동시 양방향 동기화 프로토콜의 설계 (The Design of Cocurrent Two-Way Synchronizations Protocol on a Mobile Environments)

  • 김홍기;김동현
    • 한국정보통신학회논문지
    • /
    • 제12권12호
    • /
    • pp.2226-2231
    • /
    • 2008
  • 모바일 기기와 무선 통신 기술이 발달함에 따라 모바일 기기에서 수집 또는 변경되는 대용량 시공간 데이터를 서버와 현장에서 동기화하는 서비스의 제공이 가능해졌다. 다수의 모바일 기기에서 변경된 대용량 시공간 데이터를 서버와 동기화하는 효율적인 양방향 동기화 프로토콜이 필요하다. 그러나 다수의 모바일 기기에 대하여 동기화 작업을 수행할 때 처리 시간이 길어지는 문제가 있다. 이 논문에서는 다수의 양방향 동기화 작업에 대하여 다중 큐를 이용하여 서버에서 동시 수행하는 처리기법에 대하여 제안한다.

초고속 대용량 바이오 기술과 이의 화장품연구 활용 방안 (High Throughput Biotechnologies and Their Applications for the Cosmetic Research)

  • 이태룡
    • 한국생물공학회:학술대회논문집
    • /
    • 한국생물공학회 2001년도 추계학술발표대회
    • /
    • pp.123-138
    • /
    • 2001
  • 최근 인간 유전체 사업(Human Genome Project)의 완성과 DNA Microarray, Proteomics, Bioinformatics 등의 초고속, 대용량 처리 바이오기술 (High Throughput Biotechnology)의 발전과 함께 생명과학 분야의 연구는 획기적인 변화의 시기를 맞이하게 되었다. 이미 의약품 분야는 이러한 기술을 활용한 연구가 보편화 되어있고 선진 외국 회사들의 화장품연구 또한 이를 활용한 연구가 본격화 되고 있다. 화장품개발에 있어서도 이러한 기술들의 활용이 불가피하게 되었다 . 여기서는 이러한 새로운 바이오기술들에 관해 간단히 알아보고 향후 이러한 기술들의 효과적인 화장품개발 관련연구 활용범위와 활용방법에 대하여 알아본다.

  • PDF

국내 이동통신 서비스의 추가 주파수분배에 관한 연구 (A Study on the Additional Spectrum Allocation for Domestic Celluar Mobile Service)

  • 김종호;이재욱;박덕규
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 추계종합학술대회 논문집
    • /
    • pp.253-259
    • /
    • 2003
  • 최근 각 이동통신사업별로 기존의 CDMA 방식을 이용하여 IMT-2000의 서비스에 해당되는 대용량 데이터서비스를 제공하고 있다. 그러나 각 사업자 별로 할당된 현재의 주파수대역으로는 영상서비스를 기본으로 하는 대용량 데이터서비스를 제공하기 어려운 상황이며, 새로운 주파수대역의 추가 분배가 필요한 상태이다. 본 논문에서는 ITU-R에서 제시하고 있는 권고안을 기초로 국내 이동통신서비스 확대에 요구되는 추가 스펙트럼 요구량을 산출하였으며, 디지털 이동통신서비스를 위해 필요한 스펙트럼 효율의 정량화 및 추가 소요 주파수 대역을 계산하는 방법을 정량화 하였다.

  • PDF

소각재 재활용을 위한 에이전트 기반 RFID 모델 설계 (Agent-Based RFID Model Design for Cinder Reuse)

  • 김귀정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.201-204
    • /
    • 2007
  • 본 논문은 소각재 재활용 모니터링 시스템 구현을 위한 에이전트 기반의 RFID 모델을 설계한다. RFID를 이용한 모니터링 시스템은 상태관리 에이전트, 위치관리 에이전트, 불량관리 에이전트, 상황관리 에이전트 등의 데이터 관리 에이전트를 이용해 데이터를 자동 관리하고, 대용량의 데이터를 처리하기 위해 대용량 데이터 처리 에이전트를 이용한다. 안정적인 소각재 재활용을 위한 에이전트 기반 데이터 모니터링 시스템의 개발은 산업체 전반에 걸쳐있는 기계화, 수작업화 된 공정을 실시간 자동화 공정으로 개발하는 획기적인 방법이 될 것이다.

  • PDF

WDM 슬러티드 링 통신망에서 큐의 크기가 성능에 미치는 영향 (Effect of Queue Size on Performances in WDM Slotted Ring Networks)

  • 이창진;신종덕
    • 한국광학회:학술대회논문집
    • /
    • 한국광학회 2003년도 제14회 정기총회 및 03년 동계학술발표회
    • /
    • pp.316-317
    • /
    • 2003
  • 오늘날 광 통신망이 지향하는 바는 ‘고속화’, ‘대용량화’, 그리고 ‘장거리화’의 3가지로 집약할 수 있다. 1990년대 후반에 본격적으로 도입된 WDM(Wavelength Division Multiplexing) 기술은 하나의 광섬유에 파장이 다른 다수의 광 채널 신호를 동시에 전송할 수 있는 기술로서, 별도의 광섬유를 포설하지 않고도 광통신망의 용량을 경제적으로 신속히 확장할 수 있기 때문에 대용량화를 위한 대표적인 기술로 자리 잡았다. (중략)

  • PDF

초고속 대용량 바이오 기술과 이의 화장품연구 활용 방안 (High Throughput Biotechnologies and Their Applications for the Cosmetic ]Research)

  • 이태룡
    • 대한화장품학회지
    • /
    • 제27권2호
    • /
    • pp.15-30
    • /
    • 2001
  • 최근 인간 유전체 사업(Human Genome Project)의 완성과 DNA Microarray, Proteomics, Bioinformatics 등의 초고속, 대용량 처리 바이오기술(High Throughput Biotechnology)의 발전과 함께 생명과학 분야의 연구는 획기적인 변화의 시기를 맞이하게 되었다. 이미 의약품 분야는 이러한 기술을 활용한 연구가 보편화 되어있고 선진 외국 회사들의 화장품연구 또한 이를 활용한 연구가 본격화 되고 있다. 화장품개발에 있어서도 이러한 기술들의 활용이 불가피하게 되었다. 여기서는 이러한 새로운 바이오기술들에 관해 간단히 알아보고 향후 이러한 기술들의 효과적인 화장품개발 관련연구 활용범위와 활용방법에 대하여 알아본다.

  • PDF