• 제목/요약/키워드: 데이터 논문

검색결과 41,164건 처리시간 0.073초

변형된 Support Vector Machine을 이용한 유비쿼터스 데이터 마이닝 (Ubiquitous Data Mining Using Hybrid Support Vector Machine)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제15권3호
    • /
    • pp.312-317
    • /
    • 2005
  • 유비쿼터스 컴퓨팅 환경은 정치, 경제, 사회, 문화, 교육 등 대부분의 분야에 많은 영향을 주고 있다. 인터넷에 비해 훨씬 거대한 유비쿼터스 네트워크 환경이 효과적으로 운영되기 위해서는 네트워크에 접속한 다양한 컴퓨터들이 스스로 지능을 가지고 주어진 상황에서 최적의 의사결정을 할 수 있어야 한다. 현재 많은 분야에서 데이터 마이닝은 지능형 시스템 구축을 위한 효과적인 분석도구로 사용되고 있다. 지능화된 유비쿼터스 컴퓨팅 환경의 구현을 위한 유비쿼터스 데이터 마이닝을 위하여 본 논문에서는 변형된 Support Vector Machine 기법을 제안하였다. 유비쿼터스 컴퓨팅 환경에서 상당 부분의 데이터가 센서를 통하여 수집된다. 센서 네트워크를 통하여 수집된 데이터는 상당부분 잡음을 포함한 데이터이다. 제안 기법은 특히 센서 네트워크를 통한 스트림 데이터의 잡음을 제거하는 데 목적을 두고 있다. 본 논문의 실험에서는 유비쿼터스 센서 네트워크를 나타내는 다양한 분포로부터 시뮬레이션 데이터를 생성하여 제안 방법의 성능 평가를 수행하였다.

Web상의 전자문서를 위한 메타데이터 모델의 제안 및 관리시스템의 개발 (Design of Metadata Model and Development of Management System for Electronic Documents on the Web)

  • 정효택;양영종;김순용;이상덕;최윤철
    • 한국정보처리학회논문지
    • /
    • 제5권4호
    • /
    • pp.924-941
    • /
    • 1998
  • 인터넷상에서 탐색 엔진을 사용하여 원하는 데이터에 정확하게 접근하기는 쉽지 않다. 왜냐하면 선택되는 데이터의 수가 많을 뿐만 아니라 해당 데이터와 관련된 충분한 정보를 제공하지 않기 때문이다. 메타데이터는 데이터에 대한 데이터로서, 데이터의 내용은 물론 데이터 자체에 대한 정보도 포함하고 있다. 사용자는 메타데이터를 검색함으로써 해당 데이터에 대한 충분한 정보를 얻을 수 있으므로 원하는 데이터에 보다 정확하게 접근할 수 있으며 그로 인한 데이터의 활용성도 증대될 것이다. 본 논문에서는 메타데이터와 관련된 기술 및 현재 표준화 작업이 진행중이거나 표준으로 채택된 메타데이터 모델들을 분석하였다. 이를 참조하여 인터넷상의 과학기술 분야의 논문, 보고서, 기술문서 등의 문서나 그래픽 이미지를 대상으로 하는 SeriCore메타데이터 모델을 제안하였다. 제안된 SeriCore모델에 따라 메타데이터를 효과적으로 생성, 저장, 검색 할 수 있는 SeriCore 메타데이터 관리시스템을 설계하고 구현하였다.

  • PDF

데이터 마이닝 질의 처리를 위한 질의 처리기 설계 및 구현 (Design and Implementation of a Data Mining Query Processor)

  • 김충석;김경창
    • 정보처리학회논문지D
    • /
    • 제8D권2호
    • /
    • pp.117-124
    • /
    • 2001
  • 데이터 마이닝 시스템은 기본적으로 요약화, 연관화와 분류화 등 다양한 유형의 데이터 마이닝 기능을 포함한다. 이들 기능을 수행하기 위해서 포괄적으로 표현하기 위한 강력한 데이터 마이닝 질의 언어가 요구되며, 사용자에게 보다 친숙한 마이닝 환경을 제공하기 위해서 그래픽 사용자 인터페이스(GUI)를 이용한 데이터 마이닝 질의 언어의 개발이 중요하게 언급된다. 뿐만 아니라 데이터 마이닝 그 자체로서 독립적인 수행이 아니라 수많은 데이터를 포함하며, 의사결정에 적합한 구조로 설계되어 있는 데이터 웨어하우스와 연관된 데이터 마이닝 질의 처리가 필요하다. 본 논문에서는 먼저 GUI를 통하여 사용자가 쉽게 데이터 마이닝 질의를 수행할 수 있도록 한다. 또한 질의를 처리하기 위한 데이터 마이닝 질의 처리 프레임워크를 제시한다. 데이터마이닝 질의의 대상은 데이터 웨어하우스에 저장되어 있는 데이터이기 때문에 데이터 웨어하우스의 구축이 필요하다. 본 논문에서는 데이터 웨어하우스 구축에 필요한 스키마 생성을 위해서 스키마 생성기를 아울러 개발하여 이용한다. 마지막으로 연관 규칙 발견을 위한 데이터 마이닝 질의를 처리하기 위한 질의 처리기의 구현 내용을 보인다.

  • PDF

그래프 구조를 갖는 서지 빅데이터의 효율적인 온라인 탐색 및 분석을 지원하는 그래픽 인터페이스 개발 (Developing Graphic Interface for Efficient Online Searching and Analysis of Graph-Structured Bibliographic Big Data)

  • 유영석;박범준;조선화;이수안;김진호
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.77-88
    • /
    • 2020
  • 최근 다양한 실세계의 복잡한 관계를 그래프의 형태로 구성하고 분석하는 다양한 연구들이 진행되고 있다. 특히 DBLP와 같은 컴퓨터 분야 문헌 데이터 시스템은 논문의 저자, 그리고 논문과 논문들이 서로 인용 관계로 표현되는 대표적인 그래프 데이터이다. 그래프 데이터는 저장 구조 및 표현이 매우 복잡하므로, 문헌 빅데이터의 검색과 분석, 그리고 시각화는 매우 어려운 작업이다. 본 논문에서는 문헌 빅데이터를 그래프의 형태로 시각화한 그래픽 사용자 인터페이스 도구, 즉 EEUM을 개발하였다. EEUM은 그래프 데이터를 시각적으로 표시하여 연결된 그래프 구조에 따라 문헌 데이터를 브라우징 하는 기능을 제공하며, 문헌 빅데이터에 대한 검색 및 관리, 분석이 가능하도록 구현하였다. 또한 EEUM을 DBLP가 제공하는 문헌 그래프 빅데이터에 적용하여 편리하게 검색, 탐색 및 분석하는 할 수 있음을 시연한다. EEUM을 이용하여 모든 연구 분야에서 영향력 있는 저자나 논문을 쉽게 찾을 수 있으며, 여러 저자와 논문 사이의 모든 관계를 한 눈에 볼 수 있는 등 복잡한 문헌 그래프 빅데이터의 검색 및 분석 도구로 편리하게 사용할 수 있다.

유사 비디오 데이터 집합에서 효율적인 특성정보 프로파일 생성 기법 (Efficient Generation of a Feature Profile in a Set of Similar Video Data)

  • 박동철;장중혁;이원석
    • 정보처리학회논문지D
    • /
    • 제12D권2호
    • /
    • pp.219-232
    • /
    • 2005
  • 산업정보사회가 발달함에 따라 다양한 형태의 비디오 데이터들이 여러 분야에서 대량으로 생성되고 있다. 이에 따라 이들의 가공을 통해 비디오에 나타난 의미 정보를 추출하려는 다양한 접근들이 시도되고 있으며, 근래 들어 데이터 마이닝 기법을 응용한 특성정보 프로파일 생성 방법에 대한 관심이 증대되고 있다. 그러나 기존의 연구에서는 시공간적으로 방대한 비디오 데이터의 특징으로 인해 해당 분야에 대한 연구가 소극적으로 진행되어왔다. 본 논문에서는 유사한 의미를 나타내는 비디오 데이터 집합에서 의미있는 지식을 추출하는 특성정보 프로파일 생성 기법을 제안한다. 더불어, 특성정보 프로파일 생성과정의 효율적인 수행을 위해서 다양한 추가 고려 사항을 제시한다. 전체 특성 정보들 중에서 주요 정보에만 집중함으로써 데이터 양을 감소시키는 방법, 잡음 요소를 제거하고 관심영역을 설정하여 데이터 양을 감소시키는 방법 및 동적인 영역에 가중치를 부여하여 추출된 정보의 정확도를 향상시키는 방법 등이 포함된다. 끝으로, 실험용 비디오 데이터에 대하여 논문에서 제안된 다양한 압축 방법을 적용하여 클러스터링을 수행하고 이를 통해 구해진 특성 정보 프로파일과 원본 비디오 데이터의 특성정보와 비교하여 본 논문에서 제시한 다양한 압축 알고리즘을 검증한다.

모바일 서비스를 위한 메인 메모리 기반 공간 데이터 관리자 (Main-Memory Based Spatial Data Manager for Mobile Service)

  • 오병우
    • 한국공간정보시스템학회 논문지
    • /
    • 제8권1호
    • /
    • pp.77-92
    • /
    • 2006
  • 최근 모바일 환경의 급격한 발전으로 모바일 기기에서 지도를 표현하기 위한 필요성이 급증하고 있다. 본 논문은 모바일 환경에서 공간 데이터를 효율적으로 제공하기 위해 가장 중요한 역할을 담당하는 공간 데이터 관리자를 제안한 논문이다. 본 논문에서 제안하는 공간 데이터 관리자는 상호운용성을 지원하면서도 효율적인 성능을 제공하기 위하여 다양한 방법을 사용한다. 상호운용성을 지원하기 위해서는 국제 표준을 준수하여 상이한 환경에서도 재사용성을 보장한다. 성능 향상을 위해서는 물리적인 메인 메모리에 공간 데이터를 적재하고 서비스하여 디스크 접근 시간을 없애고, 결과 데이터 형식으로 미리 변환한 공간 데이터를 메인 메모리에 적재하여 형식 변환에 걸리는 시간이 필요 없도록 한다. 그리고, 모바일 환경에서 유무선 온라인으로 공간 데이터를 실시간으로 전송하는 경우에 전체 데이터를 전송하지 않고 부분적으로 전송된 데이터만으로도 표현이 가능하도록 하여 응답 시간 및 처리 시간을 최소화할 수 있도록 한다.

  • PDF

블록체인을 활용한 양질의 기계학습용 데이터 수집 방안 연구 (High-quality data collection for machine learning using block chain)

  • 김영랑;우정훈;이재환;신지선
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.13-19
    • /
    • 2019
  • 기계학습의 정확도는 학습용 데이터의 양과 데이터의 품질에 많은 영향을 받는다. 기존의 웹을 기반으로 학습용 데이터를 수집하는 것은 실제 학습과 무관한 데이터가 수집 될 수 있는 위험성이 있으며 데이터의 투명성을 보장할 수가 없다. 본 논문에서는 블록체인구조에서 블록들이 직접 병렬적으로 데이터를 수집하게 하고 각 블록들이 수집한 데이터를 타 블록의 데이터와 비교하여 양질의 데이터만을 선별하는 방안을 제안한다. 제안하는 시스템은 각 블록들은 데이터를 서로 블록체인을 통해 공유하며 All-reduce 구조의 Parallel-SGD를 활용하여 다른 블록들의 데이터와 비교를 통해 양질의 데이터만을 선별하여 학습용 데이터셋을 구성할 수가 있다. 또한 본 논문에서는 제안한 구조의 성능을 확인하기 위해 실험을 통해 기존의 벤치마크용 데이터셋의 이미지를 활용하여 변조된 이미지 사이에서 원본 이미지만을 양질의 데이터로 판별함을 확인하였다.

유비쿼터스 데이터베이스를 위한 이미지 데이터 처리 기법 (Image Data Processing for Ubiquitous Database)

  • 서동운;최진영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.81-84
    • /
    • 2006
  • 유비쿼터스 컴퓨팅 환경으로 발전하면서 문자열 위주의 획일적 형태에서 음성, 이미지 등 다양한 형태의 데이터들을 처리하게 되었으며, 또한 빠르고 정확하게 처리되기를 요구하고 있다. 현재 데이터 처리 중심부에 있는 Database는 대부분이 Relation DB 위주로 되어 있어 Datafile 에 데이터를 저장하고 있어 대용량의 이미지 데이터 처리에 적합하지가 않다. 본 논문에서는 이러한 단점을 보강하기 위해 Relation DB 하에서 대용량의 이미지 데이터 처리를 가능하게 하는 기법을 제시한다. 이렇게 함으로써 이미지 데이터를 Upload, Download 시 따른 응답 속도를 보장 할 수 있도록 LRU 알고리즘 기반으로 제안을 하였다. 본 논문에서 제안된 기법은 시뮬레이션을 통해 (1)기존 RDB(Relational Database)의 BLOB(Binary Large Object)필드를 이용한 이미지 데이터 처리 방식, (2)별도의 저장 공간에 이미지 데이터를 입/출하는 방식, (3)별도의 저장 공간에 이미지 데이터를 입/출력할 때 LRU(least Recently Used)알고리즘을 이용하는 방식에 대하여 성능 평가를 하였다. 그 결과 (3)별도의 저장 공간에 LRU(least Recently Used)알고리즘을 이용하여 입/출력하는 방식이 (1)기존의 RDB(Relational Database)형태에 BLOB(binary large object)필드를 이용한 것 보다 성능이 높음을 확인하였다.

  • PDF

위성 데이터 서비스 제공을 위한 데이터 인코더 설계 및 구현 (Design and Implementation of Data Encoder for Data Broadcasting Service via Satellite)

  • 신민수;김호겸;이호진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.39-42
    • /
    • 2001
  • 본 논문은 현재 다각적으로 논의되는 디지털 위성방송 및 데이터 방송 서비스를 제공하기 위해 랜 기반의 IP 망과 DVB 에서 규정한 위성망을 연결시켜 줌으로써 위성을 통한 다양한 멀티캐스트 및 유니캐스트 서비스를 제공할 수 있도륵 해주는 데이터 인코더의 하드웨어/소프트웨어 설계 및 구현에 관하여 기술한다. 다양한 위성 방송 서비스를 제공하기 위해서 데이터 인코더는 IP 데이터를 이더넷을 통해 입력받아 DVB 데이터 방송[2] 규격에서 규정한 MPE 포맷으로 켑슐화 한 후 MPEG-2 TS 패킷으로 변환하여 DVB-ASI 신호로 바꾸어 다중화기로 출력한다. 아울러 사용자 단말에서 서비스 수신을 위해 필요한 PSI/SI 정보와 서비스 형태에 따라 부가적으로 발생하는 사설 데이터를 처리해야 한다. 본 논문에서 기술하는 데이터 인코더는 4096개의 PID 할당이 가능하며 20M0ps 이상의 데이터 처리가 가능하여 동시에 여러 개의 서비스 제공이 가능하다.

  • PDF

효율적인 멀티미디어데이터 처리를 위한 RISC Processor의 설계 (Design of a RISC Processor with an Efficient Processing Unit for Multimedia Data)

  • 조태헌;남기훈;김명환;이광엽
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 II
    • /
    • pp.867-870
    • /
    • 2003
  • 본 논문은 멀티미디어 데이터 처리를 위한 효율적인 RISC 프로세서 유닛의 설계를 목표로 Vector 프로세서의 SIMD(Single Instruction Multiple Data) 개념을 바탕으로 고정된 연산기 데이터 비트 수에 비해 상대적으로 작은 비트수의 데이터 연산의 부분 병렬화를 통하여 멀티미디어 데이터 연산의 기본이 되는 곱셈누적(MAC : Multiply and Accumulate) 연산의 성능을 향상 시킨다. 또한 기존의 MMX나 VIS 등과 같은 범용 프로세서들의 부분 병렬화를 위해 전 처리 과정의 필요충분조건인 데이터의 연속성을 위해 서로 다른 길이의 데이터 흑은 비트 수가 작은 멀티미디어의 데이터를 하나의 데이터로 재처리 하는 재정렬 혹은 Packing/Unpacking 과정이 성능 전체적인 성능 저하에 작용하게 되므로 본 논문에서는 기존의 프로세서의 연산기 구조를 재이용하여 병렬 곱셈을 위한 연산기 구조를 구현하고 이를 위한 데이터 정렬 연산 구조를 제안한다.

  • PDF