• 제목/요약/키워드: 데이터 영역화

검색결과 954건 처리시간 0.025초

공공데이터 개방 평가지표 개발을 통한 현황분석 및 가시화 (Service Level Evaluation Through Measurement Indicators for Public Open Data)

  • 김지혜;조상우;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.53-60
    • /
    • 2016
  • 공공데이터 포털에 공개된 지자체 데이터와 공공기관 데이터를 자동으로 수집한 후, 공공 데이터의 개방현황 및 다양한 영역별 데이터 제공여부, 파일 형식 등 다양한 기준으로 다차원 분석하여 서비스 수준 평가를 제공하고자 한다. 이를 위해, 해외 평가지표 사례를 바탕으로 평가지표 내용을 설정한 후 이를 기준으로 데이터웨어하우스(DW)를 구축하였으며, 다차원 분석 기법을 사용한 서비스 수준평가 결과를 지역별로, 기관별로, 분야별로 시각화한다.

  • PDF

데이터 마이닝 기법을 이용한 학습 능력 분석 시스템 개발 (Application of Data Mining Technique in Characterizing the Scholastic Aptitude of the Students)

  • 김범은;김덕희;원유집
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.144-146
    • /
    • 1999
  • 데이터 마이닝은 대량의 데이터로부터 데이터 내에 존재하는 관계, 패턴, 규칙 등을 찾아내고 모형화 함으로서 유용한 지식을 추출하는 방법이다. 데이터 마이닝을 이용한 이 시스템은 데이터를 비슷한 특성을 가지는 집단으로 분류하여 집단의 특성을 찾아내고 데이터 항목간의 연관성을 유출해 내어 학생들의 적절한 학습지도 영역을 찾아내는데 목적이 있다. 본 논문에서는 개발한 시스템에서 수학 학습 능력에 대한 특성을 도출해 내는 방법을 알아보고, 어떻게 기존의 학원의 역할을 대신할 수 있는지 검증한다.

  • PDF

깊이 정보를 이용한 링크 정보의 3차원 시각화 (3D Visualization of Link Information Using Depth Data)

  • 박명철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제45차 동계학술발표논문집 20권1호
    • /
    • pp.81-82
    • /
    • 2012
  • 본 논문에서는 수준별 깊이 정보를 이용하여 노드의 링크 정보를 시각화 도구를 구현하였다. 제한된 공간에서 다수의 노드 정보를 효과적으로 시각화하는 많은 연구가 있지만 기본 방법들은 2차원적인 도구가 대부분이고 각 노드의 링크를 표현하기 위하여 일정한 영역을 동일하게 할당하여 시각화한다. 이는 시각화 대상이 적을 경우에는 문제가 발생하지 않지만 대량의 데이터를 시각화하는 경우에는 연결 식별성이 저하되는 경향이 있다, 본 논문에서는 각 노드를 시각화할 때 수준별 깊이 정보를 이용하여 하위 노드의 수에 따른 가중치 기반으로 3차원 공간상에 시각화하여 보다 공간적 효율성과 식별성이 높은 시각화 방법을 제안 한다. 본 논문의 결과물은 연결성 정보를 시각화하는 영역에 활용될 수 있을 것이다.

  • PDF

공간 연속질의 처리에서 영역 기반의 저장 구조를 이용한 효율적인 디스크 접근 방법 (Efficient Disk Access Method Using Region Storage Structure in Spatial Continuous Query Processing)

  • 정원일
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2383-2389
    • /
    • 2011
  • 유비쿼터스 응용은 실시간으로 입력되는 데이터 스트림과 저장된 공간 데이터를 동시에 처리하는 이중적인 공간 연속 질의 처리 기술이 요구된다. 이러한 공간 연속 질의 처리에서는 대용량 공간 데이터에 대한 디스크 접근 비용을 최소화가 요구되나 기존 공간색인 기법은 논리적 인접성을 공간 데이터의 물리적인 인접성을 보장할 수 없으므로 공간 데이터 탐색에 있어 비용이 증가한다. 또한 데이터 인접성 보장을 위한 공간 순서화 기법의 경우에도 빈번하게 접근되는 질의 공간 영역에 대한 클러스터링을 고려하지 않고 있다. 본 논문에서는 이중적인 공간 연속질의 처리에서 공간 데이터의 효율적인 접근을 위한 영역 기반 저장 구조를 제안한다. 제안 기법에서는 영역을 기반으로 데이터를 인접하게 저장하고 사용자 질의를 영역 기반으로 그룹 처리함으로써 질의 처리 비용을 감소시킬 수 있다.

비할당 영역 데이터 파편의 압축 여부 판단과 압축 해제 (Determinant Whether the Data Fragment in Unallocated Space is Compressed or Not and Decompressing of Compressed Data Fragment)

  • 박보라;이상진
    • 정보보호학회논문지
    • /
    • 제18권4호
    • /
    • pp.175-185
    • /
    • 2008
  • 컴퓨터 포렌식 관점에서 디스크의 비할당 영역(unallocated space)에 존재하는 데이터를 분석하는 것은 삭제된 데이터를 조사할 수 있다는 점에서 의미가 있다. 하지만 대부분의 경우에 비할당 영역에 존재하는 데이터는 응용 프로그램으로 읽을 수 있는 완전한 파일의 형태가 아닌 단편화된 파편(Fragment)으로 존재하며 이는 암호화되거나 압축된 형식으로 존재하기도 한다. 특히 데이터의 일부만 남아있고 나머지는 다른 데이터로 덮여 쓰인 상태의 데이터 파편을 분석하는 것은 매우 어려운 일이며, 특히 존재하는 데이터 파편이 압축되거나 암호화된 경우에는 데이터가 랜덤(Random)한 특성을 가지기 때문에 통계 분석이나 시그니처 분석과 같은 기존의 데이터 파편 분석 방법만으로는 의미 있는 정보를 획득할 수 없게 된다. 따라서 파일 파편의 압축 및 암호화 여부를 판단하는 선 처리 작업이 필요하며 압축된 파편은 압축 해제를 시도해야 한다. 압축 해제로서 획득한 평문 데이터 파편은 기존에 제시된 데이터 파편 분석 방식으로 분석할 수 있다. 본 논문에서는 컴퓨터 포렌식 수사 시 비할당 영역에 존재하는 파일 파편의 분석 기술에 대해 서술한다.

딥러닝 학습용 집적화된 데이터 증강 자동화 도구 개발 (Development of integrated data augmentation automation tools for deep learning)

  • 장찬호;이서영;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.283-286
    • /
    • 2021
  • 4차 산업혁명을 맞이해 최근 산업 및 기술 영역에서는 인공지능을 이용한 생산력 향상, 자동화 등 딥러닝의 보편화가 빠르게 진행되고 있다. 또한, 딥러닝의 성능을 도출하기 위해서는 수많은 양의 학습용 데이터가 필요하며 그 데이터의 양은 딥러닝 모델의 성능과 정비례한다. 이에 본 작품은 최신형 영상처리 Library인 Albumentations를 이용하여 영상처리 알고리즘을 이용하여 이미지를 증강하고, 이미지 데이터 크롤링 기능을 통해 Web에서 영상 데이터를 수집을 자동화하며, Label Pix를 연동하여 수집한 데이터를 라벨링 한다. 더 나아가 라벨링 된 데이터의 증강까지 포함하여 다양한 증강 자동화를 한 인터페이스에 집적시켜 딥러닝 모델을 생성할 때 데이터 수집과 전처리를 수월하게 한다. 또한, Neural Net 기반의 AdaIN Transfer를 이용하여 이미지를 개별적으로 학습하지 않고 Real time으로 이미지의 스타일을 옮겨올 수 있도록 하여 그림 데이터의 부족 현상을 해결한다.

  • PDF

PCA 기반 얼굴 인증과 SOM 알고리즘을 이용한 여권 인식 (Passport Recognition using PCA-based Face Verification and SOM Algorithm)

  • 이상수;장도원;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.285-290
    • /
    • 2006
  • 본 논문에서는 출입국자 관리의 효율성과 체계적인 출입국 관리를 위하여 여권 코드를 자동으로 인식하고 위조 여권을 판별할 수 있는 여권 인식 및 얼굴 인증 방법을 제안한다. 본 논문의 구성은 여권 인식과 얼굴 인증 부분으로 구성되며, 여권 인식 부분에서는 소벨 연산자, 수평 최소값 필터 등을 적용한 후, 8 방향 윤곽선 추적 알고리즘을 적용하여 코드의 문자열 영역을 추출하고 기울기를 보정한다. 추출된 문자열은 반복 이진화 방법을 적용하여 코드의 문자열 영역을 이진화 한다. 이진화된 문자열 영역에 대해 8 방향 윤곽선 추적 알고리즘을 적용하여 개별 코드를 추출한 후에 SOM(Self-Organizing Maps) 알고리즘을 적용하여 여권 코드를 인식한다. 얼굴 인증 부분에서는 여권 사진 영역의 특징을 이용하여 얼굴 후보 영역을 추출한 후, RGB와 YCbCr 색공간에서 피부색 정보를 이용하여 얼굴 영역을 추출한다. 추출된 얼굴 영역은 PCA(Principal Component Analysis) 알고리즘을 적용하여 특징 벡터를 구하고 여권 코드가 인식된 결과를 바탕으로 여권 소지자의 데이터 베이스에 있는 얼굴 영상의 특징벡터와의 거리 값을 계산하여 사진 위조 여부를 판별한다. 제안된 여권 인식 및 얼굴 인증 방법의 성능 평가를 위하여 원본 여권의 얼굴 부분을 위조한 여권과 기울어진 여권 영상을 대상으로 실험한 결과, 제안된 방법이 여권의 코드 인식 및 얼굴 인증에 있어서 우수한 성능이 있음을 확인하였다.

  • PDF

Staging 영역을 활용한 분산 의료정보시스템 통합 (Integration of Distributed Medical Information System using Staging Area)

  • 전영희;박건우;이상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.184-188
    • /
    • 2008
  • 최근 국내 디지털 병원들이 점차 기업화 되면서 각 지역별 분산 및 독립 운영되는 의료통계 정보 활용의 중요성이 증대되고 있다. 또한 각종 연구목적 및 의료 서비스 경쟁력 향상 등을 위해 신속 정확한 의사결정지원 시스템인 데이터 웨어하우스(DW; Data Warehouse) 구축의 필요성이 대두되고 있다. 본 논문에서는 단일 병원 내의 데이터 웨어하우스가 아닌, 전국적으로 분산 운영되고 있는 병원의 다양한 의료정보를 통합하고자 한다. 따라서 Staging 영역을 활용한 분산된 의료정보시스템 통합 방안을 제시한다.

  • PDF

YAFFS2 플래시 파일시스템 상에서 효율적인 마운트를 위한 메타데이터 관리기법 (A Metadata Management Scheme for Efficient Mount on YAFFS2 Flash File System)

  • 서형운;신명섭;박동주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.74-76
    • /
    • 2011
  • 최근 플래시 메모리에 기반을 둔 임베디드 시스템의 사용이 급증하고 있다. 스마트폰이 대중화됨에 따라, 플래시 메모리용 파일시스템에 대한 필요성이 증가되고 있다. 보편적으로 사용하는 YAFFS2 파일시스템은 초기화 시 오래 걸리는 단점이 존재하여 체크포인트 기능으로 보안 하고 있다. 그러나 갑작스러운 Power Failure 나 언마운트시 체크포인트가 저장되지 않으면 전체 영역을 스캔해야 하는 문제점이 존재한다. 본 논문에서는 YAFFS2의 성능 개선 및 신뢰성 향상을 위한 메타데이터 관리 기법을 제안한다. 메인메모리상에 유지되는 메타데이터의 영역을 나눠서 관리해서, Power Failure 가 발생하거나 체크포인트가 존재하지 않아도 전 영역을 스캔 하는 문제점 을 피할 수 있다.

도식화된 지도 생성을 위한 아이콘과 레이블 배치 알고리즘 (An Icon and Label Replacement Algorithm for Generating Schematic Map)

  • 류동성;박동규;이도훈
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.596-599
    • /
    • 2003
  • 본 논문에서는 아이콘과 레이블을 가진 도식화된 지도(Schematic map)를 생성차기 위한 아이콘과 레이블의 효과적인 배치 알고리즘을 제안한다. 이 알고리즘은 먼저 지리정보시스템(GIS)의 데이터베이스로부터 원시 정보를 파서로 분석한 후, 지형도 데이터에서 시각화에 필요한 부분만을 추출한 후 이들 선분에 대하여 선분 간략화 알고리즘을 적용하여 기도를 생성한다. 그리고 장식 및 정보의 표기를 목적으로 사용하는 아이콘 및 레이블 정보들의 특징을 반영하여 후보 영역을 생성한다. 마지막으로 생성된 후보영역 내에서 중첩이 발생하기 않으면서 아이콘을 설명하는데 적절한 최적화된 위치의 레이블을 배치하여 이들의 배치 값들 중 최적의 값을 얻은 후 이 최적의 위치에 아이콘과 레이블을 배치하도록 하였다.

  • PDF