• 제목/요약/키워드: 데이터 논문

검색결과 41,279건 처리시간 0.053초

프라이버시를 보존하는 군집화 (Privacy Preserving Clustering)

  • 유현진;김민호;라마크리쉬나
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.473-476
    • /
    • 2004
  • 본 논문에서는 프라이버시를 침해 하지 않는 데이터 마이닝에 대해 다룬다. 방대한 데이터에서 유용한 정보를 추출하는 데이터 마이닝분야에서 데이터로부터 프라이버시 보존의 중요성이 부각되고 있다. 그래서 프라이버시의 침해를 막기 위한 방법으로 실제 데이터를 사용하지 않고 잡음이 들어간 데이터를 사용한다. 그리고 프라이버시를 침해하지 않기 위해 잡음이 들어간 데이터로부터 데이터의 확률 밀도 함수(PDF)만을 복원한다. 이렇게 복원된 확률 밀도 함수만을 이용하여 데이터 마이닝기술, 예를 들면 분류화에 곧바로 적용함으로써 프라이버시를 보존하는 것이다. 하지만 분류화에 사용되는 데이터의 1차원적인 확률 밀도 함수만 가지고는 군집화에 사용하기가 부적절하다. 따라서 본 논문에서는 군집화를 하기 위해 잡음이 들어간 데이터로부터 결합 확률 밀도 함수(Joint PDF)를 복원하고, 복원된 결합 확률 밀도 함수만 가지고 군집화를 할 수 있는 방법을 다룬다.

  • PDF

웨이블릿을 적용한 영상 다중 압축 (Image Compression Using Wavelet)

  • 조영진;김성수
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 하계학술대회 논문집 D
    • /
    • pp.2570-2572
    • /
    • 2003
  • 본 논문은 웨이블릿을 적용하여 영상의 다중 압축에 대하여 논한다. 정보 전송에서 가장 중요시되는 것은 전송 속도이고, 이 전송 속도는 데이터의 용량에 반비례한다. 따라서 고용량의 데이터를 전송하는데는 많은 불이익이 따르게 되므로 데이터 압축이 필요하게 되었다. 하지만 압축률은 데이터의 손실에 비례하므로 높은 압축률을 사용할 경우 많은 데이터를 손실하게 된다. 본 논문에서는 수많은 데이터 중에서도 많이 사용되는 영상 데이터에 웨이블릿 변환을 적용하여 영상 데이터를 다중 압축함으로서 압축률을 높이고 영상 데이터의 손실을 최대한 줄이는 방법을 보였다. 결론적으로, 영상데이터에 웨이블릿을 적용하여 다중 압축을 함으로서 같은 압축률에서 영상 데이터의 손실을 일반적인 1단계 변환 압축 방법보다 줄이게 되었음을 보였다.

  • PDF

의미적 무결성을 지원하는 공간 데이터 모델의 설계 (Design of Spatial Data Model Supporting Semantic Integrity Constraint)

  • 임정옥;이영걸;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.48-50
    • /
    • 1999
  • 본 논문은 공간데이터와 비공간데이터를 통합처리하는 공간 데이터베이스 시스템에서 데이터의 의미적 무결성을 보장하는 확장된 공간 데이터 모델을 설계한다. 공간 데이터베이스 시스템에서 다루는 단순 객체가 아닌 추상화된 복합 객체로 다양한 유도 데이터에 대한 의미적 무결성을 데이터베이스 시스템 내부에서 효율적으로 유지해야 하며, 공간 데이터의 의미적 무결성 제약 조건을 사용자에 의해 정의할 수 있어야 한다. 본 논문에서는 공간 데이터베이스에서 사용하는 공간 데이터에 대한 무결성 정보를 술어 논리 형태로 표현하고 유지할 수 있는 무결성 공간 데이터 모델 (ISRDM: Integrity supported Spatial-Relational Data Model)을 제안한다. 제안된 공간 데이터 모델은 하부 단계 저장 구조, 개념적 데이터 표현 단계, 무결성 표현 단계가 독립적으로 구성되는 다단계 구조로 기존의 공간 데이터베이스 시스템을 용이하게 확장하고 다양한 응용 요구에 대해 유연하게 대처할 수 있도록 설계한다.

  • PDF

다중 무선 방송채널에서의 상호관련 데이터들을 위한 효율적인 데이터할당 방법 (Efficient data allocation scheme for dependent items over multiple wireless broadcast channels)

  • 박성욱;정성원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.219-222
    • /
    • 2007
  • 무선방송환경은 모바일 클라이언트의 수에 상관없이 다수의 클라이언트에게 데이터를 보낼 수 있다는 특징으로 인하여 많은 관심을 받아왔다. 그러나 기존 대부분의 연구는 한 개의 독립적인 데이터를 최단시간에 획득하는 것을 목표로 하였고, 질의어와 같이 상호 관련된 여러 데이터를 동시에 획득해야 하는 경우에 대한 연구는 미비했다. 또한 그러한 논문들에서도 질의어 내의 데이터들이 다른 채널상의 동일시간에 나타나지 않도록 할당하는 문제에 대해서만 연구되어 왔고 각 데이터의 요청빈도에 따른 데이터의 접근확률은 반영되지 않았다. 우리는 본 논문에서 이러한 데이터들을 채널에 할당하는 문제뿐만 아니라 여러 질의어에 포함되어 상대적으로 요청빈도가 높은 데이터들을 한 방송 사이클 동안 다중 채널상에 여러 번 할당되게 하여 해당 질의어에 속한 데이터들을 모두 획득하는데 요구되는 평균응답시간을 줄이는 새로운 방법을 제안한다.

  • PDF

재활 운동 빅데이터 플랫폼을 위한 재활 운동 기기 데이터 연동 인터페이스의 설계 (A Design of Rehabilitation exercise device data interworking interface for Rehabilitation exercise Big data platform)

  • 최원혁;강일권;김재철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.165-167
    • /
    • 2022
  • 본 논문은 병원과 지역사회에서 제공하는 재활 서비스를 연계하여 재활 단계별 개인 맞춤 재활서비스를 제공하기 위한 재활운동 빅데이터 플랫폼과 재활 서비스를 지원하는 재활 운동 기기간의 데이터 수집을 위한 인터페이스의 설계에 관한 것이다. 재활 운동 빅데이터 플랫폼은 병원과 지역사회에서 생성되는 재활 관련 데이터를 수집하고 이를 가공, 유통하기 위한 데이터 서비스와 수집된 데이터를 예측, 분석하여 개인 맞춤형의 단계별 재활을 지원하기 위한 다양한 서비스를 제공한다. 본 논문에서는 재활 운동을 보조하는 재활 운동 기기에서 생성되는 다양한 유형의 데이터를 재활 운동 빅데이터 플랫폼으로 전송하고, 수집된 데이터를 플랫폼 내외부에서 활용 가능하도록 제공할 수 있는 인터페이스에 대하여 설명한다.

서로 다른 시계열 데이터들간 통합 활용을 고려한 해시 함수 기반 학습 모델 관리 플랫폼 (Learning model management platform based on hash function considering for integration from different timeseries data)

  • 유미선;문재원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.45-48
    • /
    • 2022
  • IoT 기술의 발전 및 확산으로 다양한 도메인에서 서로 다른 특성의 시계열 데이터가 수집되고 있다. 이에 따라 단일 목적으로 수집된 시계열 데이터만 아니라, 다른 목적으로 수집된 시계열 데이터들 또한 통합하여 분석활용하려는 수요 또한 높아지고 있다. 본 논문은 파편화된 시계열 데이터들을 선택하여 통합한 후 딥러닝 모델을 생성하고 활용할 수 있는 해시함수 기반 학습 모델 관리 플랫폼을 설계하고 구현하였다. 특정되지 않은 데이터들을 기반하여 모델을 학습하고 활용할 경우 생성 모델이 개별적으로 어떤 데이터로 어떻게 생성되었는지 기술되어야 향후 활용에 용이하다. 특히 시계열 데이터의 경우 학습 데이터의 시간 정보에 의존적일 수밖에 없으므로 해당 정보의 관리도 필요하다. 본 논문에서는 이러한 문제를 해결하기 위해 해시 함수를 이용해서 생성된 모델을 계층적으로 저장하여 원하는 모델을 쉽게 검색하고 활용할 수 있도록 하였다.

  • PDF

정확한 균열 데이터를 효율적으로 생성하는 벡터와 두께 기반의 데이터 증강 (A Vector and Thickness-Based Data Augmentation that Efficiently Generates Accurate Crack Data)

  • 윤주영;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.377-380
    • /
    • 2023
  • 본 논문에서는 합성곱 신경망(Convolutional Neural Networks, CNN)과 탄성왜곡(Elastic Distortion) 기법을 통한 데이터 증강 기법을 활용하여 학습 데이터를 구축하는 프레임워크를 제안한다. 실제 균열 이미지는 정형화된 형태가 없고 복잡한 패턴을 지니고 있어 구하기 어려울 뿐만 아니라, 데이터를 확보할 때 위험한 상황에 노출될 우려가 있다. 이러한 데이터베이스 구축 문제점을 본 논문에서 제안하는 데이터 증강 기법을 통해 비용적, 시간적 측면에서 효율적으로 해결한다. 세부적으로는 DeepCrack의 데이터를 10배 이상 증가하여 실제 균열의 특징을 반영한 메타 데이터를 생성하여 U-net을 학습하였다. 성능을 검증하기 위해 균열 탐지 연구를 진행한 결과, IoU 정확도가 향상되었음을 확인하였다. 데이터를 증강하지 않았을 경우 잘못 예측(FP)된 경우의 비율이 약 25%였으나, 데이터 증강을 통해 3%까지 감소하였음을 확인하였다.

  • PDF

하둡 기반 천문 응용 분야 대규모 데이터 분석 기법 연구 (A Study on Large-scale Data Analysis based on Hadoop for Astroinformatics)

  • 곽재혁;윤준원;정용환;함재균;박동인
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.13-16
    • /
    • 2011
  • 과학 응용 분야에서 생성되는 대규모의 데이터를 빠른 시간 내에 효율적으로 처리해야 할 필요성이 대두 되면서 클라우드 컴퓨팅이 주목받고 있다. 하둡(Hadoop)은 대규모 데이터 처리 분석을 위한 소프트웨어 프레임워크를 제공하는 아파치의 오픈소스 프로젝트로서 클라우드 컴퓨팅의 대표적인 기술로서 널리 사용되고 있다. 특히, 하둡은 높은 확장성과 성능을 제공하면서 결함 탐지와 자동 복구 기능이 우수하여 과학 기술 분야에서도 점차적으로 도입 및 활용되고 있다. 본 논문에서는 하둡을 이용하여 천문 응용 분야에서 생성되는 대규모 데이터를 분석하기 위한 방법을 연구하였다. 본 논문에서 관심을 가지는 천문 응용 데이터는 대략 천만개의 작은 크기의 관측 데이터를 처리해야 하지만, 하둡은 대규모 데이터 처리에 특화되어 있어서 많은 개수의 작은 크기를 가지는 관측데이터 처리에는 적합하지 않다. 본 논문에서는 천문 응용 데이터 처리를 위한 입출력 파일을 하둡에서 제공하는 특수화된 데이터 구조를 이용하여 압축하였고, 천문 응용 실행 코드가 하둡에서 실행이 가능하도록 맵리듀스 작업으로 랩핑하여 구현하였다.

gCRM을 위한 공간 데이터 통합관리 시스템의 설계 및 구현 (Design and Implementation of Spatially-enabled Integration Management System for a gCRM)

  • 김삼근;문일환;안재근
    • 정보처리학회논문지D
    • /
    • 제18D권1호
    • /
    • pp.57-66
    • /
    • 2011
  • 최근 기업 데이터의 약 80%가 공간적인 요소를 포함하고 있다는 사실이 크게 부각됨에 따라 고객 관계 관리(Customer Relationship Management, CRM) 시스템에 공간 데이터를 활용하고자 하는 새로운 분석 방법에 대한 요구가 증가하고 있다. 하지만 전통적인 CRM 시스템은 공간 데이터를 관리하거나 공간 데이터를 이용한 사용자 환경을 제공하기에 부적합하다. 본 논문에서는 레거시 CRM 시스템과 객체 지향 데이터베이스를 이용하여 엔터프라이즈 데이터와 공간 데이터의 통합관리가 가능하고 gCRM(geographic CRM)을 위한 시각화 및 분석기능을 지원하는 공간 데이터 통합관리 시스템을 설계 및 구현하였다. 본 논문에서 제시한 시스템 구축을 통하여 기 구축된 CRM 시스템에 공간 데이터 관리 및 분석이 가능한 gCRM을 효과적으로 적용할 수 있음을 확인하였다.

PCB 생산 자동화를 위한 데이터 변환 시스템 구현 (Data Transformation System Implementation for the Automation of PCB Product)

  • 이승혁;김귀정;한정수
    • 한국콘텐츠학회논문지
    • /
    • 제5권5호
    • /
    • pp.17-25
    • /
    • 2005
  • 본 논문은 PCB 생산 자동화를 위한 데이터 변환 시스템을 구현한다. CAD로 설계한 데이터는 PCB 생산라인과의 데이터 호환을 이루지 못하기 때문에 데이터 호환을 갖는 자동화 시스템이 필요하다. 본 논문에서는 PCB 생산 자동화를 위한 PCB 부품 정보를 분석하고 IC 부품 정보를 DB로 구축한다. CAD 설계자의 Human error 검출 알고리즘을 개발하고, PCB 생산 라인에 적합한 데이터로 변환하는 알고리즘을 개발한다. PCB 생산라인의 부품의 정보 추가, 수정하기 위한 데이터 변환 인터페이스를 설계 및 구현한다. 기존의 수작업 공정을 자동화함으로서 처리속도를 대폭 개선하였으며, 신뢰성 있는 칙적화된 데이터로 PCB 생산 자동화에 일조를 할 수 있다.

  • PDF