• 제목/요약/키워드: 데이터 확장 기법

검색결과 827건 처리시간 0.027초

얼굴인식 시스템의 소프트에러에 대한 DCGSN 기반의 크로스 레이어 보상 방법 (DCGAN-based Compensation for Soft Errors in Face Recognition systems based on a Cross-layer Approach)

  • 조영환;김도연;이승현;정구민
    • 한국정보전자통신기술학회논문지
    • /
    • 제14권5호
    • /
    • pp.430-437
    • /
    • 2021
  • 본 논문에서는 DCGAN 기반의 크로스 레이어 보상 방법을 이용하여 소프트에러의 영향을 줄이는 얼굴인식 기법을 제안한다. JPEG 파일의 데이터 블록에서 소프트에러가 발생할 때, 이 블록들은 제대로 복호화되지 않을 수 있다. 이전 연구에서 해당 블록들은 얼굴 사진들의 평균 이미지를 이용해 대체하였으며, 인식률을 어느 정도 향상하였다. 본 논문에서는 이전 연구의 확장으로 DCGAN 기반의 보상 기법을 다룬다. 패리티 비트 검사기를 이용하는 임베디드 시스템 레이어에서 소프트에러가 발생할 때, 이 에러는 애플리케이션 레이어에서 DCGAN을 이용하여 보상된다. 얼굴 이미지의 소프트에러를 보상하기 위해서 DCGAN 구조를 이용하여 블록 데이터의 손실을 보상한다. 시뮬레이션 결과를 통하여, 제안된 방식이 소프트에러로 인한 성능 악화를 효율적으로 보상한다는 것을 보인다.

익명 암호통신 네트워크에서의 웹사이트 핑거프린팅을 활용한 서비스 유형 분류 (Classification of Service Types using Website Fingerprinting in Anonymous Encrypted Communication Networks)

  • 구동영
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권4호
    • /
    • pp.127-132
    • /
    • 2022
  • 토르 (Tor, The Onion Router)와 같이 다수의 가상 컴퓨터 및 네트워크를 경유함으로써 이용자의 인터넷 접속에 대한 추적을 어렵게 하는 익명 암호통신 네트워크는 데이터 송수신 과정에서의 사용자 및 데이터 프라이버시 보호를 그 운영목적으로 하고 있다. 하지만 이러한 익명 암호통신 네트워크를 통한 불법 콘텐츠 공유 및 무기거래 등 부적절한 용도로의 악용 및 오용에 있어, 기존의 탐지 기법을 적용하거나 적절한 대응책을 마련하기에는 어려움이 따른다. 본 논문에서는 익명 암호통신에서도 특정 사이트에 대한 접근 정보를 높은 정확도로 유추할 수 있는 웹사이트 핑거프린팅 (website fingerprinting) 기법을 확장하여, 특정 사이트 뿐 아니라 알려지지 않은 사이트에 대해서도 서비스 유형을 특정하고 분류하는 방법을 강구함으로써 악의적 목적에 활용될 수 있는 은닉 사이트 또는 잠재적 불법 사이트에 대한 식별 방안을 제시한다.

Applying a Novel Neuroscience Mining (NSM) Method to fNIRS Dataset for Predicting the Business Problem Solving Creativity: Emphasis on Combining CNN, BiLSTM, and Attention Network

  • Kim, Kyu Sung;Kim, Min Gyeong;Lee, Kun Chang
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권8호
    • /
    • pp.1-7
    • /
    • 2022
  • 인공지능 기술이 발달하면서 뉴로사이언스 마이닝(NSM: NeuroScience Mining)과 AI를 접목하려는 시도가 증가하고 있다. 나아가 NSM은 뉴로사이언스와 비즈니스 애널리틱스의 결합으로 인해 연구범위가 확장되고 있다. 본 연구에서는 fNIRS 실험을 통해 확보한 뉴로 데이터를 분석하여 비즈니스 문제 해결 창의성(BPSC: business problem-solving creativity)을 예측하고 이를 통해 NSM의 잠재력을 조사한다. BPSC는 비즈니스에서 차별성을 가지게 하는 중요한 요소이지만, 인지적 자원의 하나인 BPSC의 측정 및 예측에는 한계가 존재한다. 본 논문에서는 BPSC 예측 성능을 높이는 방안으로 CNN, BiLSTM 그리고 어텐션 네트워크를 결합한 새로운 NSM 기법을 제안한다. 제안된 NSM 기법을 15만 개 이상의 fNIRS 데이터를 활용하여 유효성을 입증하였다. 연구 결과, 본 논문에서 제안하는 NSM 방법이 벤치마킹한 알고리즘(CNN, BiLSTM)에 비하여 우수한 성능을 가지는 것으로 나타났다.

무선 센서 네트워크에서 수집 데이터의 효과적인 전송을 위한 비겹침 다중경로 라우팅 프로토콜 (A Disjoint Multi-path Routing Protocol for Efficient Transmission of Collecting Data in Wireless Sensor Network)

  • 한대만;임재현
    • 정보처리학회논문지C
    • /
    • 제17C권5호
    • /
    • pp.433-440
    • /
    • 2010
  • 무선 센서 네트워크에서 에너지 효율성, 전송 지연 그리고 확장성은 중요한 요구사항이며, 특히 다수의 노드로 구성된 무선 센서 네트워크의 경우 네트워크 라이프타임 연장을 위해 제한된 배터리 전력 내에서 각 노드의 에너지 소비를 최소화 시켜야한다. 또한 전송률을 향상시키기 위해서는 각 센서 노드의 에너지 소비를 최소화하기 위한 효율적인 알고리즘과 에너지 관리 기술이 요구된다. 본 논문은 무선 센서 네트워크 환경에서 센서 데이터 전송을 위해 경로의 겹침이 없는 다중경로 프로토콜을 제안한다. 제안한 방법은 다중경로를 검색하고 라우팅 테이블에 다중경로를 추가시켜 센서 데이터 전송의 감소를 통해 네트워크 오버헤드를 최소화 시킨다. 제안한 라우팅 프로토콜은 각 노드의 에너지 소비를 최소화하고, 싱크 노드가 수신 강도 범위 내, 외부에 위치하더라도 센서 네트워크의 생명주기를 연장할 수 있다. 실제 데이터를 이용하여 현실 모델에 맞게 센서 네트워크를 구축하고 제안 기법의 타당성을 검증하며, 전체 에너지의 소비량을 평가한다.

다변량 관리도를 활용한 블로거 정서 변화 탐지 (Detection of the Change in Blogger Sentiment using Multivariate Control Charts)

  • 문정훈;이성임
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.903-913
    • /
    • 2013
  • 최근 소셜 네크워크 서비스의 발달로 인해 개인의 감정이나 의견을 표현하는 소셜 데이터들이 하루에도 수백만 건씩 생산되고 있다. 또한 소셜 데이터는 개인의 의견에 또 다른 생각을 더하는 등 정보의 생산과 소비가 누구나 가능해짐으로써 사회현상을 잘 반영해주는 도구로 성장하고 있다. 본 연구에서는 블로그에 올라온 부정적인 감성어들을 분석하여 블로거의 감성변화를 탐지하기 위해 다변량 관리도를 이용하고자 한다. 이를 위해 2008년 1월 1일부터 2009년 12월 31일 사이에 생성되었던 모든 블로그를 사용하였다. 품질 특성치가 다변량으로 주어지는 경우 호텔링의 $T^2$ 관리도가 널리 사용된다. 그러나 이 관리도는 품질 특성치들의 분포가 다변량 정규분포라는 가정을 하고 있어, 비정규 다변량 자료에 대한 관리도의 성능은 좋지 않다. 이에 본 논문에서는 Sun과 Tsung (2003)이 제안한 써포트 벡터머신에서 단일 집합 분류 기법 중 하나인 SVDD(support vector data description) 알고리즘과 이를 확장한 K-관리도를 소개하고, 실제 데이터 분석에 적용해 보았다.

3차원+Temporal 객체를 표현하기 위한 컴포넌트 설계 및 구현 (Design and Implementation of Components to Represent the 3-Dimensional+Temporal Objects)

  • 이현아;김진석;류근호
    • 한국지리정보학회지
    • /
    • 제7권4호
    • /
    • pp.119-132
    • /
    • 2004
  • 지리 객체는 3차원 공간으로 구성되기 때문에 정확한 표현을 위하여 3차원 좌표계를 사용하여야 한다. 이 논문에서는 3차원+temporal 객체 모델을 정의하기 위해 2차원 공간으로 제한되어 있는 개방형 지리 데이터 모델을 3차원 공간과 유효 시간으로 확장하였다. 이러한 모델 설계 방법은 개방형 모델을 사용하는 타 시스템과의 호환성을 보장한다. 또한 이력 객체와 이동 객체를 함께 고려하여 두 종류의 시공간 객체에 대한 관리를 가능하게 하였다. 여기에서 제안된 3차원+temporal 객체 모델은 OLE/COM 기법을 사용한 3차원+temporal 객체 컴포넌트로 구현하였다. 이를 위해 제안한 객체 모델을 기반으로 컴포넌트의 인터페이스 구조를 정의하였다. 이 컴포넌트의 사용 예를 보이기 위해 3차원 시공간 데이터를 대상으로 하는 데이터 소비자를 구현하였다. 이와같은 컴포넌트는 기존의 시스템에 제안된 모델을 적용하기 위한 비용과 노력을 최소화하는 해결책으로 사용될 수 있다.

  • PDF

데이터 마이닝을 이용한 아파트 초기계약 예측모형 개발: 위례 신도시 미분양 아파트 단지를 사례로 (Development of Forecasting Model for the Initial Sale of Apartment Using Data Mining: The Case of Unsold Apartment Complex in Wirye New Town)

  • 김지영;이상경
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.217-229
    • /
    • 2018
  • 이 연구에서는 미분양 아파트 단지의 세대별 계약 자료에 데이터 마이닝 기법인 의사결정나무, 신경망, 로지스틱 모형을 적용하여 세대별 초기계약을 예측하는 모형을 개발한다. 모형 개발에는 위례신도시 미분양 아파트 단지의 계약 자료가 이용되며, 이 자료는 훈련용 자료와 검정용 자료로 분할되어 분석에 투입된다. 훈련용 자료에서는 신경망, 의사결정나무, 로지스틱 모형 순으로 예측력이 뛰어났지만 검정용 자료에서는 로지스틱 모형이 가장 우수하게 나타났다. 이 같은 결과는 신경망이 훈련용 자료에 최적화된 모형으로 구축되면서 검정용 자료에 대한 적응성이 떨어져 나타난 결과로 판단된다. 의사결정나무와 로지스틱 모형을 병행 적용한 결과, 층수, 향, 세대 위치, 전기 및 발전기실의 소음, 청약자 거주지, 청약 종류가 초기계약에 영향을 주는 것으로 나타났다. 이는 두 가지 모형을 같이 사용하는 것이 초기계약 결정요인 발굴에 더 효과적이라는 것을 의미한다. 이 연구는 데이터 마이닝의 적용 범위를 주택 분양 예측까지 확장함으로써 융복합 분야 발전에 기여하고 있다.

향상된 실내 이동 경로 생성을 위한 인접 클러스터의 정보 확장에 관한 연구 (A Study on Information Expansion of Neighboring Clusters for Creating Enhanced Indoor Movement Paths)

  • 윤창표;황치곤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.264-266
    • /
    • 2022
  • 전파 지문 기반의 실내 경로 생성 기술에 RNN 모델을 적용하기 위해서는 데이터 세트가 연속적이고 순차적이어야 한다. 그러나 Wi-Fi 전파 지문 데이터는 수집 시점의 특정 위치에 대한 특징 정보로서 연속성이 보장되지 않기 때문에 RNN 데이터로는 부적합하다. 따라서 순차적 위치의 연속성 정보를 부여해야한다. 이를 위해서는 신호 데이터를 기반으로 각 지역의 구분을 통해 클러스터링이 가능하다. 이때 클러스터 간의 연속성 정보에는 전파 신호의 한계로 이해 실제 이동이 가능한지의 정보를 담지 못한다. 따라서 인접 클러스터간의 이동이 가능한지에 대한 연관성 정보가 필요하다. 본 논문에서는 딥러닝 네트워크인 순환신경망(RNN) 모델을 사용해 이동 중인 객체의 경로 예측을 위한 기술로서 실내 환경에서 경로 생성을 위해 연속적인 위치 정보를 생성하여 객체의 경로 예측 시 발생할 수 있는 오류를 낮추고 예측 경로상의 이동이 불가능한 잘못된 경로 예측을 회피할 수 있는 향상된 이동 경로 생성을 위한 클러스터링 상호간의 연관성을 부여하는 기법을 제안한다.

  • PDF

벤처기업정밀실태조사와 한국기업혁신조사 데이터를 활용한 통계적 매칭의 타당성 검증 (The Validity Test of Statistical Matching Simulation Using the Data of Korea Venture Firms and Korea Innovation Survey)

  • 안경민;이영찬
    • 지식경영연구
    • /
    • 제24권1호
    • /
    • pp.245-271
    • /
    • 2023
  • 최근 데이터 경제가 가속화되면서 경영학 분야에서는 데이터 매칭이라는 새로운 기법이 주목받고 있다. 데이터 매칭은 모집단이 같지만 서로 다른 표본에서 수집된 데이터셋을 합치는 기법 또는 처리 과정을 의미한다. 그중에서 통계적 매칭은 서로 다른 데이터를 결합하는데 있어서 사업자 번호와 같이 기준이 되는 변수가 없는 경우 통계적 함수를 활용하여 데이터를 매칭하는 방법이다. 선행연구 검토결과 경제학, 교육학, 보건, 의료 등 다양한 분야에서 통계적 매칭이 많이 사용되고 있는데 반해 경영학 분야는 제한적임을 확인할 수 있었다. 본 연구는 기존 경영학 분야에서 충분히 연구되지 않았던 통계적 매칭의 유용성을 검증하고 활용도를 높이는 방안을 연구하고자 한다. 연구목적을 달성하기 위해 본 연구에서는 2020 벤처기업정밀실태조사와 2020 한국기업혁신조사 자료를 활용하여 통계적 매칭 시뮬레이션을 수행하였다. 먼저, 선행연구를 바탕으로 통계적 매칭에 사용되는 변수를 선정하였다. 공통변수는 업종, 종업원수, 지역, 업력, 상장시장, 매출로 설정하였고, 검증을 위한 고유변수와 제공변수는 중소기업 혁신에서 가장 중요한 연구인력 비율과 R&D 비용으로 각각 설정하였다. 사전 검증을 위해 2020 벤처기업정밀실태조사 자료를 수여자 데이터 30%와 기여자 데이터 70%로 분할하였다. 통계적 매칭에는 마할라노비스 거리와 랜덤 핫덱을 결합한 방식을 사용하였고, 성능평가는 수여자 데이터와 원시 데이터의 평균값 비교와 커널 밀도 함수(Kernel Density Estimation)를 통해 데이터 분포를 비교하였다. 검증결과, 수여자 데이터 30%와 기여자 데이터 70%에서 추출된 매칭 데이터의 평균값이 통계적으로 유의한 차이가 없는 것으로 나타나 유사한 데이터가 매칭된다는 것을 확인하였다. 또한, 두 데이터의 커널 밀도 함수로 도출한 데이터 분포 역시 유사한 형태가 나타나는 것을 확인할 수 있었다. 사후 검증에는 2020 벤처기업정밀실태조사에서 임의로 30%를 수여자 데이터로 추출하고 2020 한국기업혁신조사 자료를 기여자 데이터로 설정하여 통계적 매칭을 수행하고 검증하였다. 사전 검증과 마찬가지로 공통변수는 업종, 종업원수, 지역, 업력, 상장시장, 매출로 설정하였고, 검증을 위한 고유변수는 연구 인력 비율과 R&D 비용으로 정의하였다. 분석 결과, 수여자 데이터의 연구인력 비율의 평균과 기여자 데이터의 평균은 예상과 다르게 통계적으로 차이가 있는 것으로 나타났다. 하지만 커널 밀도 함수에 따른 두 데이터의 분포는 유사한 형태를 보이는 것으로 조사되어 통계적 매칭의 적절성을 확인할 수 있었다. R&D 비용은 통계적 매칭 수행 결과, 수여자 데이터의 R&D 비용 평균과 기여자 데이터의 평균이 통계적으로 차이가 없었고, 커널 밀도 함수도 유사한 분포를 보이는 것으로 조사되었다. 이러한 결과는 모집단은 동일하지만 서로 다른 표본에서 수집된 자료를 통계적으로 결합하여 신뢰할 수 있는 새로운 데이터를 확보할 수 있다는 측면에서 큰 의의가 있다. 또한, 경영학 분야에서 많이 사용되지 않았던 데이터 매칭 방법론을 모의실험을 통해 타당성을 검증함으로써 연구용 데이터 확보와 연구방법론의 확장에 기여했다는 점에서 시사점을 가진다.

블레이드의 표면 결함 검출을 위한 Faster R-CNN 딥러닝 모델 구축 (Construction of Faster R-CNN Deep Learning Model for Surface Damage Detection of Blade Systems)

  • 장지원;안효준;이종한;신수봉
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제23권7호
    • /
    • pp.80-86
    • /
    • 2019
  • 컴퓨터 성능 향상으로 다양한 분야에서 딥러닝을 활용한 연구가 활발히 진행되고 있으며 최근에는 구조물 안전성 평가 연구에도 그 적용이 이루어지고 있다. 특히 터빈의 내부 블레이드는 분리가 쉽지 않고 어두운 주변 환경으로 인해 블레이드의 표면 결함 검출은 전문 인력의 경험에 의존하고 있으며, 점검시간도 상당히 소요되고 있는 실정이다. 따라서, 본 연구에서는 딥러닝 기술을 적용하여 터빈 구조의 부재 중 하나인 내부 블레이드에 발생하는 결함을 검출할 수 있는 효율적인 방법을 제시하였다. Faster R-CNN 인공신경망 기법을 활용하여 결함의 이미지 데이터를 학습하였고 부족한 이미지는 필터링과 Image Data Generator를 이용하여 데이터를 확장하였다. 그 결과 블레이드의 결함을 학습한 딥러닝 모델은 평균적으로 약 96.1%의 정확도와 재현율은 95.3%, 정밀도는 96%의 성능을 보였다. 재현율을 통해 제시된 딥러닝 모델이 결함을 탐지하지 못하는 경우는 4.7% 로 나타났다. 재현율의 성능은 여러 환경의 많은 결함 이미지 데이터를 수집하고 확장하여 딥러닝 학습에 적용함으로써 더욱 향상되리라 판단된다. 이러한 실제 블레이드의 결함 이미지 데이터 확보와 학습을 통해 향후 터빈엔진 정비에 적용 가능한 결함 검출 시스템으로 발전할 수 있을 것이다.