• 제목/요약/키워드: binary processing

검색결과 729건 처리시간 0.025초

클러스터링 기반 앙상블 모델 구성을 이용한 이상치 탐지 (Outlier Detection By Clustering-Based Ensemble Model Construction)

  • 박정희;김태공;김지일;최세목;이경훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권11호
    • /
    • pp.435-442
    • /
    • 2018
  • 이상치 탐지는 정상 데이터 분포를 크게 벗어나는 데이터 샘플을 탐지하는 것을 의미한다. 대부분의 이상치 탐지 방법은 데이터 샘플이 정상 상태를 벗어나는 정도를 나타내는 이상치 지수(outlier score)를 계산하여 주어진 임계값 이상일 때 이상치로 판정한다. 그러나, 데이터마다 이상치 지수의 범위가 다양하고 정상 데이터에 비해 이상치 데이터는 적은 비율로 존재하기 때문에 이상치 지수에 대한 임계값을 결정하기는 매우 어렵다. 또한, 실제 상황에서는 학습에 이용할 수 있는 충분한 양의 이상치를 포함하는 데이터의 획득이 용이하지 않다. 본 논문에서는 정상 데이터가 주어졌을 때 이를 이용하여 정상 데이터 영역을 나타내는 모델을 구성하고 새로운 데이터 샘플에 대해 이상치와 정상치의 이진 분류를 수행하는 방법으로 군집화 기반 이상치 탐지 방법을 제안한다. 그리고, 주어진 정상 데이터를 청크로 나누고 각 청크에 대해 클러스터링 모델을 구성한 후 모델들에 의한 이상치 판정 결과를 결합하는 앙상블 방법과 동적 변화가 있는 스트리밍 데이터에서의 적용 방법으로 확장한다. 실제 데이터와 인공 데이터를 이용한 실험결과는 제안 방법의 높은 성능을 보여준다.

원격응용에 적합한 지문 정보 보호 (Protecting Fingerprint Data for Remote Applications)

  • 문대성;정승환;김태해;이한성;양종원;최은화;서창호;정용화
    • 정보보호학회논문지
    • /
    • 제16권6호
    • /
    • pp.63-71
    • /
    • 2006
  • 본 논문에서는 지문 센서-클라이언트-서버 모델의 원격 지문 인식 시스템을 이용한 안전하고 효과적인 사용자 인증방법을 제안한다 특히, 실시간성. 확장성. 프라이버시 이슈 등을 고려하여 지문 인식 과정 중 가장 많은 계산시간을 필요로 하는 지문 특징 추출 과정을 클라이언트에 할당하는 일반적 구현과 달리, 클라이언트가 일반 사용자에 의해 관리되어 여러 공격에 취약할 수 있다는 가정하에서도 동작할 수 있는 방법을 제안한다. 즉. 지문 센서와 서버 사이에 위치한 클라이언트를 신뢰할 수 없는 경우라도 실시간성, 확장성. 프라이버시 이슈 등을 만족하기 위해서는 클라이언트를 활용할 수밖에 없으며. 지문 센서나 서버에서는 신뢰할 수 없는 클라이언트에게 위임하여 생성된 지문정보를 검증해야 한다. 또한, 자원 제약적인 지문센서가 클라이언트가 생성한 지문 정보를 실시간으로 검증하기 위해서는 검증 과정 자체가 간단해야 된다는 제약이 있다. 본 연구에서는 이러한 문제를 해결하기 위해 지문 특징 추출 과정을 이진화와 특징점 추출 과정으로 분리하여 클라이언트에서 이진화 과정을 실행하고 지문 센서에서는 클라이언트로부터 받은 이진화 결과의 정당성을 확인하기 위한 경량화된 검증 방법을 수행한다 검증 후 이상이 없으면 클라이언트로부터 수신한 이진영상에서 특징점을 추출한 후 서버로 전송한다. 제안된 방법의 타당성을 확인하기 위해 지문 영상을 이용한 실험을 수행한 결과, 제안된 방법이 지문 센서-클라이언트-서버 모델에서 실시간으로 안전하게 수행될 수 있음을 확인하였다.

A modified U-net for crack segmentation by Self-Attention-Self-Adaption neuron and random elastic deformation

  • Zhao, Jin;Hu, Fangqiao;Qiao, Weidong;Zhai, Weida;Xu, Yang;Bao, Yuequan;Li, Hui
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.1-16
    • /
    • 2022
  • Despite recent breakthroughs in deep learning and computer vision fields, the pixel-wise identification of tiny objects in high-resolution images with complex disturbances remains challenging. This study proposes a modified U-net for tiny crack segmentation in real-world steel-box-girder bridges. The modified U-net adopts the common U-net framework and a novel Self-Attention-Self-Adaption (SASA) neuron as the fundamental computing element. The Self-Attention module applies softmax and gate operations to obtain the attention vector. It enables the neuron to focus on the most significant receptive fields when processing large-scale feature maps. The Self-Adaption module consists of a multiplayer perceptron subnet and achieves deeper feature extraction inside a single neuron. For data augmentation, a grid-based crack random elastic deformation (CRED) algorithm is designed to enrich the diversities and irregular shapes of distributed cracks. Grid-based uniform control nodes are first set on both input images and binary labels, random offsets are then employed on these control nodes, and bilinear interpolation is performed for the rest pixels. The proposed SASA neuron and CRED algorithm are simultaneously deployed to train the modified U-net. 200 raw images with a high resolution of 4928 × 3264 are collected, 160 for training and the rest 40 for the test. 512 × 512 patches are generated from the original images by a sliding window with an overlap of 256 as inputs. Results show that the average IoU between the recognized and ground-truth cracks reaches 0.409, which is 29.8% higher than the regular U-net. A five-fold cross-validation study is performed to verify that the proposed method is robust to different training and test images. Ablation experiments further demonstrate the effectiveness of the proposed SASA neuron and CRED algorithm. Promotions of the average IoU individually utilizing the SASA and CRED module add up to the final promotion of the full model, indicating that the SASA and CRED modules contribute to the different stages of model and data in the training process.

도로표지에 대한 고령운전자의 인간공학적 특성과 적정 안내지명 개수에 대한 연구 (Older Drivers' Characteristics and Optimal Number of Guide Names on Road Signs)

  • 노관섭;이종학;김종민
    • 대한토목학회논문집
    • /
    • 제28권2D호
    • /
    • pp.235-242
    • /
    • 2008
  • 고령인구의 운전참여 비율이 급증하는 시점에서 시력 및 운전판단 능력이 떨어지는 고령운전자가 안전하게 운행할 수 있도록 하기 위해서는 고령운전자를 위한 도로교통환경의 정비가 무엇보다 중요하다. 도로교통 안전시설물 중에서 가장 먼저 생각할 수 있는 것은 도로표지로, 고령운전자가 도로표지를 잘 알아볼 수 있도록 설치할 필요가 있다. 본 연구는 고령운전자가 도로표지판의 지명개수에 대해서 어떻게 반응하는지, 또한 연령대별로 어느 정도 차이가 나는지를 실험하기 위해서 다양한 연령층(20대~70대)을 확보하여 실험을 수행하였다. 이때 사용된 장비는 표지판의 내용을 완벽하게 주시했는지를 알 수 있는 안구운동분석기와 도로현실을 최대한 반영한 가상 도로주행시뮬레이터를 사용하였다. 연구내용은 고령운전자에 대한 속도변화, 판독소요시간 분석, 오독률 분석을 실시하였다. 그 결과 각 구간에서 연령대별 판독과정에 따른 속도변화를 살펴보면, 전체적으로 연령이 높을수록 속도는 낮은 경향을 나타냈다. 연령대별 평균 판독소요시간 분석에서 회귀분석을 실시한 결과, 비표준화계수를 살펴보면 연령이 증가할수록 판독소요시간이 0.106초씩 증가하였다. 그리고 Logistic Model을 이용하여 연령별 지명개수에 따른 오독률을 분석한 결과, 5% 미만의 오독률을 고려하였을 때 고령자의 경우에는 지명개수가 4개 이하가 가장 바람직한 것으로 나타났다. 본 연구는 도로교통환경에서 보호받아야할 고령자에게 도로표지판의 적정 지명개수를 제시함으로써 도로교통안전에 도움이 될 것으로 본다. 또한 향후 각종 도로교통표지 설계시 안전성을 제고하는 기법 개발에 활용 및 기여할 것이다.

계층적 Level-of-Detail 표현을 이용한 해마의 국부적인 형상 분석 (Local Shape Analysis of the Hippocampus using Hierarchical Level-of-Detail Representations)

  • 김정식;최수미;최유주;김명희
    • 정보처리학회논문지A
    • /
    • 제11A권7호
    • /
    • pp.555-562
    • /
    • 2004
  • 뇌의 하부 구조인 해마의 전역적 부피 감소와 국부적 형상 변화는 정신의학적 질환에 깊게 관련되어 있다. 해마 구조에 관한 형상 분석 연구는 크게 해마 형상 표현 모델을 구축하고, 이러한 형상 표현으로부터 형상 유사성을 계산하는 과정으로 구성된다. 본 논문에서는 메쉬, 복셀, 골격 데이터를 포함하는 복합적인 옥트리 기반의 형상 표현을 이용하여 해마의 형상을 분석하기 위한 새로운 방법을 제시한다. 우선 해마에 관한 MRI 데이터를 입력으로 받아, 마칭큐브 알고리즘을 사용하여 다해상도 메쉬 모델을 구축한다. 이렇게 구성된 다각형 모델은 깊이맵 기반의 복셀화 방법을 이용하여 중간 단계의 이진 복셀 데이터로 변환된다. 그리고 변환된 복셀 데이터로부터 슬라이스 기반의 골격화 방법에 의하여 해마의 3차원 골격을 추출한다. 그런 후에 옥트리 기반의 다해상도 형상 표현을 얻기위해 해마의 메쉬, 복셀, 골격 데이터를 계층적으로 공간 분할하여 저장하고, 광선 추적 기반의 메쉬 샘플링 방법을 적용하여 샘플 메쉬 데이터를 추출한다. 최종적으로, 형상간 유사성 측정을 위하여 추출된 골격으로부터 방사되는 광선들과 충돌되는 각 샘플 메쉬 쌍에 대하여 $L_2$과 하우스도르프 거리를 계산하고 인터랙티브한 국부적 형상 분석을 지원하기 위하여 마우스 피킹 인터페이스를 채택한다. 이것은 형상의 국부적 변화에 대하여 다양한 해상도에 기반한 형상 분석을 가능하게 한다. 본 논문에서는 실험을 통하여, 제시한 형상 분석 방법이 회전과 스케일 등의 변환에 강인하고, 특히 형상의 국부적 변화 정도를 정확도를 유지하면서 빠르게 평가하는데에 효과적임을 확인하였다. 경로의 수신 신호가 완전 동기 된 수신 신호임을 확인하였다.omonas aeruginosa PA01과 $82\%$로 가장 높은 유사성을 보였고 Pseudomonas arvilla C-1와는 $71\%,$ Pseudomonas putida KT2440과는 $59\%,$ 그리고 Pseudomonas sp. CA10과는 $53\%$의 상동성이 각각 존재하는 것으로 확인하였다.)을 가지고 있음이 확인되었다. 사람에 직접적인 유해성을 가지고 있는 지 확인하기 위해 사람 방광 유래의 T-24세포와 장내 표피 유래의 Caco-2세포에 대한 부착능을 시험하였을 때, 16균주$(42.1\%)$가 T-24방광 세포에, 그리고 17균주$(44.7\%)$가 Caco-2장세포에 대해 강한 부착능을 나타내었다. 특히 11균주$(28.9\%)$는 두 세포 모두에 강한 부착능을 가지고 있었다. Filter mating method를 수행하여 이들 균주들의 독소 생산 유전자와 항생제 내성 유전자가 사람에서 분리된 균주로 전달되는 것을 확인할 수 있었다. 본 실험의 결과는 설사 중상을 나타내는 돼지로부터 분리된 용혈성 E. coli의 독성과 세포 부착능력, 그리고 항생제 내성간의 상호 연관성을 보여주지 않았으나 동물 분리 세균의 항생제 내성과 독소 생산 능력이 유전자 전달을 통해서 뿐만 아니라 세균의 직접 접촉에 의해서도 인체로 전달될 수 있는 것을 보여주는 것이다.다. 본 연구를 토대로 장시간의 체외순환에서는 신장기능을 대표하는 수치들에도

다양한 다분류 SVM을 적용한 기업채권평가 (Corporate Bond Rating Using Various Multiclass Support Vector Machines)

  • 안현철;김경재
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.157-178
    • /
    • 2009
  • Corporate credit rating is a very important factor in the market for corporate debt. Information concerning corporate operations is often disseminated to market participants through the changes in credit ratings that are published by professional rating agencies, such as Standard and Poor's (S&P) and Moody's Investor Service. Since these agencies generally require a large fee for the service, and the periodically provided ratings sometimes do not reflect the default risk of the company at the time, it may be advantageous for bond-market participants to be able to classify credit ratings before the agencies actually publish them. As a result, it is very important for companies (especially, financial companies) to develop a proper model of credit rating. From a technical perspective, the credit rating constitutes a typical, multiclass, classification problem because rating agencies generally have ten or more categories of ratings. For example, S&P's ratings range from AAA for the highest-quality bonds to D for the lowest-quality bonds. The professional rating agencies emphasize the importance of analysts' subjective judgments in the determination of credit ratings. However, in practice, a mathematical model that uses the financial variables of companies plays an important role in determining credit ratings, since it is convenient to apply and cost efficient. These financial variables include the ratios that represent a company's leverage status, liquidity status, and profitability status. Several statistical and artificial intelligence (AI) techniques have been applied as tools for predicting credit ratings. Among them, artificial neural networks are most prevalent in the area of finance because of their broad applicability to many business problems and their preeminent ability to adapt. However, artificial neural networks also have many defects, including the difficulty in determining the values of the control parameters and the number of processing elements in the layer as well as the risk of over-fitting. Of late, because of their robustness and high accuracy, support vector machines (SVMs) have become popular as a solution for problems with generating accurate prediction. An SVM's solution may be globally optimal because SVMs seek to minimize structural risk. On the other hand, artificial neural network models may tend to find locally optimal solutions because they seek to minimize empirical risk. In addition, no parameters need to be tuned in SVMs, barring the upper bound for non-separable cases in linear SVMs. Since SVMs were originally devised for binary classification, however they are not intrinsically geared for multiclass classifications as in credit ratings. Thus, researchers have tried to extend the original SVM to multiclass classification. Hitherto, a variety of techniques to extend standard SVMs to multiclass SVMs (MSVMs) has been proposed in the literature Only a few types of MSVM are, however, tested using prior studies that apply MSVMs to credit ratings studies. In this study, we examined six different techniques of MSVMs: (1) One-Against-One, (2) One-Against-AIL (3) DAGSVM, (4) ECOC, (5) Method of Weston and Watkins, and (6) Method of Crammer and Singer. In addition, we examined the prediction accuracy of some modified version of conventional MSVM techniques. To find the most appropriate technique of MSVMs for corporate bond rating, we applied all the techniques of MSVMs to a real-world case of credit rating in Korea. The best application is in corporate bond rating, which is the most frequently studied area of credit rating for specific debt issues or other financial obligations. For our study the research data were collected from National Information and Credit Evaluation, Inc., a major bond-rating company in Korea. The data set is comprised of the bond-ratings for the year 2002 and various financial variables for 1,295 companies from the manufacturing industry in Korea. We compared the results of these techniques with one another, and with those of traditional methods for credit ratings, such as multiple discriminant analysis (MDA), multinomial logistic regression (MLOGIT), and artificial neural networks (ANNs). As a result, we found that DAGSVM with an ordered list was the best approach for the prediction of bond rating. In addition, we found that the modified version of ECOC approach can yield higher prediction accuracy for the cases showing clear patterns.

밀 고분자 글루테닌 유전자를 이용하여 빵 가공적성 증진을 위한 마커 프리 형질전환 벼의 개발 (Development of Marker-free Transgenic Rice for Increasing Bread-making Quality using Wheat High Molecular Weight Glutenin Subunits (HMW-GS) Gene)

  • 박수권;신동진;황운하;오세윤;조준현;한상익;남민희;박동수
    • 생명과학회지
    • /
    • 제23권11호
    • /
    • pp.1317-1324
    • /
    • 2013
  • 고분자 글루테닌 서버유닛(high molecular-weight glutenin subunit, HMW-GS)은 밀의 가공적성을 결정하는데 중요한 역할을 수행한다. 우리는 Agrobacterium 동시 형질전환법을 이용하여 한국 밀 품종인 '조경'으로부터 밀 HMW-GS을 암호화하는 Glu-1Bx7 유전자를 가지는 marker-free 형질전환 벼를 생산하였다. Glu-1Bx7 유전자의 종자 특이적 발현을 위하여 밀 Glu-1Bx7 유전자 자체 프로모터를 벡터 내에 삽입하였다. 동시 접종을 위해서 오직 Glu-1Bx7 유전자와 hygromycin phosphotransferase II (HPTII) 저항성 유전자만으로 구성된 두 종류의 발현 카셋트를 독립적으로 Agrobacterium EHA105에 도입하였고, Glu-1Bx7와 HPTII가 도입된 각각의 EHA105 Agrobacterium 을 3:1 비율로 혼합하여 벼 캘러스에 접종하였다. 216개의 HPTII 저항성 형질전환체 중에서 벼 게놈에 Glu-1Bx7과 HPTII가 모두 삽입된 24개의 형질전환 라인을 획득하였다. Glu-1Bx7와 HPTII가 벼 게놈에 도입된 것을 Southern blot을 통해서 다시 확인하였다. 형질전환 벼 $T_1$ 세대의 종자에서 밀 Glu-1Bx7 유전자가 전사와 번역되어 오직 Glu-1Bx7만을 가지는 marker-free 식물체를 $T_1$ 세대에서 성공적으로 선발할 수 있었다.

A hybrid algorithm for the synthesis of computer-generated holograms

  • Nguyen The Anh;An Jun Won;Choe Jae Gwang;Kim Nam
    • 한국광학회:학술대회논문집
    • /
    • 한국광학회 2003년도 하계학술발표회
    • /
    • pp.60-61
    • /
    • 2003
  • A new approach to reduce the computation time of genetic algorithm (GA) for making binary phase holograms is described. Synthesized holograms having diffraction efficiency of 75.8% and uniformity of 5.8% are proven in computer simulation and experimentally demonstrated. Recently, computer-generated holograms (CGHs) having high diffraction efficiency and flexibility of design have been widely developed in many applications such as optical information processing, optical computing, optical interconnection, etc. Among proposed optimization methods, GA has become popular due to its capability of reaching nearly global. However, there exits a drawback to consider when we use the genetic algorithm. It is the large amount of computation time to construct desired holograms. One of the major reasons that the GA' s operation may be time intensive results from the expense of computing the cost function that must Fourier transform the parameters encoded on the hologram into the fitness value. In trying to remedy this drawback, Artificial Neural Network (ANN) has been put forward, allowing CGHs to be created easily and quickly (1), but the quality of reconstructed images is not high enough to use in applications of high preciseness. For that, we are in attempt to find a new approach of combiningthe good properties and performance of both the GA and ANN to make CGHs of high diffraction efficiency in a short time. The optimization of CGH using the genetic algorithm is merely a process of iteration, including selection, crossover, and mutation operators [2]. It is worth noting that the evaluation of the cost function with the aim of selecting better holograms plays an important role in the implementation of the GA. However, this evaluation process wastes much time for Fourier transforming the encoded parameters on the hologram into the value to be solved. Depending on the speed of computer, this process can even last up to ten minutes. It will be more effective if instead of merely generating random holograms in the initial process, a set of approximately desired holograms is employed. By doing so, the initial population will contain less trial holograms equivalent to the reduction of the computation time of GA's. Accordingly, a hybrid algorithm that utilizes a trained neural network to initiate the GA's procedure is proposed. Consequently, the initial population contains less random holograms and is compensated by approximately desired holograms. Figure 1 is the flowchart of the hybrid algorithm in comparison with the classical GA. The procedure of synthesizing a hologram on computer is divided into two steps. First the simulation of holograms based on ANN method [1] to acquire approximately desired holograms is carried. With a teaching data set of 9 characters obtained from the classical GA, the number of layer is 3, the number of hidden node is 100, learning rate is 0.3, and momentum is 0.5, the artificial neural network trained enables us to attain the approximately desired holograms, which are fairly good agreement with what we suggested in the theory. The second step, effect of several parameters on the operation of the hybrid algorithm is investigated. In principle, the operation of the hybrid algorithm and GA are the same except the modification of the initial step. Hence, the verified results in Ref [2] of the parameters such as the probability of crossover and mutation, the tournament size, and the crossover block size are remained unchanged, beside of the reduced population size. The reconstructed image of 76.4% diffraction efficiency and 5.4% uniformity is achieved when the population size is 30, the iteration number is 2000, the probability of crossover is 0.75, and the probability of mutation is 0.001. A comparison between the hybrid algorithm and GA in term of diffraction efficiency and computation time is also evaluated as shown in Fig. 2. With a 66.7% reduction in computation time and a 2% increase in diffraction efficiency compared to the GA method, the hybrid algorithm demonstrates its efficient performance. In the optical experiment, the phase holograms were displayed on a programmable phase modulator (model XGA). Figures 3 are pictures of diffracted patterns of the letter "0" from the holograms generated using the hybrid algorithm. Diffraction efficiency of 75.8% and uniformity of 5.8% are measured. We see that the simulation and experiment results are fairly good agreement with each other. In this paper, Genetic Algorithm and Neural Network have been successfully combined in designing CGHs. This method gives a significant reduction in computation time compared to the GA method while still allowing holograms of high diffraction efficiency and uniformity to be achieved. This work was supported by No.mOl-2001-000-00324-0 (2002)) from the Korea Science & Engineering Foundation.

  • PDF

주부의 연령대별 농식품 소비 특성 비교 (Comparison of Housewives' Agricultural Food Consumption Characteristics by Age)

  • 홍준호;김진실;유연주;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.83-89
    • /
    • 2021
  • 라이프스타일이 빠르게 변화하고 있고, 식생활과 식품가공 기술의 발전에 따라 가구별로 식품 소비패턴이 매우 다양하다. 본 논문은 가구 단위의 농식품 구매 정보를 담고 있는 농촌진흥청이 구축하고 있는 소비자 패널 데이터의 식품군을 재분류하고 농식품 소비행위 주체인 패널 대표자의 연령대별로 그룹화하여 농식품 소비 특성 비교를 하였다. 연령대 구분의 기준은 대사질환 유병률로 20% 이상인 60대 이상 그룹과 10% 미만인 30~40대 그룹으로 나누었다. LightGBM 알고리즘을 사용하여 30~40대와 60대 이상의 식품 소비패턴의 차이를 분류 분석한 결과 정밀도는 0.85, 재현율은 0.71, F1_score는 0.77로 나타났다. 변수중요도의 결과는 과자류, 엽경채나물류, 조미채류, 과채류, 수산물류 순이었으며, SHAP 지표의 상위 5개 값은 과자류, 수산물류, 조미채류, 과채류, 엽경채나물류 순이었다. 이상치에 민감한 평균을 대신한 중앙값으로 소비패턴을 이진 분류한 결과 과자류의 경우 30~40대가 60대보다 두 배 이상 높은 것을 알 수 있었다. 이외의 변수에서도 30~40대와 60대 이상 사이에서 유의미한 차이를 보였다. 연구 결과 30~40대는 60대보다 과자류를 두 배 이상 소비하는 패턴을 보였으며, 60대의 경우 30~40대보다 수산물, 조미채류, 과채류, 엽경채나물류를 두 배 이상 섭취하였다. 상위 5개 품목 외에도 밀가공식품인 과자, 빵류, 면류에서 30~40대의 소비가 높았으며, 이는 60대의 식품 소비패턴과 차이를 보였다.