• 제목/요약/키워드: high performance computing

검색결과 1,114건 처리시간 0.026초

의미 기반 유전 알고리즘을 사용한 특징 선택 (Semantic-based Genetic Algorithm for Feature Selection)

  • 김정호;인주호;채수환
    • 인터넷정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.1-10
    • /
    • 2012
  • 본 논문은 문서 분류의 전처리 단계인 특징 선택을 위해 의미를 고려한 최적의 특징 선택 방법을 제안한다. 특징 선택은 불필요한 특징을 제거하고 분류에 필요한 특징을 추출하는 작업으로 분류 작업에서 매우 중요한 역할을 한다. 특징 선택 기법으로 특징의 의미를 파악하여 특징을 선택하는 LSA(Latent Semantic Analysis) 기법을 사용하지만 기본 LSA는 분류 작업에 특성화 된 기법이 아니므로 지도적 학습을 통해 분류에 적합하도록 개선된 지도적 LSA를 사용한다. 지도적 LSA를 통해 선택된 특징들로부터 최적화 기법인 유전 알고리즘을 사용하여 더 최적의 특징들을 추출한다. 마지막으로, 추출한 특징들로 분류할 문서를 표현하고 SVM (Support Vector Machine)을 이용한 특정 분류기를 사용하여 분류를 수행하였다. 지도적 LSA를 통해 의미를 고려하고 유전 알고리즘을 통해 최적의 특징 집합을 찾음으로써 높은 분류 성능과 효율성을 보일 것이라 가정하였다. 인터넷 뉴스 기사를 대상으로 분류 실험을 수행한 결과 적은 수의 특징들로 높은 분류 성능을 확인할 수 있었다.

플래시 메모리 저장장치에서 효율적인 M-트리 기반의 인덱싱 구현 (An Implementation of Efficient M-tree based Indexing on Flash-Memory Storage System)

  • 유정수;낭종호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.70-74
    • /
    • 2010
  • 최근 플래시 메모리의 용량이 빠른 속도로 증가하면서 휴대 기기 환경에서 대량의 멀티미디어 데이터를 저장하는 것이 가능하게 되었다. 따라서 플래시 메모리 상에서 인덱스 구조를 통한 데이터 관리 기법이 필요하게 되었다. 여러 인덱싱 방법 중 M-tree는 고차원 거리 공간에 적합하기 때문에 멀티미디어 데이터의 특징 데이터에 대한 인덱싱 방법으로 가장 많이 쓰이고 있다. 그러나 플래시 메모리는 쓰기 연산의 제한을 갖기 때문에, 잦은 쓰기가 발생하는 트리 구조의 인덱싱을 구축 시 심각한 성능 저하가 발생한다. 본 논문에서는 플래시 메모리 상에서 M-tree를 구현함에 있어서 노드 분할 방법을 통하여 쓰기 연산의 횟수를 감소시켜 입출력 성능을 향상시키는 방법을 제안하였다. 실험에 의하면 쓰기 횟수를 약 7%정도로 현저히 감소시킨 것으로 나타났다. 본 논문에서 제안한 방법을 사용하여 플래시 메모리 상에서 대량의 데이터에 대한 인덱싱을 효율적으로 구축할 수 있을 것이다.

잡지기사 관련 상품 연계 추천 서비스를 위한 하이퍼네트워크 기반의 상품이미지 자동 태깅 기법 (Auto-tagging Method for Unlabeled Item Images with Hypernetworks for Article-related Item Recommender Systems)

  • 하정우;김병희;이바도;장병탁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권10호
    • /
    • pp.1010-1014
    • /
    • 2010
  • 잡지기사 관련 상품 연계 추천 서비스는 온라인 상에서 잡지 가사의 컨텍스트를 반영하여 상품을 추천하는 서비스이다. 현재 이러한 서비스는 잡지기사와 상품에 부여되어 있는 태그 간의 유사성을 기준으로 한 추천 기술에 의존하고 있으나, 태그 부여 비용과 추천의 정확도가 높지 않은 단점이 있다. 본 논문에서는 잡지 기사 컨텍스트 관련 상품연계 추천 기술의 한 요소로서 상품이미지 정보로부터 상품의 종류를 자동으로 분류하고 이를 상품의 태그로 활용하는 방법을 제안한다. 이미지에서 추출한 시각단어(visual word)와 상품 종류 간의 고차 연관관계를 하이퍼네트워크 기법을 통해 학습하고, 학습된 하이퍼네트워크를 이용하여 상품 이미지에 한 개 이상의 태그를 자동으로 부여한다. 실제 온라인 쇼핑몰에서 사용되는 10 가지 종류의 상품 1,251개의 이미지 데이터를 기반으로, 하이퍼네트워크 이용한 상품이미지 자동 태깅 기법이 다른 기계학습 방법과 비교하여 경쟁력 있는 성능을 보여줌과 동시에, 복수개의 태그 부여를 통해 상품 이미지 태깅의 정확성이 향상됨을 보인다.

H.264/AVC부호화기용 움직임 보상기의 아키텍처 연구 (A Study on Architecture of Motion Compensator for H.264/AVC Encoder)

  • 김원삼;손승일;강민구
    • 한국정보통신학회논문지
    • /
    • 제12권3호
    • /
    • pp.527-533
    • /
    • 2008
  • 움직임 보상은 고화질의 실시간 비디오 응용에 있어서 언제나 주된 병목을 초래한다. 따라서 실시간 비디오 응용에서는 움직임 보상을 수행하는 고속의 전용 하드웨어를 필요로 한다. 여러 동영상 부호화 방식에서 영상프레임은 픽셀의 블록으로 분할된다. 일반적으로 움직임 보상은 이전 프레임으로부터 움직임을 추정하여 현재의 블록을 예측하게 된다. 움직임 보상에 사용되는 화소 정밀도가 높을수록 보다. 좋은 성능을 갖지만 연산량은 증가하게 된다. 본 논문에서는 1/4 화소 정밀도를 지원하는 H.264/AVC 부호화기에 적합한 움직임 보상기의 아키텍처를 연구하였다. 설계된 움직임 보상기는 전치 배열과 휘도 6-tap 필터 3개를 사용하여 높은 하드웨어 이용률을 갖게 하였으며 내부 메모리의 크기를 감소시켰다. VHDL을 사용하여 기술하였으며, Xilinx ISE툴을 사용하여 합성하고, Modelsim_6.1i를 사용하여 검증하였다. 설계된 움직임 보상기는 단지 3개의 6-tap 필터만을 사용하면서 매크로블록 당 640 클럭 사이클에 수행하였다. 본 논문에서 제안하는 움직임 보상기는 실시간 비디오 처리를 요구하는 분야에 응용 가능할 것으로 사료된다.

심탄도와 인공지능을 이용한 혈당수치 예측모델 연구 (The study of blood glucose level prediction model using ballistocardiogram and artificial intelligence)

  • 최상기;박철구
    • 디지털융복합연구
    • /
    • 제19권9호
    • /
    • pp.257-269
    • /
    • 2021
  • 논문은 심탄도(BCG, Ballistocardiogram) 센서를 이용하여 생체신호 데이터를 비침습, 무구속적인 방식으로 수집하고, ICT 기술과 고성능 컴퓨팅 환경에서 인공지능 기계학습 알고리즘을 활용하여 데이터 기반 혈당 예측 알고리즘 모델 개발 및 검증하는 방법을 제시하고 연구하는 것이다. 혈당수치 예측모델은 MLP 아키텍처에 입력노드는 심박수, 호흡수, 심박출량, 심박변이도, SDNN, RMSSD, PNN50, 나이, 성별이며, 은닉층 7개를 사용하였다. 실험 결과는 5회 실험한 학습데이터의 평균 MSE, MAE 및 RMSE 값은 각각 0.5226, 0.6328 및 0.7692이며 검증데이터 평균 값은 각각 0.5408, 0.6776, 0.7968이었으며, 결정계수(R2) 수치는 0.9997의 결과를 보였다. 데이터를 기반으로 한 혈당수치를 예측하는 모델을 표준화하고 데이터셋 수집과 예측 정확성을 검증하는 연구가 계속적으로 진행된다면 비침습 방식의 혈당 수준 관리에 활용될 수 있을 것으로 사료된다.

The influence of a first-order antedependence model and hyperparameters in BayesCπ for genomic prediction

  • Li, Xiujin;Liu, Xiaohong;Chen, Yaosheng
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제31권12호
    • /
    • pp.1863-1870
    • /
    • 2018
  • Objective: The Bayesian first-order antedependence models, which specified single nucleotide polymorphisms (SNP) effects as being spatially correlated in the conventional BayesA/B, had more accurate genomic prediction than their corresponding classical counterparts. Given advantages of $BayesC{\pi}$ over BayesA/B, we have developed hyper-$BayesC{\pi}$, ante-$BayesC{\pi}$, and ante-hyper-$BayesC{\pi}$ to evaluate influences of the antedependence model and hyperparameters for $v_g$ and $s_g^2$ on $BayesC{\pi}$.Methods: Three public data (two simulated data and one mouse data) were used to validate our proposed methods. Genomic prediction performance of proposed methods was compared to traditional $BayesC{\pi}$, ante-BayesA and ante-BayesB. Results: Through both simulation and real data analyses, we found that hyper-$BayesC{\pi}$, ante-$BayesC{\pi}$ and ante-hyper-$BayesC{\pi}$ were comparable with $BayesC{\pi}$, ante-BayesB, and ante-BayesA regarding the prediction accuracy and bias, except the situation in which ante-BayesB performed significantly worse when using a few SNPs and ${\pi}=0.95$. Conclusion: Hyper-$BayesC{\pi}$ is recommended because it avoids pre-estimated total genetic variance of a trait compared with $BayesC{\pi}$ and shortens computing time compared with ante-BayesB. Although the antedependence model in $BayesC{\pi}$ did not show the advantages in our study, larger real data with high density chip may be used to validate it again in the future.

Machine learning application for predicting the strawberry harvesting time

  • Yang, Mi-Hye;Nam, Won-Ho;Kim, Taegon;Lee, Kwanho;Kim, Younghwa
    • 농업과학연구
    • /
    • 제46권2호
    • /
    • pp.381-393
    • /
    • 2019
  • A smart farm is a system that combines information and communication technology (ICT), internet of things (IoT), and agricultural technology that enable a farm to operate with minimal labor and to automatically control of a greenhouse environment. Machine learning based on recently data-driven techniques has emerged with big data technologies and high-performance computing to create opportunities to quantify data intensive processes in agricultural operational environments. This paper presents research on the application of machine learning technology to diagnose the growth status of crops and predicting the harvest time of strawberries in a greenhouse according to image processing techniques. To classify the growth stages of the strawberries, we used object inference and detection with machine learning model based on deep learning neural networks and TensorFlow. The classification accuracy was compared based on the training data volume and training epoch. As a result, it was able to classify with an accuracy of over 90% with 200 training images and 8,000 training steps. The detection and classification of the strawberry maturities could be identified with an accuracy of over 90% at the mature and over mature stages of the strawberries. Concurrently, the experimental results are promising, and they show that this approach can be applied to develop a machine learning model for predicting the strawberry harvesting time and can be used to provide key decision support information to both farmers and policy makers about optimal harvest times and harvest planning.

한국 만성폐쇄성폐질환 환자 대상 임상 연구를 위한 온라인 등록 시스템 구축 (Development of Online Registration System for Clinical Research on Korea COPD Population)

  • 박지숙
    • 인터넷정보학회논문지
    • /
    • 제22권1호
    • /
    • pp.89-98
    • /
    • 2021
  • 지역사회획득폐렴은 만성폐쇄성페질환 환자 사망의 중요 원인 질환이며 폐렴구균은 폐렴의 중요 원인균이다. 폐렴구균에 의한 폐렴을 예방하는 대표적인 방법으로는 폐렴구균백신과 독감백신의 접종을 들 수 있다. 국내 주요 7개 대학병원에서는 전향적, 다기관, 코호트 연구를 통하여 폐렴으로 입원한 만성폐쇄성폐질환 환자를 대상으로 폐렴구균예방접종과 독감예방접종여부에 따라 폐렴의 중증도에 차이가 있는지에 대해 연구하였다. 본 연구의 목적은 다기관 연구자들이 만성폐쇄성폐질환 환자의 데이터를 효과적으로 수집하고 관리하도록 도움을 주는 온라인 등록 시스템을 구축하는 것이다. 본 연구에서는 기존의 오프라인 임상 연구의 단점을 보완하기 위해 정확한 데이터의 입력과 편리한 데이터 완성, 그리고 실시간 데이터 관리 등의 세 가지 기본 전략을 제시하였다. 개발된 온라인 등록 시스템은 다기관 임상 연구에 활용되어 그 성능을 평가받았다.

하이브리드 블록체인 기반의 안전한 펌웨어 배포 시스템 (Hybrid blockchain-based secure firmware distribution system)

  • 손민성;김희열
    • 인터넷정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.121-132
    • /
    • 2019
  • 4차 산업시대에 들어가며 IoT기기들의 수는 폭발적으로 증가하고 있다. 그에 따라 증가하는 IoT기기들의 보안사고와 비례하여 보안의 중요성에 대한 관심 또한 높아지고 있다. 하지만 IoT기기들의 제한적인 성능으로 인해 기존의 보안 솔루션을 적용하기에는 제약이 있다. 따라서 이를 해결하기 위한 새로운 자동 펌웨어 배포 솔루션을 필요로 한다. 우리는 이 문제를 해결하기 위해 퍼블릭 블록체인과 프라이빗 블록체인을 결합한 하이브리드 블록체인을 사용하는 새로운 자동 펌웨어 업데이트 시스템을 제안한다. 퍼블릭 블록체인은 다양한 펌웨어 제공업자들이 공통된 시스템을 사용하여 펌웨어 배포를 가능하게 해준다. 프라이빗 블록체인은 퍼블릭 블록체인의 트랜잭션 과부하 문제를 해결하며 IoT 기기들의 관리를 용이하게 해준다. 또한 분산 파일 저장소를 사용하여 단실실패점 없이 높은 가용성을 보장한다. 따라서 본 시스템을 사용하면 IoT 기기들의 보안 향상에 매우 효과적일 것으로 예상된다.

국가 연구개발(R&D) 과제 데이터 기반 동적 융합지표에 관한 연구: 생명·보건의료 분야를 중심으로 (Nationally-Funded R&D Projects Data Based Dynamic Convergence Index Development: Focused On Life Science & Public Health Area)

  • 이도연;김근환
    • 한국산업융합학회 논문집
    • /
    • 제25권2_2호
    • /
    • pp.219-232
    • /
    • 2022
  • The aim of this study is to provide the dynamic convergence index that reflected the inherent characteristics of the convergence phenomenon and utilized the nationally-funded R&D projects data, thereby suggesting useful information about the direction of the national convergence R&D strategy. The dynamic convergence index that we suggested was made of two indicators: persistency and diversity. From a time-series perspective, the persistency index, which measures the degree of continuous convergence of multidisciplinary nationally-funded R&D projects, and the diversity index, which measures the degree of binding with heterogeneous research areas. We conducted the empirical experiment with 151,248 convergence R&D projects during the 2015~2021 time period. The results showed that convergence R&D projects in both public health and life sciences appeared the highest degree of persistency. It was presumed that the degree of persistency has increased again due to the COVID-19 pandemic. Meanwhile, the degree of diversity has risen with combining with disciplinary such as materials, chemical engineering, and brain science areas to solve social problems including mental health, depression, and aging. This study not only provides implications for improving the concept and definition of dynamic convergence in terms of persistency and diversity for national convergence R&D strategy but also presented dynamic convergence index and analysis methods that can be practically applied for directing public R&D programs.