• 제목/요약/키워드: Classification Accuracy Test

검색결과 393건 처리시간 0.029초

히스토그램의 최적 높이의 폭에 기반한 3차원 필름 영상 검사 (3D Film Image Inspection Based on the Width of Optimized Height of Histogram)

  • 이재은;김종남
    • 융합신호처리학회논문지
    • /
    • 제23권2호
    • /
    • pp.107-114
    • /
    • 2022
  • 3차원 필름 영상을 양품 또는 불량품으로 분류하기 위해서는 필름의 영상 내 무늬를 검출해야 한다. 하지만 만약 필름 내 화소의 명암이 낮다면 영상 내 무늬가 선명하지 않아서 분류하기가 쉽지 않다. 본 논문에서는 3D 필름 영상들의 히스토그램을 구한 후, 각 히스토그램의 특정 빈도에서의 폭을 비교하여 정품과 불량품으로 분류하는 방법을 제안한다. 실험을 통하여 정품과 불량품의 히스토그램이 뚜렷하게 다르다는 것을 보였으며, 이러한 특징을 반영한 제안 알고리즘을 이용하여 히스토그램의 특정 빈도에서 모든 3D 필름 영상들이 정확하게 분류되는 것을 보였다. 기존에 연구된 방법들인 차영상, 오츠의 이진화 알고리즘, 캐니 엣지, 모폴로지 지오데식 엑티브 컨투어, 그리고 서포트 벡터 머신과의 성능 비교를 통하여 제안한 알고리즘의 성능이 가장 우수함을 검증하였으며, 영상 내 무늬를 검출할 필요 없이도 우수한 분류 정확도를 얻을 수 있다는 것을 보였다.

항공 라이다 데이터를 이용한 건물 모델링의 자동화 (Automation of Building Extraction and Modeling Using Airborne LiDAR Data)

  • 임새봄;김정현;이동천
    • 한국측량학회지
    • /
    • 제27권5호
    • /
    • pp.619-628
    • /
    • 2009
  • LiDAR는 광범위한 지역의 지형 지물 및 지표면에 대한 3차원 좌표를 신속하게 획득할 수 있는 장비로 고정밀의 3차원 공간데이터를 제공하는 장점이 있다. 그러나 LiDAR 데이터는 불규칙한 3차원 점 데이터로 구성되어 있으므로, 의미적이고 시각적인 정보를 제공하지 않으며, LiDAR 데이터만을 사용하여 정보를 추출하는 것은 어렵다. 본 연구에서는 항공 LiDAR 데이터로부터 건물의 외곽선 자동 추출 및 3차원 상세 모델링을 위한 방법을 제안하였다. 전처리 과정으로 반복적 평면 fiitting을 통하여 노이즈 및 불필요한 데이터를 제거하고, 히스토그램 분석을 수행하여 지면과 비지면 데이터를 효과적으로 분리하였다. 건물 외곽선을 추출하기 위해서 객체추적 기법을 이용하여 건물의 외곽에 해당하는 LiDAR 점들을 분류하였으며, 선행과정을 통해 LiDAR 데이터로부터 최종적으로 건물의 외곽선을 추출하였다. 정확도 검증을 위해 추출된 건물의 외곽선을 1:1,000 수치지도와 비교한 결과, 실험지역의 평면 RMSE가 약 0.56m였다. 또한, 건물의 상부구조물의 형태를 재현하기 위한 특성정보 추출 방법을 제안하였다. 지붕면을 세부적으로 분할하고 모델링하기 위하여 통계적 및 기하적 특성정보를 이용하였으며, 각각의 상부구조물에 적합한 수학적 함수를 최소제곱법에 의해 결정함으로써 3차원 모델링이 가능하도록 하였다. 상부구조물 모델링 결과 각 형태에 따른 RMSE가 사각형 상부구조물은 0.91m, 삼각형 상부구조물은 1.43m, 아치형 상부구조물은 1.85m, 돔형 상부구조물이 1.97m였다. 이는 원시 LiDAR 데이터로부터 지붕면 분할 및 3차원 자동 모델링이 효과적으로 수행되었음을 보여주고 있다.

Diagnosis of Residual Tumors after Unplanned Excision of Soft-Tissue Sarcomas: Conventional MRI Features and Added Value of Diffusion-Weighted Imaging

  • Jin, Kiok;Lee, Min Hee;Yoon, Min A;Kim, Hwa Jung;Kim, Wanlim;Chee, Choong Geun;Chung, Hye Won;Lee, Sang Hoon;Shin, Myung Jin
    • Investigative Magnetic Resonance Imaging
    • /
    • 제26권1호
    • /
    • pp.20-31
    • /
    • 2022
  • Purpose: To assess conventional MRI features associated with residual soft-tissue sarcomas following unplanned excision (UPE), and to compare the diagnostic performance of conventional MRI only with that of MRI including diffusion-weighted imaging (DWI) for residual tumors after UPE. Materials and Methods: We included 103 consecutive patients who had received UPE of a soft-tissue sarcoma with wide excision of the tumor bed between December 2013 and December 2019 and who also underwent conventional MRI and DWI in this retrospective study. The presence of focal enhancement, soft-tissue edema, fascial enhancement, fluid collections, and hematoma on MRI including DWI was reviewed by two musculoskeletal radiologists. We used classification and regression tree (CART) analysis to identify the most significant MRI features. We compared the diagnostic performances of conventional MRI and added DWI using the McNemar test. Results: Residual tumors were present in 69 (66.9%) of 103 patients, whereas no tumors were found in 34 (33.1%) patients. CART showed focal enhancement to be the most significant predictor of residual tumors and correctly predicted residual tumors in 81.6% (84/103) and 78.6% (81/103) of patients for Reader 1 and Reader 2, respectively. Compared with conventional MRI only, the addition of DWI for Reader 1 improved specificity (32.8% vs. 56%, 33.3% vs. 63.0%, P < 0.05), decreased sensitivity (96.8% vs. 84.1%, 98.7% vs. 76.7%, P < 0.05), without a difference in diagnostic accuracy (76.7% vs. 74.8%, 72.9% vs. 71.4%) in total and in subgroups. For Reader 2, diagnostic performance was not significantly different between the sets of MRI (P > 0.05). Conclusion: After UPE of a soft-tissue sarcoma, the presence or absence of a focal enhancement was the most significant MRI finding predicting residual tumors. MRI provided good diagnostic accuracy for detecting residual tumors, and the addition of DWI to conventional MRI may increase specificity.

초분광 이미지를 이용한 배나무 화상병에 대한 최적 분광 밴드 선정 (Spectral Band Selection for Detecting Fire Blight Disease in Pear Trees by Narrowband Hyperspectral Imagery)

  • 강예성;박준우;장시형;송혜영;강경석;유찬석;김성헌;전새롬;강태환;김국환
    • 한국농림기상학회지
    • /
    • 제23권1호
    • /
    • pp.15-33
    • /
    • 2021
  • 화상병이란 erwinia amylovora라는 강한 전염성을 보유하고 있어 감염 시 1년 내에 과수를 고사시키며 그 중심으로 반경 500m이내에 과수 재배를 불가능하게 만드는 세균성 바이러스이다. 이 화상병은 과수의 잎과 가지를 진한 갈색 또는 검은색으로 변색시키기 때문에 분광학적으로 검출이 가능하다고 판단되며 이는 다중분광센서를 탑재한 무인기를 이용하는 것이 효율적이다. 그러나 다중분광센서는 적은 중심 파장과 함께 넓은 반치전폭(FWHM)을 가지고 있어 화상병에 가장 민감하게 반응하는 파장 대역을 파악하기 어렵다. 그렇기 때문에, 본 논문에서는 화상병에 감염된 잎과 가지와 비감염된 잎과 가지의 초분광 이미지를 5 nm FWHM으로 취득한 후 각각 10 nm, 25 nm, 50 nm와 80 nm FWHM로 평준화한 후 샘플을 7:3, 5:5와 3:7의 비율로 훈련데이터와 검증데이터로 나누어 의사결정트리 기법으로 최적의 파장을 선정하고 overall accuracy (OA)와 kappa coefficient (KC)를 이용한 분류 정확도 평가를 통해 배나무 화상병 검출가능성을 확인하였다. 화상병에 감염 및 비감염된 잎과 가지의 초분광 반사율을 비교한 결과, green, red edge 및 NIR 영역에서 차이가 두드러지게 나타났으며 첫 번째 분류 노드로 선택된 파장 영역은 대체로 750 nm와 800 nm였다. 잎과 가지 영역의 영상데이터를 의사결정트리 기법을 이용하여 분류정확도를 종합적으로 비교한 결과, 50nm FWHM 인 4개 대역(450, 650, 750, 950nm)은 10nm FWHM인 8개 대역(440, 580, 660, 680, 680, 710, 730, 740nm)의 분류 정확도 차이가 OA에서 1.8%와 KC에서 4.1%로 나타나 더 낮은 비용의 밴드패스필터인 50nm FWHM을 이용하는 것이 더 유리하다고 판단된다. 또한 기존의 50nm FWHM 파장대역들에 25nm FWHM파장대역들(550, 800nm)을 추가하는 것을 통해 화상병 검출뿐만 아니라 농업에서 다양한 역할을 수행할 수 있는 다중분광센서를 개발할 수 있다고 판단된다.

사상체질진단검사(QSCC II) 설문지 간소화 연구 (A Study on the Simplification of Questionnaire for Sasang Constitution Classification(QSCC II))

  • 박지원;김정아;왕명자
    • 지역사회간호학회지
    • /
    • 제14권2호
    • /
    • pp.334-350
    • /
    • 2003
  • The purpose of this descriptive study was to evaluate the clinical validity of QSCCII (Questionnaire for the Sasang Constitution Classification), whose high accuracy as a constitutional diagnostic tool has been recognized by medical professionals. The subjects of this study were 568 clients from an A university hospital in Suwon. Of the subjects, 259 were health center visitors and 292 were ambulatory clinic visitors. Data were collected using self-reported questionnaire and were analyzed by $X^2$-test and one-way ANOVA. The results of this study as follows: 1. In 4 types of constitution, Soeumin type was found in 41.5% of the subjects. Taeumin type in 39.2%.,and Soyangin type in 19.2%, respectively. There was no Tayangin type found in this study. There were no significant differences on types of constitution by demographic characteristics such as age, sex, marital status, education, religion, and economic status. 2. As for 15 item-selective questionnaire, there were statistically significant differences on the response rate of the 12 items, except items such as A4, A11 and A14, by the types of constitution. When the subjects' own criteria on their constitution were compared to the given constitutional criteria on each item, 4 items such as A6, A11, A13 and A14 were advisable to be excluded from the questionnaire or to be reunited to the other criteria. In the meanwhile, 3 items such as A7, A18 and A15 were desirable to be re-categorized to the other constitutional types and reconstructed to the QSCC II questionnaire. 3. In terms of 106 true-false questionnaire, there were statistically significant differences on the response rate of 46 items by the types of constitution. The 46 items include 15 items (32.6%) of the domain of 'handling something/strength and weakness', 4 items (8.7%) of the domain of 'interpersonal relationship', 9 items (19.6%) of the domain of 'state of mind at ordinary times', 2 items (4.3%) of the domain of 'distinctive emotional characteristics' area, 11 items (23.9%) of the domain of 'specific behavioral trait' and 5 items (10.9%) of the domain of 'physical characteristics'. Therefore, the areas of 'handling something/strength and weakness' and' specific behavioral trait' mainly contributed to the classification of constitutional type. 4. When the 106 true-false items were simplified to the 46 items, statistically significant differences were found on the rate of items allocated to the 3 types of constitution. The rate of selection assigned to the 3 constitutional types of the simplified 46-item questionnaire was higher than that of the original 106-item questionnaire. Conclusions; It was concluded that the rate of selection of each lay person about his own constitutional type would be still higher even though the simplified items of QSCC II questionnaire were applied. If more replicated studies are conducted on the diverse population using the simplifying QSCC II questionnaire in the future, a more simplified standardized Sasang Constitution Questionnaire that is available to the public rather than to medical staffs in the clinical settings could be developed. Moreover, the simplified scale will help nurses deliver more efficient nursing care by providing a more rapid way of health assessment.

  • PDF

카테고리 중립 단어 활용을 통한 주가 예측 방안: 텍스트 마이닝 활용 (Stock Price Prediction by Utilizing Category Neutral Terms: Text Mining Approach)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.123-138
    • /
    • 2017
  • 주식 시장은 거래자들의 기업과 시황에 대한 기대가 반영되어 움직이기에, 다양한 원천의 텍스트 데이터 분석을 통해 주가 움직임을 예측하려는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 것이기에 단순히 주가의 등락 뿐만이 아니라, 뉴스 기사나 소셜 미디어의 반응에 따라 거래를 하고 이에 따른 수익률을 분석하는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 연구들도 다른 분야의 텍스트 마이닝 접근 방안과 동일하게 단어-문서 매트릭스를 구성하여 분류 알고리즘에 적용하여 왔다. 문서에 많은 단어들이 포함되어 있기 때문에 모든 단어를 가지고 단어-문서 매트릭스를 만드는 것보다는 단어가 문서를 범주로 분류할 때 기여도가 높은 단어들을 선정하여야 한다. 단어의 빈도를 고려하여 너무 적은 등장 빈도나 중요도를 보이는 단어는 제거하게 된다. 단어가 문서를 정확하게 분류하는 데 기여하는 정도를 측정하여 기여도에 따라 사용할 단어를 선정하기도 한다. 단어-문서 매트릭스를 구성하는 기본적인 방안인 분석의 대상이 되는 모든 문서를 수집하여 분류에 영향력을 미치는 단어를 선정하여 사용하는 것이었다. 본 연구에서는 개별 종목에 대한 문서를 분석하여 종목별 등락에 모두 포함되는 단어를 중립 단어로 선정한다. 선정된 중립 단어 주변에 등장하는 단어들을 추출하여 단어-문서 매트릭스 생성에 활용한다. 중립 단어 자체는 주가 움직임과 연관관계가 적고, 중립 단어의 주변 단어가 주가 상승에 더 영향을 미칠 것이라는 생각에서 출발한다. 생성된 단어-문서 매트릭스를 가지고 주가의 등락 여부를 분류하는 알고리즘에 적용하게 된다. 본 연구에서는 종목 별로 중립 단어를 1차 선정하고, 선정된 단어 중에서 다른 종목에도 많이 포함되는 단어는 추가적으로 제외하는 방안을 활용하였다. 온라인 뉴스 포털을 통해 시가 총액 상위 10개 종목에 대한 4개월 간의 뉴스 기사를 수집하였다. 3개월간의 뉴스 기사를 학습 데이터로 분류 모형을 수립하였으며, 남은 1개월간의 뉴스 기사를 모형에 적용하여 다음 날의 주가 움직임을 예측하였다. 본 연구에서 제안하는 중립 단어 활용 알고리즘이 희소성에 기반한 단어 선정 방안에 비해 우수한 분류 성과를 보였다.

개선된 배깅 앙상블을 활용한 기업부도예측 (Bankruptcy prediction using an improved bagging ensemble)

  • 민성환
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.121-139
    • /
    • 2014
  • 기업의 부도 예측은 재무 및 회계 분야에서 매우 중요한 연구 주제이다. 기업의 부도로 인해 발생하는 비용이 매우 크기 때문에 부도 예측의 정확성은 금융기관으로서는 매우 중요한 일이다. 최근에는 여러 개의 모형을 결합하는 앙상블 모형을 부도 예측에 적용해 보려는 연구가 큰 관심을 끌고 있다. 앙상블 모형은 개별 모형보다 더 좋은 성과를 내기 위해 여러 개의 분류기를 결합하는 것이다. 이와 같은 앙상블 분류기는 분류기의 일반화 성능을 개선하는 데 매우 유용한 것으로 알려져 있다. 본 논문은 부도 예측 모형의 성과 개선에 관한 연구이다. 이를 위해 사례 선택(Instance Selection)을 활용한 배깅(Bagging) 모형을 제안하였다. 사례 선택은 원 데이터에서 가장 대표성 있고 관련성 높은 데이터를 선택하고 예측 모형에 악영향을 줄 수 있는 불필요한 데이터를 제거하는 것으로 이를 통해 예측 성과 개선도 기대할 수 있다. 배깅은 학습데이터에 변화를 줌으로써 기저 분류기들을 다양화시키는 앙상블 기법으로 단순하면서도 성과가 매우 좋은 것으로 알려져 있다. 사례 선택과 배깅은 각각 모형의 성과를 개선시킬 수 있는 잠재력이 있지만 이들 두 기법의 결합에 관한 연구는 아직까지 없는 것이 현실이다. 본 연구에서는 부도 예측 모형의 성과를 개선하기 위해 사례 선택과 배깅을 연결하는 새로운 모형을 제안하였다. 최적의 사례 선택을 위해 유전자 알고리즘이 사용되었으며, 이를 통해 최적의 사례 선택 조합을 찾고 이 결과를 배깅 앙상블 모형에 전달하여 새로운 형태의 배깅 앙상블 모형을 구성하게 된다. 본 연구에서 제안한 새로운 앙상블 모형의 성과를 검증하기 위해 ROC 커브, AUC, 예측정확도 등과 같은 성과지표를 사용해 다양한 모형과 비교 분석해 보았다. 실제 기업데이터를 사용해 실험한 결과 본 논문에서 제안한 새로운 형태의 모형이 가장 좋은 성과를 보임을 알 수 있었다.

증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용한 공모주의 상장 이후 주가 등락 예측 (The prediction of the stock price movement after IPO using machine learning and text analysis based on TF-IDF)

  • 양수연;이채록;원종관;홍태호
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.237-262
    • /
    • 2022
  • 본 연구는 개인투자자들의 투자의사결정에 도움을 주고자, 증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용해 공모주의 상장 5거래일 이후 주식 가격 등락을 예측하는 모델을 제시한다. 연구 표본은 2009년 6월부터 2020년 12월 사이에 신규 상장된 691개의 국내 IPO 종목이다. 기업, 공모, 시장과 관련된 다양한 재무적 및 비재무적 IPO 관련 변수와 증권신고서의 어조를 분석하여 예측했고, 증권신고서의 어조 분석을 위해서 TF-IDF (Term Frequency - Inverse Document Frequency)에 기반한 텍스트 분석을 이용해 신고서의 투자위험요소란의 텍스트를 긍정적 어조, 중립적 어조, 부정적 어조로 분류하였다. 가격 등락 예측에는 로지스틱 회귀분석(Logistic Regression), 랜덤 포레스트(Random Forest), 서포트벡터머신(Support Vector Machine), 인공신경망(Artificial Neural Network) 기법을 사용하였고, 예측 결과 IPO 관련 변수와 증권신고서 어조 변수를 함께 사용한 모델이 IPO 관련 변수만을 사용한 모델보다 높은 예측 정확도를 보였다. 랜덤 포레스트 모형은 1.45%p 높아진 예측 정확도를 보였으며, 인공신공망 모형과 서포트벡터머신 모형은 각각 4.34%p, 5.07%p 향상을 보였다. 추가적으로 모형간 차이를 맥니마 검정을 통해 통계적으로 검증한 결과, 어조 변수의 유무에 따른 예측 모형의 성과 차이가 유의확률 1% 수준에서 유의했다. 이를 통해, 증권신고서에 표현된 어조가 공모주의 가격 등락 예측에 영향을 미치는 요인이라는 것을 확인할 수 있었다.

비지도학습 오토 엔코더를 활용한 네트워크 이상 검출 기술 (Network Anomaly Detection Technologies Using Unsupervised Learning AutoEncoders)

  • 강구홍
    • 정보보호학회논문지
    • /
    • 제30권4호
    • /
    • pp.617-629
    • /
    • 2020
  • 인터넷 컴퓨팅 환경의 변화, 새로운 서비스 출현, 그리고 지능화되어 가는 해커들의 다양한 공격으로 인한 규칙 기반 침입탐지시스템의 한계점을 극복하기 위해 기계학습 및 딥러닝 기술을 활용한 네트워크 이상 검출(NAD: Network Anomaly Detection)에 대한 관심이 집중되고 있다. NAD를 위한 대부분의 기존 기계학습 및 딥러닝 기술은 '정상'과 '공격'으로 레이블링된 훈련용 데이터 셋을 학습하는 지도학습 방법을 사용한다. 본 논문에서는 공격의 징후가 없는 일상의 네트워크에서 수집할 수 있는 레이블링이 필요 없는 데이터 셋을 이용하는 비지도학습 오토 엔코더(AE: AutoEncoder)를 활용한 NAD 적용 가능성을 제시한다. AE 성능을 검증하기 위해 NSL-KDD 훈련 및 시험 데이터 셋을 사용해 정확도, 정밀도, 재현율, f1-점수, 그리고 ROC AUC (Receiver Operating Characteristic Area Under Curve) 값을 보인다. 특히 이들 성능지표를 대상으로 AE의 층수, 규제 강도, 그리고 디노이징 효과 등을 분석하여 레퍼런스 모델을 제시하였다. AE의 훈련 데이터 셋에 대한 재생오류 82-th 백분위수를 기준 값으로 KDDTest+와 KDDTest-21 시험 데이터 셋에 대해 90.4%와 89% f1-점수를 각각 보였다.

Gaofen-1 WFV 영상을 이용한 딥러닝 기반 대형 부유조류 분류 (Deep Learning Based Floating Macroalgae Classification Using Gaofen-1 WFV Images)

  • 김의현;김근용;김수미;;유주형
    • 대한원격탐사학회지
    • /
    • 제36권2_2호
    • /
    • pp.293-307
    • /
    • 2020
  • 매년 황해와 동중국해에서는 대형 부유조류인 녹조와 갈조가 대량으로 발생하고 있다. 이러한 대형 부유조류는 연안의 양식 시설물이나 해변으로 유입되며, 제거하는데 막대한 경제적 손실을 발생시킨다. 현재는 연안으로 유입되는 대형 부유조류를 탐지하기 위해 원격탐사 방법이 활발하게 사용되고 있다. 그러나 대형 부유조류는 해양의 다양한 대상들과 중첩되는 파장이 존재하기에 이를 정확하게 탐지하는데 한계가 있다. 더욱이 녹조와 갈조는 유사한 스펙트럼 특성을 보이기 때문에 원격탐사 자료를 이용한 구분을 더욱 어렵게 만든다. 따라서 본 연구에서는 위성 영상에 딥러닝 기법을 적용하여 녹조와 갈조를 효과적으로 구분하고자 하였다. 이를 위한 네트워크를 결정하기 위해 최적의 학습 조건을 찾아 AlexNet 신경망을 전이 학습하였으며, 학습과 검증을 위해 Gaofen-1 WFV 영상을 이용하여 데이터셋을 구성하였다. 최적의 학습 조건으로 학습된 네트워크를 이용하여 실험 데이터에 대한 결과를 확인하였다. 그 결과 실험 데이터에 대한 정확도는 88.89%를 보였으며, 녹조와 갈조에 대해 각각 66.67%와 100%의 정밀도로 구분이 가능하였다. 이는 전이 학습된 AlexNet 신경망이 녹조와 갈조의 미세한 차이를 구분할 수 있는 것으로 해석된다. 본 연구를 통해 해양의 다양한 대상으로부터 녹조와 갈조를 효과적으로 분류하고 각각 구분할 수 있을 것으로 기대된다.