• 제목/요약/키워드: Precision-recall

검색결과 706건 처리시간 0.034초

색상분할영역에서 거리히스토그램을 이용한 영상검색 (Image Retrieval Using Distance Histogram of Clustered Color Region)

  • 장정동;이태홍
    • 한국통신학회논문지
    • /
    • 제26권7B호
    • /
    • pp.968-974
    • /
    • 2001
  • 최근 정보통신기술의 발전과 함께 영상매체의 급속한 증가로 영상의 효율적인 관리와 검색의 필요성이 요구되면서 내용기반 영상검색이 핵심기술로 대두되고 있다. 내용기반 영상검색에서 영상의 특징을 표현하기 위해 색상 히스토그램을 많이 사용하고 있으나, 색상만을 고려하는 것은 많은 단점을 지니고 있으므로 본 논문에서는 먼저 순차영역분할(sequential clustering)기법을 도입하여 영역을 분할하며, 분할된 영역의 색상평균값과 영역의 중심점으로부터의 거리 히스토그램을 영상의 특징으로 구하여 이를 비교함으로써 색상과 공간정보를 함께 고려하는 방법을 제안한다. 제안된 방법의 특성의 수가 18개로 타 방법보다 매우 작은 저장공간을 가지면서도 동시에 검색효율이 8.5% 이상 개선되었다. Precision 대 Recall에서도 각 질의영상에서 대부분의 Recall 값에서 제안한 방법의 우수함이 확인되었으며, 시각적으로도 양호한 검색결과를 얻을 수 있었다.

  • PDF

색상-공간정보를 고려한 내용기반 영상검색 (Content-based Image Retrieval Considering Color and Spatial Information)

  • 장정동;이태홍
    • 한국통신학회논문지
    • /
    • 제26권3B호
    • /
    • pp.315-322
    • /
    • 2001
  • 최근 정보통신기술의 발전과 함께 영상매체의 급속한 증자로 영상의 효율적인 관리와 검색을 수행하기 위한 내용기반 영상검색은 핵심기술로 대두되고 있다. 내용기반 영상검색에서 영상의 특징을 표현하기 위해 색상 히스토그램을 많이 사용하고 있으나, 색상만을 고려하는 것은 많은 단점을 지니고 있으므로 본 논문에서는 영상의 특징으로 색상과 공간 정보를 함께 고려하기 위한 순차영역분할(sequential clustering) 기법을 도입하며, 분할된 영역의 색상평균값, 분산값과 영역의 크기를 특성벡터로 제안한다. 제안된 방법의 특성의수가 18개로 타 방법보다 매우 작은 저장공간을 가지면서도 검색효율이 8.8%이상 개선되었다. Precision 대 Recall에서도 각 질의 영상에서 대부분의 Recall 값에서 제안한 방법이 우수함이 확인되었으며, 시각적으로도 양호한 검색결과를 얻을 수 있었다.

  • PDF

Text filtering by Boosting Linear Perceptrons

  • O, Jang-Min;Zhang, Byoung-Tak
    • 한국지능시스템학회논문지
    • /
    • 제10권4호
    • /
    • pp.374-378
    • /
    • 2000
  • in information retrieval, lack of positive examples is a main cause of poor performance. In this case most learning algorithms may not characteristics in the data to low recall. To solve the problem of unbalanced data, we propose a boosting method that uses linear perceptrons as weak learnrs. The perceptrons are trained on local data sets. The proposed algorithm is applied to text filtering problem for which only a small portion of positive examples is available. In the experiment on category crude of the Reuters-21578 document set, the boosting method achieved the recall of 80.8%, which is 37.2% improvement over multilayer with comparable precision.

  • PDF

콘크리트 교량 상태평가를 위한 딥러닝 기반 손상 탐지 프로토타입 개발 (Development of Deep Learning-Based Damage Detection Prototype for Concrete Bridge Condition Evaluation)

  • 남우석;정현준;박경한;김철민;김규선
    • 대한토목학회논문집
    • /
    • 제42권1호
    • /
    • pp.107-116
    • /
    • 2022
  • 최근 안전점검자가 접근성 문제로 점검이 어려운 교량 부재의 상태평가를 위해 영상분석 기반의 시설물 점검 기법연구가 활발히 진행 중이다. 본 논문은 교량을 대상으로 딥러닝 기반 영상정보에 대해서 상태평가 연구를 진행하였고 이에 대한 평가 프로그램(프로토타입)을 개발하였다. 딥러닝 기반 교량 손상탐지 프로토타입을 개발하기 위해 딥러닝 모델 중 손상 검출 및 정량화가 가능한 의미론적 분할 모델인 Mask-RCNN를 적용하였고 학습데이터 6,540장(오픈 데이터 포함)과 손상유형에 적합한 레이블링을 구성하였다. 모델링에 대한 성능검증한 결과, 콘크리트 균열, 박리/박락, 철근노출과 도장 박리에 대한 정밀도(precision)는 95.2 %, 재현율(recall)은 93.8 % 나타내었다. 또한, 교량 콘크리트 부재 손상율을 이용하여 콘크리트 균열 실 데이터를 2차 성능검증 하였다.

An effective automated ontology construction based on the agriculture domain

  • Deepa, Rajendran;Vigneshwari, Srinivasan
    • ETRI Journal
    • /
    • 제44권4호
    • /
    • pp.573-587
    • /
    • 2022
  • The agricultural sector is completely different from other sectors since it completely relies on various natural and climatic factors. Climate changes have many effects, including lack of annual rainfall and pests, heat waves, changes in sea level, and global ozone/atmospheric CO2 fluctuation, on land and agriculture in similar ways. Climate change also affects the environment. Based on these factors, farmers chose their crops to increase productivity in their fields. Many existing agricultural ontologies are either domain-specific or have been created with minimal vocabulary and no proper evaluation framework has been implemented. A new agricultural ontology focused on subdomains is designed to assist farmers using Jaccard relative extractor (JRE) and Naïve Bayes algorithm. The JRE is used to find the similarity between two sentences and words in the agricultural documents and the relationship between two terms is identified via the Naïve Bayes algorithm. In the proposed method, the preprocessing of data is carried out through natural language processing techniques and the tags whose dimensions are reduced are subjected to rule-based formal concept analysis and mapping. The subdomain ontologies of weather, pest, and soil are built separately, and the overall agricultural ontology are built around them. The gold standard for the lexical layer is used to evaluate the proposed technique, and its performance is analyzed by comparing it with different state-of-the-art systems. Precision, recall, F-measure, Matthews correlation coefficient, receiver operating characteristic curve area, and precision-recall curve area are the performance metrics used to analyze the performance. The proposed methodology gives a precision score of 94.40% when compared with the decision tree(83.94%) and K-nearest neighbor algorithm(86.89%) for agricultural ontology construction.

머신러닝 CatBoost 다중 분류 알고리즘을 이용한 조류 발생 예측 모형 성능 평가 연구 (Evaluation of Multi-classification Model Performance for Algal Bloom Prediction Using CatBoost)

  • 김준오;박정수
    • 한국물환경학회지
    • /
    • 제39권1호
    • /
    • pp.1-8
    • /
    • 2023
  • Monitoring and prediction of water quality are essential for effective river pollution prevention and water quality management. In this study, a multi-classification model was developed to predict chlorophyll-a (Chl-a) level in rivers. A model was developed using CatBoost, a novel ensemble machine learning algorithm. The model was developed using hourly field monitoring data collected from January 1 to December 31, 2015. For model development, chl-a was classified into class 1 (Chl-a≤10 ㎍/L), class 2 (10<Chl-a≤50 ㎍/L), and class 3 (Chl-a>50 ㎍/L), where the number of data used for the model training were 27,192, 11,031, and 511, respectively. The macro averages of precision, recall, and F1-score for the three classes were 0.58, 0.58, and 0.58, respectively, while the weighted averages were 0.89, 0.90, and 0.89, for precision, recall, and F1-score, respectively. The model showed relatively poor performance for class 3 where the number of observations was much smaller compared to the other two classes. The imbalance of data distribution among the three classes was resolved by using the synthetic minority over-sampling technique (SMOTE) algorithm, where the number of data used for model training was evenly distributed as 26,868 for each class. The model performance was improved with the macro averages of precision, rcall, and F1-score of the three classes as 0.58, 0.70, and 0.59, respectively, while the weighted averages were 0.88, 0.84, and 0.86 after SMOTE application.

빈도법과 회상법에 의한 영양소 섭취 평가의 차이 (Differences in Nutrient Intakes Analysed by Using Food Frequency and Recall Method)

  • 김영옥
    • 한국식품영양과학회지
    • /
    • 제24권6호
    • /
    • pp.887-891
    • /
    • 1995
  • 회상법과 빈도법을 이용하여 식이섭취조사를 할 경우 영양소에 따라 다소 차이는 있으나 일반적으로 모든 영양소에서 빈도법이 회상법 보다 개인의 섭취량이 과다하게 평가되는 경향을 보이고 있으며 영양소별 측정 오차가 식이조사 방법에 따라 가장 큰 차이를 보였던 영양소는 carotene이었고 이 영양소는 두 방법에 의해 추정된 값 사이에 통계적으로 유의있는 상관을 보이지 않고 있다. 그러므로 본 연구 결과는 연구 목적이 되는 영양소의 종류에 따라 식이조사 방법으로 히상법과 빈도법을 교차 선택할 수 있는영양소와 그렇지 않은 영양소가 있음을 시사하고 있다. 그러나, 본 연구는 각 방법이 지니는 상대적 타당성(validity)를 측정하는데 필요한 표준가치(reference value)가 없으므로 타당성을 측정할 수 없었고 단지 두 방법간의 차이만을 비교하는데 그치는 제한점이 있었다. 그러므로 사용된 방법의 타당성 측정을 위해서는 표준값을 제공할 수 있는 객관적인 방법인 실측법(precise weights method) 등이 비록 적은 표본 규모라도 진행될 필요성이 있다. 한편, 더 나아가 조사방법의 신뢰도 측정을 위해서는 정확성(precision)을 보기 위해 한 방법을 여러번 반복 조사하여야 방법의 정확성 등이 검토될 수 있겠다. 이러한 기초연구를 위한 많은 투자와 노력이 있어야만 역학조사에서 이용된 식이조사 방법의 신뢰성 확보가 가능함을 본 연구결과는 시사하고 있다.

  • PDF

변화탐지와 회상 과제에 기초한 시각작업기억의 통합적 객체 표상 검증 (Integrated Object Representations in Visual Working Memory Examined by Change Detection and Recall Task Performance)

  • 이인애;현주석
    • 인지과학
    • /
    • 제35권1호
    • /
    • pp.1-21
    • /
    • 2024
  • 본 연구는 두 가지 이론적 모델인 통합된 객체 모형과 특장 병렬-독립 저장 모형을 검증함으로써 시각작업기억 표상의 특성을 조사하였다. 실험 I에서 참가자들은 색상 사각형, 방위 막대 또는 두 가지 모두로 구성된 배열을 기억한 뒤 이를 토대로 변화탐지과제를 수행했다. 단일 특징 조건에서 기억배열은 하나의 특징(방위 또는 색상)으로만 구성된 반면, 두 가지 특징 조건은 둘 모두를 포함했다. 두 조건간 변화탐지 수행의 차이는 없었으며 이는 병렬-독립 저장 모형보다는 통합된 객체 모형을 지지한다. 실험 II에서는 이등변삼각형의 방위, 색상 사각형 또는 두 특징 모두로 구성된 기억배열을 대상으로 회상과제가 실시되었으며, 단일 특징과 두 가지 특징 조건 간 회상 수행이 비교되었다. 두 조건 간 회상 정확도에는 차이가 없었으나 표상 선명도와 추측반응에 대한 분석 결과는 강한 객체 모형보다는 약한 객체 모형을 시사했다. 본 연구의 결과는 시각작업기억의 표상 특성을 둘러싼 현시점의 논쟁에 있어서 병렬-독립 저장 모형이 아닌 통합된 객체 모형의 우세를 지지한다.

온톨로지 기반의 사용자 의도를 고려한 맞춤형 검색 서비스 (Ontology-based User Customized Search Service Considering User Intention)

  • 김수경;김건우
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.129-143
    • /
    • 2012
  • 웹 기술의 급속한 발전은 기업들이 관리해야 하는 정보량의 폭발적인 증가를 초래하였다. 이와 더불어 보다 정확한 정보를 찾기 위한 검색 엔진 솔루션 시장의 규모도 더불어 크게 증가하였다. 하지만 대부분의 검색엔진들은 사용자의 검색 의도를 고려하지 않고 사용자가 입력한 특정 키워드를 포함하는 문서들을 반환하는 방법을 채택하고 있어, 실제 사용자가 원하는 정보를 찾는데 까지는 부가적인 시간과 노력이 요구된다. 본 연구에서는 이러한 문제를 해결 하기 위한 중요 기술인 적합성을 만족시키기 위해 재현율과 정확율을 높일 수 있는 방법을 제안하였다. 우선 검색어의 재현율을 높일 수 있도록 유사어 관계 확장을 위한 온톨로지 스키마 모델을 제안하고 이를 기반으로 한 추론을 통해 검색어의 확장을 제시하였다. 확장된 검색어들을 이용하여 문서 검색을 하기 위한 다단계 유사도 검색 순위화 알고리즘을 제안하였다. 설계된 온톨로지 스키마와 온톨로지 저장소의 데이터를 기반으로 추론과 유사도 검색 순위화 엔진이 포함된 웹사이트 형식의 사용자 의도 적응형 검색 솔루션을 구현하였다. 구현된 검색 솔루션을 통해 다양한 검색어를 입력하여 제안 방법의 타당성을 입증하였고 사용자 의도를 고려한 맞춤형 검색 솔루션의 필요성을 설명하였다.

LSI 기법을 이용한 전자상거래 추천자 시스템의 시뮬레이션 분석 (Simulation Study on E-commerce Recommender System by Use of LSI Method)

  • 권치명
    • 한국시뮬레이션학회논문지
    • /
    • 제15권3호
    • /
    • pp.23-30
    • /
    • 2006
  • 추천자 시스템은 전자상거래 사이트에서 고객의 상품 구매 정보를 수집하여 고객에 대한 예상 구매 상품을 추천하는 목적으로 개발되었다. 본 연구는 대형 전자상거래 사이트에서 고객의 상품 구매 이력이 활용 가능한 경우에 전통적인 통계기법인 군집분석 및 고객 간의 상품 구매 상관성을 이용하는 기존 추천자 시스템(협력적 필터링 기법)과 문서 검색에서 사용되는 LSI분석에 기반한 협업 필터링 기법을 상품 추천에 적용하여 각 기법의 상품 추천 효율성을 비교 분석하였다. 문서-용어 행렬과 유사한 구조를 가지는 고객-상품 구매 행렬에 문서 검색에 사용되는 LSI 분석법은 고객의 상품구매 경향을 원 상품 수보다 축소된 차원의 변환 상품을 통하여 파악함으로써 목표고객에 대한 인접고객군의 생성 노력을 현저히 감소시킬 수 있어 결과적으로 실시간으로 적용되는 추천자 알고리즘의 효율성을 개선할 수 있을 것으로 기대할 수 있다. 가상적인 고객-상품 구매 리스트를 대상으로 실행한 시뮬레이션 실험 결과에서도 알고리즘의 효율성 평가측도인 recall과 정확도 및 F1에서 LSI 기반 협력적 필터링 기법이 기존의 방법보다 우수한 결과를 나타내었다. 시뮬레이션 결과, 인접고객 군의 크기가 일정한 수준에 이르면 그 크기를 증가시키더라도 알고리즘의 효율성은 별로 개선되지 않으며 또한 추천 상품 수가 일정 수준에 도달하면 추천 정확도가 낮아지는 정도에 비해 recall의 개선도는 별 변화가 없는 것으로 나타나고 있다. 추천자 시스템을 구현하는 용도에 따라 이러한 정보는 유용하게 사용될 수 있다고 판단된다.

  • PDF