• Title/Summary/Keyword: 유사 척도

검색결과 525건 처리시간 0.027초

위키피디아를 이용한 분류자질 선정에 관한 연구 (An Experimental Study on Feature Selection Using Wikipedia for Text Categorization)

  • 김용환;정영미
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.155-171
    • /
    • 2012
  • 텍스트 범주화에 있어서 일반적인 문제는 문헌을 표현하는 핵심적인 용어라도 학습문헌 집합에 나타나지 않으면 이 용어는 분류자질로 선정되지 않는다는 것과 형태가 다른 동의어들은 서로 다른 자질로 사용된다는 점이다. 이 연구에서는 위키피디아를 활용하여 문헌에 나타나는 동의어들을 하나의 분류자질로 변환하고, 학습문헌 집합에 출현하지 않은 입력문헌의 용어를 가장 유사한 학습문헌의 용어로 대체함으로써 범주화 성능을 향상시키고자 하였다. 분류자질 선정 실험에서는 (1) 비학습용어 추출 시 범주 정보의 사용여부, (2) 용어의 유사도 측정 방법(위키피디아 문서의 제목과 본문, 카테고리 정보, 링크 정보), (3) 유사도 척도(단순 공기빈도, 정규화된 공기빈도) 등 세 가지 조건을 결합하여 실험을 수행하였다. 비학습용어를 유사도 임계치 이상의 최고 유사도를 갖는 학습용어로 대체하여 kNN 분류기로 분류할 경우 모든 조건 결합에서 범주화 성능이 0.35%~1.85% 향상되었다. 실험 결과 범주화 성능이 크게 향상되지는 못하였지만 위키피디아를 활용하여 분류자질을 선정하는 방법이 효과적인 것으로 확인되었다.

메모리 기반 협력필터링을 위한 평가 등급 범위를 이용한 유사도 척도 (A Similarity Measure Using Rating Ranges for Memory-based Collaborative Filtering)

  • 이수정
    • 정보교육학회논문지
    • /
    • 제17권4호
    • /
    • pp.375-382
    • /
    • 2013
  • 협력 필터링은 사용자가 선호했던 항목들의 기록을 토대로 항목을 추천하는 방법으로서 상업 사이트에서 매우 널리 사용되어 왔다. 이 방식의 기본 개념은 유사한 사용자들을 찾아서 그들의 평가등급을 통합하여 새로운 항목 추천에 이용하는 것이다. 따라서 유사도의 정확한 측정은 추천 성능에 매우 중요한 일이다. 본 논문에서는 사용자가 과거에 부여했던 평가등급들을 기준으로 하여 상대적으로 각 평가치를 다루는 새로운 유사도 공식을 제안한다. 광범위한 실험을 통해 제안된 공식이 기존 공식들보다 더 신뢰할 수 있음을 밝혔는데, 이는 극단적인 유사도값의 발생이 현저히 감소하였고, 유사도가 큰 이웃들만을 참조하였을 때 성능이 개선되었기 때문이다. 특히 실험 결과, 제안 공식은 평가 범위가 큰 데이터셋에 대해 기존 공식들보다 우수한 성능을 나타냈다.

Underutilization 문제를 해결한 퍼지 신경회로망 모델 (A Fuzzy Neural Network Model Solving the Underutilization Problem)

  • 김용수;함창현;백용선
    • 한국지능시스템학회논문지
    • /
    • 제11권4호
    • /
    • pp.354-358
    • /
    • 2001
  • 본 논문에서는 underutilization 문제를 해결한 퍼지 신경회로망 모델을 제시한다. 이 퍼지 신경 회로망은 ART-1 신경회로망과 유사한 제어 구조를 가지고 있어 유연성이 있으면서도 안정성이 있다. 또한 연결강도의 초기화가 필요 없고 ART-1 신경회로망에 비하여 잡음에 민감하지 않다. 이 퍼지 신경회로망의 학습법칙은 코호넨의 학습법칙을 변형하고 퍼지화 하였으며 누설 경쟁학습의 퍼지화와 조건 확률의 퍼지화에 기반을 두고 있다. 출력 뉴런 중에서 승자를 정한 후에 행해지는 점검 테스트에서는 유사척도로 상대적 거리를 사용하였다. 이 상대적 거리는 유클리디안 거리와 함께 데이터와 클러스터들의 대푯값들 간의 상대적인 위치를 고려한 것이다. 본 논문에서 제안한 퍼지 신경회로망과 코호넨 자기 조직화 특징 지도의 성능을 비교하기 위하여 널리 사용되어온 IRIS 데이터와 가우시안 분포 데이터를 사용하였다.

  • PDF

다차원척도법을 활용한 지역 간 대중교통 수단들의 유사성에 관한 연구: 간선열차를 중심으로 (Multidimensional Scaling Analysis of Inter-regional Public Transit Services: Focusing on Inter-regional Railways)

  • 권영민;장기태;장인권
    • 한국철도학회논문집
    • /
    • 제19권2호
    • /
    • pp.243-250
    • /
    • 2016
  • 지속적인 경제성장에 더불어 지역 활성화 정책이 시행되면서 지역 간 통행수요가 증가하고 있으며, 이를 다양한 교통수단이 분담하고 있다. 교통 분야에서 저탄소 녹색성장이 강조되면서 친환경 교통수단인 간선열차로 통행수요의 전환을 유도하려는 노력이 이루어지고 있다. 이를 위하여 간선열차와 경쟁적 위치에 있는 대중교통수단들에 대한 승객들의 인식 파악 및 간선열차의 경쟁력 강화 방안에 대한 연구는 필수적이다. 본 연구에서는 6개의 대표적 지역 간 대중교통수단(KTX, ITX-새마을, 무궁화, 우등고속버스, 일반고속버스, 항공기)이 제공하는 서비스 특성에 대한 유사성을 다차원척도 분석을 실시하여 2차원 공간상에 개념적 거리로 표현하고 승객들의 수단 간 유사성 인식정도를 측정하였다. 연구 결과를 통하여 지역 간 대중교통 수단들에 대한 경쟁관계를 파악할 수 있었으며, 이를 통하여 간선열차가 상대적 경쟁우위를 선점하기 위한 방안을 제시하였다.

정서 영상에 대한 정서표상 및 개인 간 반응 일관성 (Affective Representation and Consistency Across Individuals Responses to Affective Videos)

  • 조아란;김현중;김종완
    • 감성과학
    • /
    • 제26권3호
    • /
    • pp.15-28
    • /
    • 2023
  • 본 연구는 정서 자극 유형 중 일상생활과 가장 유사한 정서 경험을 유발하는 자연주의적 자극인 영상 자극을 활용하여 정서표상의 유사성과 개인 간 반응 일관성을 살펴보기 위해 수행되었다. 이를 위해 다차원척도법을 실시하여 영상 자극이 핵심정서 차원에 위치하는지 확인하고, 참가자 간 분류분석을 사용하여 영상들이 정서유형 별로 구분이 잘 이루어지는지, 영상 자극에 대한 참가자들의 정서표상이 일관적인지 검증하였다. 또한 참가자간 상관분석을 통해 각 영상 자극에 대한 정서표상이 참가자들간 유사한지 추가적으로 확인하였다. 다차원척도법 결과, 정서유발 영상들이 정서가 차원에서 유의하게 구분되어 Russell(1980)의 핵심정서차원을 부분적으로 지지하였다. 분류분석 결과, 각 영상이 정서유형에 따라 잘 분류되고 예측되었다. 마지막으로, 참가자간 상관분석을 통해 정서 반응 일관성이 각 영상의 정서유형에 따라 다르게 나타남을 확인하였다. 본 연구는 영상 자극에 대한 정서표상과 정서 반응 일관성이 정서 유형에 따라 차이가 있음을 시사한다.

네트워크 중심성 척도가 추천 성능에 미치는 영향에 대한 연구 (A Study on the Effect of Network Centralities on Recommendation Performance)

  • 이동원
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.23-46
    • /
    • 2021
  • 개인화 추천에서 많이 사용되는 협업 필터링은 고객들의 구매이력을 기반으로 유사고객을 찾아 상품을 추천할 수 있는 매우 유용한 기법으로 인식되고 있다. 그러나, 전통적인 협업 필터링 기법은 사용자 간에 직접적인 연결과 공통적인 특징을 기반으로 유사도를 계산하는 방식으로 인해 신규 고객 혹은 상품에 대해 유사도를 계산하기 힘들다는 문제가 제기되어 왔다. 이를 극복하기 위하여, 다른 기법을 함께 사용하는 하이브리드 기법이 고안되기도 하였다. 이런 노력의 하나로서, 사회연결망의 구조적 특성을 적용하여 이런 문제를 해결하려는 시도가 있었다. 이는, 직접적으로 유사성을 찾기 힘든 사용자 간에도 둘 사이에 놓인 유사한 사용자 또는 사용자들을 통해 유추해내는 방식으로 상호 간의 유사성을 계산하는 방식을 적용한 것이다. 즉, 구매 데이터를 기반으로 사용자의 네트워크를 생성하고 이 네트워크 내에서 두 사용자를 간접적으로 이어주는 네트워크의 특성을 기반으로 둘 사이의 유사도를 계산하는 것이다. 이렇게 얻은 유사도는 추천대상 고객이 상품의 추천에 대한 수락여부를 결정하는 척도로 활용될 수 있다. 서로 다른 중심성 척도는 추천성과에 미치는 영향이 서로 다를 수 있다는 점에서 중요한 의미를 갖는다 할 수 있다. 이런 유사도의 계산을 위해서 네트워크의 중심성을 활용할 수 있다. 본 연구에서는 여기서 더 나아가 이런 중심성이 추천성과에 미치는 영향이 추천 알고리즘에 따라서도 다를 수 있다는 데에서 주목하여 수행되었다. 또한, 이런 네트워크 분석을 활용한 추천기법은 신규 고객 혹은 상품뿐만 아니라 전체 고객 혹은 상품으로 그 대상을 넓히더라도 추천 성능을 높이는 데 기여할 것을 기대할 수 있을 것이다. 이런 관점에서 본 연구는 네트워크 모형에서 연결선이 생성되는 것을 이진 분류의 문제로 보고, 추천 모형에 적용할 분류 기법으로 의사결정나무, K-최근접이웃법, 로지스틱 회귀분석, 인공신경망, 서포트 벡터 머신을 선택하고, 온라인 쇼핑몰에서 4년2개월간 수집된 구매 데이터로 실험을 진행하였다. 사회연결망에서 측정된 중심성 척도를 각 분류 기법에 적용하여 생성한 모형을 비교 실험한 결과, 각 모형 별로 중심성 척도의 추천성공률이 서로 다르게 나타남을 확인할 수 있었다.

외식 서비스 품질(FOODSERVQUAL) 측정을 위한 다문항 척도 - 위계적 서비스 품질 모형에의 적용 - (A Multiple-Item Scale for Measuring Food Service Quality - An Application of the Hierarchical Service Quality Approach -)

  • 김상호
    • 한국조리학회지
    • /
    • 제15권4호
    • /
    • pp.227-244
    • /
    • 2009
  • 본 연구는 레스토랑 산업에 널리 적용할 수 있는 외식 서비스 품질 측정을 위한 다문항 척도를 개발하였다. 척도 개발을 위해 Kelly Repertory Grid 방법을 이용하여 중요하게 생각하는 레스토랑 품질 속성을 파악한 후 전문가 토론을 수차례 거쳐 유사 중복 항목을 통합하고, 핵심 차원별 주요 속성을 도출하였다. 척도 정제를 위해 신뢰도 분석과 탐색적 요인 분석을 실시하였으며, 이후 각 구성 개념에 대한 중복성 여부를 확인하기 위하여 3차 확인 요인 분석을 실시하였다. 본 연구에서는 Brady & Cronin(2001)이 제안한 위계적 서비스 품질 모형을 바탕으로 외식 서비스 품질 척도를 개발하였다. 본 연구의 위계적 외식 서비스 품질 모형은 외식 서비스 품질 차원 및 측정 요인을 물리적 환경 품질, 상호 작용 품질, 음식 품질이라는 핵심 차원으로 설명함으로써 요인간의 중복성 완화, 결과와 과정 품질의 균형적 고려, 세 가지 핵심 차원별 관리포인트 명확화, 위계적 모형에 의한 핵심 차원과 하위 차원의 구분 등 이론적 기여 측면에서 뿐만 아니라 관리적 시사점 도출 측면에서도 우위성을 갖는다고 할 수 있다.

  • PDF

자동차 부품 누락 방지를 위한 자동 선별 시스템 (Development of a Inspection System for Automotive Part)

  • 신석우;이종훈;박상흡
    • 한국산학기술학회논문지
    • /
    • 제18권10호
    • /
    • pp.756-760
    • /
    • 2017
  • 자동차 부품 업체에서는 납기 준수, 생산 원가 절감, 품질 관리 향상 등의 고객의 필수적인 요구 사항를 만족하기 위하여 자동화를 추진하고 있다. 현재의 수작업을 통한 육안 검사 공정에서는 이러한 필수 요구 사항을 만족하기에는 불가능하다. 따라서 본 연구에서는 품질 관리 개선을 위하여 도어 힌지 브라켓 부품에 대한 현재의 수작업 육안 검사 공정을 대체할 수 있는 자동 선별 시스템을 제안하고자 한다. 본 제안은 도어 힌지 브라켓 부품의 용접너트 누락 불량 발생을 방지하여 고객사의 검사 요구사항 등을 만족할 수 있도록 설계하였다. 검사 공정 알고리즘 및 유사 척도 매칭 알고리즘 프로그램을 자동 선별 시스템에 적용하여 정상 제품과 불량 제품을 구별할 수 있도록 하였다. 검사 공정 알고리즘 및 유사 척도 매칭 알고리즘의 검증 시험을 통하여 검출정확도 98%의 성공적인 검사 결과를 나타내었고 이를 생산 현장에 적용하여 불량 제품감소에 따른 생산성 향상에 기여하였다.

빅 데이터의 자율 속성 감축을 위한 확장된 정보 엔트로피 기반 상관척도 (Extended Information Entropy via Correlation for Autonomous Attribute Reduction of BigData)

  • 박인규
    • 한국게임학회 논문지
    • /
    • 제18권1호
    • /
    • pp.105-114
    • /
    • 2018
  • 고객 유형 분석에 쓰이는 다양한 데이터 분석 방법은 고객들을 위한 맞춤형 콘텐츠를 기획하고, 보다 편리한 서비스를 제공하기 위하여 고객들의 유형과 특성을 정확히 파악하는 것이 매우 중요하다. 본 논문에서는 정보의 손실을 줄이기 위한 일환으로 정보 엔트로피를 확장하여 속성의 불확실성을 이용한 k-modes 군집분석 알고리즘을 제안한다. 따라서 속성에 대한 유사도의 측정은 두 가지의 측면에서 고려되어진다. 하나는 각 분할의 중심에 대한 각 속성간의 불확실성을 측정하는 것이고, 다른 하나는 각 속성이 가지는 불확실성에 대한 확률적 분포에 대한 불확실성을 측정하는 것이다. 특히 속성내의 불확실성은 속성의 엔트로피를 확률적 정보로 변환하여 불확실성을 측정하기 때문에 최종적인 불확실성은 비확률적인 척도와 확률적인 척도에서 고려되어 진다. 여러 실험과 척도를 통하여 제안한 알고리즘의 정확도가 최적의 초기치를 기반으로 군집분석을 수행한 결과에 준수함을 보인다.

통계적 속성을 이용한 히스토그램 기반 효율적인 서명인식 (An Efficient Signature Recognition Based on Histogram Using Statistical Characteristics)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제20권5호
    • /
    • pp.701-709
    • /
    • 2010
  • 본 논문에서는 영상간의 거리에 반비례하고 상관성에 비례하는 조합형 유사성 척도에 의한 효율적인 서명인식 방법을 제안하였다. 여기서 거리는 영상의 공간적 속성을 반영하기 위함이고, 상관성은 통계적 속성을 반영하기 위함이다. 이렇게 하면 서명의 위치, 크기, 회전과 같은 기하학적 변화와 모양변화에 강건한 인식이 가능하다. 상관성의 척도로 이진영상의 히스토그램에 기반을 둔 4 방향의 위치를 고려한 정규상호상관계수를 이용함으로써 서명사이의 유사성을 좀 더 빠르고 정확하게 반영하였다. 제안된 방법을 20개의 288$\times$288 픽셀 트럭영상과 105개의 256$\times$256 픽셀의 서명영상을 대상으로 각각 실험한 결과, 영상의 속성을 잘 반영한 우수한 인식성능이 있음을 확인하였다. 특히 정규상호상관계수와 순서값의 거리를 조합한 척도가 city-block이나 Euclidean 거리를 각각 조합한 척도보다 우수한 인식성능이 있음도 알 수 있었다.