• 제목/요약/키워드: 유사도 가중치

검색결과 576건 처리시간 0.047초

문맥가중치가 반영된 문장 유사 척도 (Context-Weighted Metrics for Example Matching)

  • 김동주;김한우
    • 전자공학회논문지CI
    • /
    • 제43권6호
    • /
    • pp.43-51
    • /
    • 2006
  • 본 논문은 영한 기계번역을 위한 예제기반 기계번역에서 예제 문장의 비교를 위한 척도에 관한 것으로 주어진 질의 문장과 가장 유사한 예제 문장을 찾아내는데 사용되는 유사성 척도를 제안한다. 제안하는 척도는 편집거리 알고리즘에 기반을 둔 것으로 표면어가 일치하지 않는 단어에 대해 기본적으로 단어의 표제어 정보와 품사 정보를 이용하여 유사도를 계산한다. 편집거리 척도는 비교 단위의 순서에 의존적이기는 하지만 순서만 일치하면 동일한 유사성 기여도를 갖는 것으로 판단하기 때문에 완전 문맥을 반영하지는 못한다. 따라서 본 논문에서는 완전 문맥 반영을 위해 추가적으로 이들 정보 외에 일치하는 단위 정보를 갖는 연속된 단어들에 대해 연속 정보를 반영한 문맥 가중치를 제안한다. 또한 비유사성 정도를 의미하는 척도인 편집거리 척도를 유사성 척도로 변경하고, 문맥 가중치가 적용된 척도를 문장 비교에 적용하기 위하여 정규화를 수행하며, 이를 통하여 유사도에 따른 순위를 결정한다. 또한 언어적 정보를 이용한 기존 방법류들에 대한 일반화를 시도하였으며, 문맥 가중치가 적용된 척도의 우수성을 증명하기 위해 일반화된 기존 방법류들과의 비교 실험을 수행하였다.

가중치 패턴 클러스터를 이용한 한글 문자 인식 (The Recognition of The Korean Characters Using The Weighted Pattern Cluster)

  • 김도형;이선화;차의영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.319-321
    • /
    • 2001
  • 본 논문에서는 스캐너로 입력된 한글 문서 영상에서 한글 문자를 인식하는 방법을 제시한다. 입력된 한글 문자를 한글의 구조적 특징에 따라 6개의 유형으로 분리하고, 각 유형에서의 모음의 형태학적 특징에 근거하여 모음을 인식한다. 각 유형에서의 자음의 인식을 위해서 가중치 패턴 클러스터를 생성하고 생성된 클러스터와 원영상간의 유사도 측정을 통해 자음을 인식하게 된다. 오인식 가능성이 있는 자음은 오인식 교정을 위한 세부 유사도 매칭과정을 통해 최종적으로 인식된다. 제안하는 알고리즘을 바탕으로 실험한 결과 스캐너로 입력받은 상용 한글 문자 14,983자에 대해 최종 95.68%의 인식률을 보였으며, 차후 정형화된 한글 문서 인식 시스템에 응용될 수 있을 것이다.

  • PDF

내용 기반 여과와 협력적 여과의 병합을 통한 추천 시스템에서 조화 평균 가중치 (Harmonic Mean Weight by Combining Content Based Filtering and Collaborative Filtering in a Recommender System)

  • 정경용;류중경;강운구;이정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.239-250
    • /
    • 2003
  • 전자 상거래 분야에서 증가하고 있는 정보들 중에 사용자가 자신의 기호에 맞는 정보 만들 만을 선택하기 위해서 각 정보를 일일이 검토하기 어려운 일이다. 이를 보완하기 위해 정보 여과 기술이 사용되는데 최근 추천 시스템은 협력적 여과 시스템의 희박성과 초기 평가 문제를 해결하기 위해서 내용 기반 여과 시스템과 협력적 적과 시스템을 병합하늘 방법을 사용한다. 본 논문에서는 혼합형 추천시스템에서의 예측의 정확도를 향상시키기 위해서 조화 평균 가중치(CBCF_harmonic_mean)를 사용자 유사도 가중치를 구할 때 사용한다. 내용 기반의 성능을 고려하여 임계치 값을 45로 설정한 후, n/45의 Significance weight을 사용자 유사도 가중치에 적용한다. 제안된 방법의 성능을 평가하기 위해서 기존의 협력적 여과 시스템과 내용 기반 여과 시스템을 병합한 방법과 비교 평가하였다. 그 결과 기존의 협력적 여과 시스템의 문제점을 해결하여 예측의 정확도를 높이는데 효과적임을 확인하였다.

인간 시각과 MPEG-7 시각 기술자를 이용한 관심영역 기반의 의료 영상 검색 (ROI-based Medical Image Retrieval using Human Perception and MPEG-7 Visual Descriptors)

  • 서미숙;고병철;남재열
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.127-130
    • /
    • 2006
  • 본 논문에서는 MPEG-7 의 특징 기술자를 이용하고, 초기 중요도 가중치를 고려한 관심영역(ROI: Region-Of-Interest) 기반의 의료 영상 검색 시스템을 제안한다. 의료 영상에서 의미 없는 배경 부분을 제거하고, 영역 추출 처리 시간을 줄이는 관심 윈도우(AW: Attention Window)를 생성하여 관심 영역 세그먼테이션을 수행한다. 또한 인간 시각에 부합하는 검색 성능의 향상을 위해 특징 벡터 거리 계산에서 영역의 초기 가중치를 설정하였다. 실험에서 구현된 시스템은 의료 영상을 효과적으로 찾아내며, 조합된 특징과 가중치를 이용한 유사도 측정으로 검색 성능이 향상됨을 보여준다.

  • PDF

주파수 도메인의 구조적 유사도를 통한 HEVC 주관적 화질 향상 율-왜곡 최적화 (Improvement of Perceptual Quality of HEVC by Rate Distortion Optimization Using Frequency Domain Structural Similarity)

  • 정상현;전병우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.81-82
    • /
    • 2017
  • 본 논문에서는 PSNR 을 높이도록 최적화된 HEVC 의 율-왜곡 최적화(RDO)를 MS-SSIM 를 높이도록 하여 RDO 를 수행 하도록 한다. 구현 방법으로는 MS-SSIM 도출 방법과 비슷하도록 원본과 4 단계의 저역 통과 필터(LPF)를 통과한 결과에 대한 DCT(Discrete Cosine Transform) 를 수행하고 그 AC 계수의 비율로 lagrange multiplier(${\lambda}$)를 수정하는 방식이다. AC 계수 비율과 MS-SSIM 에서 도출 된 가중치, LPF 특성 등에 따라 새롭게 각 스케일의 가중치를 결정하여 최종적으로 ${\lambda}$ 가중치를 결정하여 그 결과를 바탕으로 RDO 를 수행한다. 시뮬레이션을 통해 제안의 방법과 HEVC reference software 의 BD-rate 계산 결과 7%의 PNSR, -13.2%의 MS-SSIM 를 얻을 수 있었고 이에 따라 주관적 화질을 개선했다고 할 수 있다.

  • PDF

온톨로지 기반 가중치 부여 논문 검색 모델 (Weighting Assignments Paper Retrieval Model Based On Ontology)

  • 박현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.328-331
    • /
    • 2007
  • 많은 연구원들이 자신의 연구 과제를 수행함에 있어 선행 연구 자료로 참고하는 것이 관련 주제에 관한 학술 자료이다. 현재 많은 학교와 기관 그리고 단체에서 관련 학술 자료를 발간하고 있으며 이를 참조하는 방식도 다양하다. 그러나 학술 자료를 참조함에 있어 단어 기반 검색이 사용되고, 발간된 자료의 양이 방대해짐에 따라 사용자가 원하는 정보를 참조하는 데 많은 어려움이 따른다. 본 논문은 이러한 기존 학술 자료 검색 방법을 보완하기 위하여 온톨로지를 기반으로 하는 가중치 부여 논문 검색 모델을 제안한다. 제안한 모델은 논문 관련 정보를 온톨로지로 구축하고, 검색 문서에 가중치를 부여하는 순위화 알고리즘을 적용한 것이다. 이는 기존 유사도 적용 기법에 시멘틱 개념을 적용한 것으로 효율적이고 정확한 논문 검색을 보장한다.

  • PDF

자동 얼굴인식을 위한 얼굴 지역 영역 기반 다중 심층 합성곱 신경망 시스템 (Facial Local Region Based Deep Convolutional Neural Networks for Automated Face Recognition)

  • 김경태;최재영
    • 한국융합학회논문지
    • /
    • 제9권4호
    • /
    • pp.47-55
    • /
    • 2018
  • 본 논문에서는 얼굴인식 성능 향상을 위해 얼굴 지역 영역 영상들로 학습된 다중개의 심층 합성곱 신경망(Deep Convolutional Neural Network)으로부터 추출된 심층 지역 특징들(Deep local features)을 가중치를 부여하여 결합하는 방법을 제안한다. 제안 방법에서는 지역 영역 집합으로 학습된 다중개의 심층 합성곱 신경망으로부터 추출된 심층 지역 특징들과 해당 지역 영역의 중요도를 나타내는 가중치들을 결합한 특징표현인 '가중치 결합 심층 지역 특징'을 형성한다. 일반화 얼굴인식 성능을 극대화하기 위해, 검증 데이터 집합(validation set)을 사용하여 지역 영역에 해당하는 가중치들을 계산하고 가중치 집합(weight set)을 형성한다. 가중치 결합 심층 지역 특징은 조인트 베이시안(Joint Bayesian) 유사도 학습방법과 최근접 이웃 분류기(Nearest Neighbor classifier)에 적용되어 테스트 얼굴영상의 신원(identity)을 분류하는데 활용된다. 제안 방법은 얼굴영상의 자세, 표정, 조명 변화에 강인하고 기존 최신 방법들과 비교하여 얼굴인식 성능을 향상시킬 수 있음이 체계적인 실험을 통해 검증되었다.

문장 클러스터링에 기반한 자동요약 모형 (A Text Summarization Model Based on Sentence Clustering)

  • 정영미;최상희
    • 정보관리학회지
    • /
    • 제18권3호
    • /
    • pp.159-178
    • /
    • 2001
  • 본 연구에서는 문장 클러스터로부터 대표문장을 선정하여 요약문을 생성하는 자동요약 모형을 제시하고. 학습문서 집단을 미용하여 최적의 요약 환경을 구축한 후 요약 실험을 수행하였다. 학습 과정에서 문장의 클러스터링 기법으로는 7개의 계층적 기법들을 비교한 결과 클러스터를 구성하는 문장 수의 편차가 가장 적고 단일 문장 클러스터를 가장 적게 생성하는 센트로이드 기법이 선택되었다. 또한 각 클러스터를 대표하는 문장의 선정을 위해 용어 및 문장 가중치를 합산한 문장값과 클러스터-문장 벡터간 유사도의 두 기준을 비교한 결과 문장값 기준이 선택되었다. 용어 가중치로는 역문장빈도와 표제어 가중치, 그리고 문장의 위치 가중치가 자동요약 성능을 개선시키는 것으로 나타났으며, 적절한 요약문의 길이는 전체 문서의 1/3인 것으로 나타났다. 실험문서 집단으로는 문서의 길이와 특성이 다른 신문기사와 잡지기사의 두 집단을 이용하였다. 요약 모형의 검증 실험 결과 요약 정확률은 신문기사 집단에서는 53%, 잡지기사 집단에서는 47%인 것으로 나타났다. 두 실험 모두 랜덤하게 생성한 베이스라인 요악문보다 성능이 우수하였으나, 리드문장들로 구성된 베이스라인 요약문과의 비교에서는 짧은 길이의 신문기사의 경우 요약 모형의 성능이 오히려 떨어지는 것으로 나타났다.

  • PDF

개선된 유전 알고리즘을 사용한 효율적 신경망 학습 (Efficient Learning of Neural Network Using an Improved Genetic Algorithm)

  • 김형래;김성주;최우경;하상형;조현찬;전홍태
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.315-318
    • /
    • 2004
  • 최적해 탐색 도구로 널리 알려진 유전 알고리즘을 이용하여 신경망의 학습을 위한 가중치를 탐색하는 방법은 신경망의 학습 방법의 하나로 사용되고 있다. 신경망의 가중치는 일정 시간의 유전자 연산을 수행하게 되면 최적화된 가중치의 값과 유사하게 되는 특징을 지닌다. 이는 유전자 연산 방법에 의해 가중치가 수렴되고 있음을 의미하며, 그 때의 가중치는 일정한 패턴을 지니는 특징을 발견할 수 있다. 이에, 본 논문에서는 탐색된 가중치의 패턴을 보존하기 위한 방법으로 유전자의 일정 부분을 고정한 후 유전자 연산을 수행하는 개선된 학습 방법을 제안하고자 한다. 이를 이용할 경우에 유전자 탐색의 문제점으로 제시되고 있는 탐색 시간을 효율적으로 감소시킬 수 있는 장점이 있다.

  • PDF

설계가중치를 이용한 유사 최량선형 비편향 예측

  • 신동윤;신민웅
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.161-164
    • /
    • 2004
  • You 와 Rao (2002)는 소지역 추정시 유사 최량선형 비편향 예측에서 설계 가중 값을 사용하는 방법을 발전시켰다. 특히 소지역 평균들을 추정하기 위하여 유사-최량선형 비편향 예측 추정량을 제안하였다. 우리는 소지역 추정에서 실용적으로 이용되는 몇 가지 추가적인 성질을 연구하였다.

  • PDF