• 제목/요약/키워드: similarity weight

검색결과 376건 처리시간 0.042초

문서필터링을 위한 질의어 확장과 가중치 부여 기법 (Query Expansion and Term Weighting Method for Document Filtering)

  • 신승은;강유환;오효정;장명길;박상규;이재성;서영훈
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.743-750
    • /
    • 2003
  • 본 논문에서는 문서 필터링을 위한 질의어 확장과 가중치 부여 기법을 제안한다. 문서 필터링은 웹 검색 엔진들에 대한 검색 결과의 정확률 향상을 목적으로 한다. 문서 필터링을 위한 질의어 확장은 개념망, 백과사전, 유사도 상위 10% 문서를 이용하며, 각각의 확장 질의어에 가중치를 부쳐하여 질의어와 문서들간의 유사도를 계산한다. 첫 번째 단계에서 개념망과 백과사전을 이용하여 초기 질의어에 대한 1차 확장 질의어를 생성하고, 1차 확장 질의엉 가중치를 부여하여 질의어와 문서들간의 유사도를 계산한다. 다음 단계에서는 높은 유사도를 갖는 상위 10% 문서들을 이용하여 2타 확장 질의어를 생성하고, 2차 확장 질의어에 가중치를 부쳐하여 질의어와 문서들간의 유사도를 계산한다. 다음으로 1차 유사도와 2차 유사도를 결합하여 문서들을 재순위화하고, 임계치보다 낮은 유사도를 갖는 문서들을 필터링함으로써 웹 검색 엔진들의 검색 결과 정확률을 향상시킨다. 실험에서 이러한 문서 필터링을 위한 질의어 확장과 가중치 부여 기법은 정확률-재현율과 F-measure를 이용하여 성능 평가를 할 때 정보 검색 효율성에서 주목할 만한 성능 향상을 보였다.

프로그램 유사성 및 도용여부 사례분석 (A Case Study of Program Similarity and Surreptitious Use)

  • 이성훈;조광문
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 춘계 종합학술대회 논문집
    • /
    • pp.419-422
    • /
    • 2006
  • 본 연구는 프로그램의 복제정도 및 도용여부를 판단하기 위한 모형을 개발하는 내용으로 실제 사례를 중심으로 하여 감정항목 및 각 항목별 중요도를 결정하고 각 항목에 대해 복제정도를 산출한 후 전체적인 복제여부를 판단한 연구내용이다.

  • PDF

단어가중치 기반 문서간 유사도 측정에 관한 연구 (A Research of Documents Similarity Measuring Based on Word Weight)

  • 김혜숙;박상철;김수형
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.198-201
    • /
    • 2003
  • 사용자의 요구 사항을 정확히 분석하여 효과적으로 개발 단계에 적용하기 위해 문서간의 의존성, 즉 상·하위 문서간의 연계성 등을 측정할 수 있는 방법에 대한 연구가 절실한데 이를 위해 적게는 두 용어가 얼마나 밀접한 관련이 있는가를 나타내는 용어간의 유사도 정보가 중요시된다. 이에 본 논문은 임의의 두 문서에 대한 다양한 유사도 측정방법을 통하여 최적의 유사도를 알아보고 두 문서간 유사여부를 검증하기 위해 Neural Network을 적용하였다. 이러한 유사도 측정과 검증 방법은 분산환경에서 입력되는 요구사항 문서들을 효율적으로 분류, 관리해 줄 수 있으며 사용자 요구사항 분석과 전체 Project 수행에 좋은 기초자료를 제공해 줄 수 있다.

  • PDF

스키 자세 유사도 측정의 효율성 향상을 위한 Weight Point를 적용한 Pairwise testing 방법 (Pairwise testing method applying the Weight Point for improving the efficiency skiing posture similarity measurement)

  • 김종한;박준형;정승문
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2015년도 춘계 종합학술대회 논문집
    • /
    • pp.331-332
    • /
    • 2015
  • 스키 입문자의 경우 부상 등에 따른 두려움을 느끼거나 부정확한 자세가 익숙해져 바로잡기가 힘든 경우가 발생한다. 스키 트레이닝 시뮬레이터는 이러한 단점을 보완하여 스키 선수의 정확한 자세를 바탕으로 정확한 자세를 취할 수 있도록 유도하는 시스템이다. 본 논문에서는 스키 선수의 자세와 시뮬레이터 사용자의 자세를 비교하여 유사도를 측정하기 위해 사용한 알고리즘의 효율성을 향상하기 위해 특정 센서에 가중치를 부여하고 이들의 좌표값을 받아 계산하는 Pairwise testing 기법을 적용한다. 이는 센서간의 거리를 실시간으로 계산하여 두 자세의 유사도를 검출하는데 있어 비교 테스트 케이스를 감소시켜 유사도 측정의 효율성을 높일 수 있다.

  • PDF

객관적 영상 화질 평가 기준를 위한 움직임 정보에 따른 중요도 결정 기법 (Weighting Method based on Motion Information for Objective Video Quality Assessment)

  • 박수영;김태완;이상훈
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.909-910
    • /
    • 2008
  • For evaluating the performance of some codecs, many researchers have study and develop new objective video quality assessments. However, it's not sufficient for evaluating the temporal feature of video data yet, which is a distinguishable and representative characteristic when compared with other multimedia. This paper propose the method to apply the weight to SSIM (Structural SIMilarity) according to the cognitive psychological feature. And, we presented that the performance of objective video quality assessment applied the weight to SSIM by using the proposed method is superior to one of original SSIM.

  • PDF

건축적인 의상디자인의 기호학적 연구 (Architectural Fashion Design Interpreted by Semiotics)

  • 박명희;장애란
    • 복식
    • /
    • 제25권
    • /
    • pp.215-231
    • /
    • 1995
  • Semiotics is an external expression for show-ing internal meaning, and the signs express the internal meaning. The architects and the designers are very similar each other in using semiotics for expressing their desires. Histori-cally, the design similarity exists between the architecture and the fashion. In this study, the fashion designs are interpreted by using semiotics of architectural design, especially emphasizing external expression methods for representing internal desires. To express the human body's character-istics, the volume, weight support, structural simplicity, controllability and beauty of fashion were used for the fashion designs, and those characters could be found at the architec-tural patterns. Balenciaga's fashion emphasized the volume, the weigh support, the structural simplicity and the controllability, while Roberto Capucci rejected the approach of using women's body curves, but used the volume and simplicity of natures in addition to Balenciaga's heavy weight design patterns. The control and the modern dedication were used to make the simple patterns by Courreges, and then brought the Modernism to the fashion. Courreges used the cutting characters to func-tional design for expressing the structural sim-plicity.

  • PDF

문장 클러스터링에 기반한 자동요약 모형 (A Text Summarization Model Based on Sentence Clustering)

  • 정영미;최상희
    • 정보관리학회지
    • /
    • 제18권3호
    • /
    • pp.159-178
    • /
    • 2001
  • 본 연구에서는 문장 클러스터로부터 대표문장을 선정하여 요약문을 생성하는 자동요약 모형을 제시하고. 학습문서 집단을 미용하여 최적의 요약 환경을 구축한 후 요약 실험을 수행하였다. 학습 과정에서 문장의 클러스터링 기법으로는 7개의 계층적 기법들을 비교한 결과 클러스터를 구성하는 문장 수의 편차가 가장 적고 단일 문장 클러스터를 가장 적게 생성하는 센트로이드 기법이 선택되었다. 또한 각 클러스터를 대표하는 문장의 선정을 위해 용어 및 문장 가중치를 합산한 문장값과 클러스터-문장 벡터간 유사도의 두 기준을 비교한 결과 문장값 기준이 선택되었다. 용어 가중치로는 역문장빈도와 표제어 가중치, 그리고 문장의 위치 가중치가 자동요약 성능을 개선시키는 것으로 나타났으며, 적절한 요약문의 길이는 전체 문서의 1/3인 것으로 나타났다. 실험문서 집단으로는 문서의 길이와 특성이 다른 신문기사와 잡지기사의 두 집단을 이용하였다. 요약 모형의 검증 실험 결과 요약 정확률은 신문기사 집단에서는 53%, 잡지기사 집단에서는 47%인 것으로 나타났다. 두 실험 모두 랜덤하게 생성한 베이스라인 요악문보다 성능이 우수하였으나, 리드문장들로 구성된 베이스라인 요약문과의 비교에서는 짧은 길이의 신문기사의 경우 요약 모형의 성능이 오히려 떨어지는 것으로 나타났다.

  • PDF

제주도 남부 화순연안 수산자원 유영생물의 종 조성과 다양도 (Species Composition and Diversity of Fisheries Resources, Nekton, off the Coast of Hwasun, Southern part of Cheju Island)

  • 고유봉;신희섭
    • 한국어류학회지
    • /
    • 제2권1호
    • /
    • pp.36-46
    • /
    • 1990
  • 제주도 남부 화순연안 정치망에서 채집된 유영생울의 군집구조을 밝히기 위하여 1987년 3월~10월까지 매월 1회씩 채집하였다. 조사시의 표층수온($13.3{\sim}24.8^{\circ}C$)과 염분($32.20{\sim}34.96^{\circ}/_{\circ\circ}$)은 계절적 변화를 보였고, 특히 여릅철에 변동폭이 컸다. 조사기간동안 21과(科) 28속(屬) 3종((種)이 채집되었고 20cm이하(96%)와 30g이하(74%)의 생물이 대부분이었다. 출현개체 수와 채집생물 량은 계절에 따라 다르나 1~2 종의 생울에 의해 우점(50%이상)되고 있으며 주요생물로는 전갱이, 줄도화돔, 오징어, 고등어류등이었다. 봄철에 생물량은 많지 않으냐나 종류수, 다양도 및 개체수 당 정보량지수가 높았고, 8월에 는 출현 종 수는 많지 않으나 다양도 및 개체수 당 정보량지수가 비교적 높게 나타났다. 2회이상 출현한 24종(種)은 모두 유사값도 0.14에서 군(群)을 이루었고, 비교적 높은 유사값 0.50을 기준으로 했을때 4개의 군(群)으로 구분되었다.

  • PDF

지역별 색상 분포 히스토그램과 모양 특징을 이용한 영상 검색 (Image Retrieval using Local Color Histogram and Shape Feature)

  • 정길선;김성만;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 춘계종합학술대회
    • /
    • pp.50-54
    • /
    • 1999
  • 본 논문에서는 영상의 다양한 특징 정보 중에서 색상 특징과 모양 특징을 이용한 영상 검색 시스템을 제안한다. 색상 특징은 지역별 색상 분포 히스토그램을 추출하고, 각 지역의 히스토그램 중에 가장 큰 값을 가지는 4개의 값을 특징 정보로 이용한다. 모양 특징을 추출하기 위한 전처리 과정은 경계면 추출과정, 경계면에 대한 무게 중심 추출 과정, angular sampling 과정으로 구성되고, 무게 중심으로부터 경계면까지의 거리의 합, 표준 편차, 장축/단축 비율을 특징 정보로 이용한다. 각 질의 영상들의 특징 정보와 데이터베이스에 저장된 영상들의 특징 정보들 비교하여 유사도 순위에 따라 후보영상들이 검색된다. 200개의 폐곡선을 이루는 상표영상에 대한 검색 실험을 통하여 색상 정보와 모양 정보에 대한 정확도를 측정하였다. 실험 결과 평균 Recall/Precision이 0.72/0.83를 보임으로써 제안된 방법이 유용함을 보였다.

  • PDF

웨블릿 변환기법을 이용한 내용기반 컬러영상 검색시스템 구현 (Implementation of Content Based Color Image Retrieval System using Wavelet Transformation Method)

  • 송석진;이희봉;김효성;남기곤
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.20-27
    • /
    • 2003
  • 본 논문에서는 사용자가 질의를 원하는 물체 영역을 선택하면 유사 물체를 영상 데이터베이스 내에서 검색할 수 있는 내용기반 영상검색 시스템을 구현하였다. 질의영상은 색상성분과 그레이성분으로 나누어져 웨블릿 변환되고 색상성분에서는 컬러 오토코릴로그램과 분산으로 색상특성을 추출한다. 그리고 그레이성분에서는 오토코릴로그램과 GLCM을 통해 질감특성을 추출한다. 이렇게 구한 2개 성분에서의 특성들을 이용하여 데이터베이스내의 영상들과 각각 유사도를 비교하여 검색하게 된다. 이때 각 유사도에 가중치를 적용하였다. 한 가지 성분보다 두 가지 성분에서 특성을 구하여 각각의 단점을 보완하였고 실험 결과에서도 소환성(recall) 및 정확성(precision)이 향상됨을 볼 수 있었다 또한 가중치를 적용함으로써 검색 효율이 개선되었다. 그리고 데이터베이스내 영상들의 여러 특성을 특성 라이브러리내에 자동 색인화 시킴으로써 고속의 영상 검색이 가능하였다.