• 제목/요약/키워드: 검색 순위화

검색결과 123건 처리시간 0.157초

Answer set 자동 구축을 위한 문서 필터링 (Document filtering for automatic construct ion of Answer Set)

  • 정용교;신승은;오효정;장명길;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-258
    • /
    • 2002
  • 본 논문은 의미기반 정보검색 소프트웨어 기술에서 정답 문서 자동 구축을 위한 문서 필터링기법을 제안한다. 문서 필터링은 1차 질의어와 문서간의 유사도와 2차 질의어와 문서간의 유사도를 이용하여 이루어지며, 1차 질의어와 문서간의 유사도를 구하기 위하여 개념 망과 백과사전 정보를 이용한 1차 질의어 확장 과정을 수행하고, 화장된 질의어와 문서와의 유사도를 계산한다. 1차 확장 질의어를 이용해 얻어진 결과 중 유사도가 상위 10%에 속하는 문서를 이용하여 2차 질의어 확장을 한다. 2차 질의어 확장은 상위 10% 문서에 출현하는 명사중 문서 출현 빈도가 임계치 이상인 명사를 선택하여 이루어지고, 그것을 이용하여 문서의 유사도를 계산한다. 이렇게 얻어진 두 가지의 유사도를 결합하여 문서들을 순위화하고 Accept Point를 이용하여 문서를 필터링한다.

  • PDF

뉴스기사의 연관 단어 텍스트 마이닝을 이용한 스타의 분야별 기여도순위 비교기법 (Ranking Contribution of Star in Each Domain Using Association Text Mining News Articles on the Web)

  • 강윤정;윤재열;임지연;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1191-1194
    • /
    • 2011
  • 스타의 대중에 대한 인기가 브랜드의 이미지 제고와 상업적 영향을 끄는 마케팅 전략을 스타 마케팅이라고 한다. 오늘날의 스타는 방송, 연예활동뿐만 아니라 스포츠, 정치활동, 사회기여활동 등 다양한 분야에서 활약하며 스타의 이미지는 그 활약상에 영향을 받는다. 스타의 이미지는 브랜드 및 기업의 이미지로 직결되므로 그에 대한 사전분석은 마케팅에서 중요한 요소이다. 그래서 일반적으로 스타들이 활약하는 도메인을 분류하여서 그 스타에 대해서 검색을 하였을 때 어떤 분야에서 활약하고 기여를 하는지 그 기여도를 도메인에 따라 랭킹을 매기는 방법을 제안한다. 뉴스기사에서 텍스트 마이닝 기술을 이용하여 스타의 이름과 활동 도메인들에 대해서 관련단어를 빈도에 따라 추출한다. 그리고 관련된 단어들을 이용하여 스타에 대한 뉴스 중 각 도메인과 관련된 기사들을 카운트하며 도메인에 대해서 긍정 혹은 부정적인 보도내용일 경우에는 극성을 부여하여 그 가중치를 달리한다. 빈도 및 극성을 고려한 점수화에 의해 스타가 기여하는 분야에 대한 순위를 매긴다.

크로마 레벨 표현, 동적 시간 왜곡, 꺾인 거리함수에 기반한 멜로디 사이의 유사도 개발 (Development of melody similarity based on chroma representation, dynamic time warping, and hinge distance)

  • 장달원;박성주;장세진;이석필
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.258-260
    • /
    • 2011
  • 이 논문에서는 쿼리-바이-싱잉/허밍 (Query-by-singing/humming, QbSH) 시스템 또는 커버 노래 인식 (cover song identification) 시스템에서 사용 가능한 멜로디 유사도를 제안한다. QbSH 또는 커버 노래 인식은 디지털 음악의 사용이 보편화되면서 음악 검색의 방법으로 많은 연구가 진행되어 오고 있다. 멜로디 유사도는 이런 시스템을 구현하는데 필수적인 요소이며, 두 개의 음악에서 멜로디가 추출되었다고 가정하고, 추출된 멜로디 사이의 유사한 정도를 수치로 표현한다. QbSh 시스템이나 커버 노래 인식 시스템은 멜로디 유사도에 기반하여 입력 노래와 유사한 노래를 데이터베이스에서 검색하는 작업을 수행한다. 이 논문에서 제안하는 멜로디 유사도 방식은 기존의 많이 연구되던 동적 시간 왜곡 (dynamic time warping, DTW) 방법과 크로마 표현 방법 (chroma representation)을 사용하였다. DTW방법은 비대칭적으로 사용하고 미디 노트 영역에서 표현된 멜로디 특징은 0이상 12 미만의 크로마 레벨로 표현하였다. 기존의 방법에서는 정수값을 많이 사용하였으나 이 논문에서는 실수값을 사용한다. DTW 에 사용하는 거리 함수를 기존에 사용하던 차이의 절대값 대신 꺾인 함수 형태를 사용함으로써 성능을 높였다. QbSH 시스템에서의 실험을 통해서 성능을 검증하였다. 본 논문에서는 10-12초 길이의 1000번의 쿼리(Query)에 대해서 28시간 정도의 데이터베이스에서 실험한 결과, 순위 역의 평균 (Mean reciprocal rank, MRR) 값이 0.713을 보였다.

  • PDF

클러스터링 알고리즘 기반의 임베딩 기법 성능 비교 및 분석 (Performance Comparison and Analysis of Embedding methods based on Clustering Algorithms)

  • 박정민;박희민;양선아;순위샹;이용주
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.164-167
    • /
    • 2021
  • 최근 구글, 아마존, LOD 등을 중심으로 지식 그래프(Knowledge graph)와 같은 검색 고도화 연구가 활발히 수행되고 있다.그러나 대규모 지식 그래프 인덱싱 시스템에서 데이터가 어떻게 임베딩(embedding)되고, 딥러닝(deep learning) 되는지는 상대적으로 거의 연구가 되지 않고 있다. 이에 본 논문에서는 임베딩 모델에 대한 성능평가를 통해 데이터셋에 대해 어떤 모델이 가장 좋은 지식 임베딩 방법을 도출하는지 분석한다.

  • PDF

시맨틱 브로커 기반 시맨틱 서비스 조합 (Semantic Service Composition Based on Semantic Broker)

  • 정한민;이미경;류범종
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.283-288
    • /
    • 2009
  • 시맨틱 서비스는 온톨로지 기반으로 검색 API 또는 추론 API를 제공하는 서비스로 정의할 수 있는데, 웹 서비스 등의 대화 방식을 이용하며 웹상에서 공개된다. 온톨로지 기반이므로 URI (Uniform Resource Identifier)를 지원하며 온톨로지 스키마에 정의된 클래스와 속성 (Property)을 사용하여 미리 정의된 작업을 수행한다. 시맨틱 서비스는 입력 인자가 온톨로지에 정의된 클래스들로 구성되므로 시맨틱 서비스 조합 시에 온톨로지를 반드시 참조할 필요가 있다. 본 연구는 사용자 제시 조건을 입력받아 시맨틱 브로커를 이용하여 시맨틱 서비스 관리 서버에 등록된 시맨틱 서비스들 내의 온톨로지 정보와 관리 정보를 참조하여 조건에 맞는 시맨틱 서비스를 조합하는 방법을 제시한다. 사용자 제시 조건으로는 입력 인스턴스, 출력 클래스, 시각화 유형 (Visualization Type), 시맨틱 서비스명, 속성명 등이 있다. 시맨틱 서비스 조합은 사용자 제시 조건을 기반으로 동적으로 이루어지며, 그 결과는 복합 시맨틱 서비스를 포함하는 시맨틱 서비스 파이프라인들로서 사용자에게 순위화되어 제시된다. 사용자는 시맨틱 브로커에 의해 제시된 시맨틱 서비스 파이프라인들을 실행해 봄으로써 원하는 시맨틱 서비스 조합을 찾을 수 있다. 결국, 본 연구를 통해 개발된 도구는 다양한 곳에서 개발된 시맨틱 서비스들을 동적으로 연계하여 새로운 시맨틱 서비스를 개발하고자 하는 서비스 기획자를 지원하데 도움을 준다.

  • PDF

낙관 인식을 위한 애플리케이션의 설계 및 구현 (Design and Implementation of Luo-kuan Recognition Application)

  • 김한슬;서귀빈;강민구;류기수;홍민
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.97-103
    • /
    • 2018
  • 대부분의 동양화 작품에는 작가의 정보를 압축시켜 하나의 그림으로 표현한 낙관이 존재하고 이러한 낙관은 작품의 제목이나 작가의 이름 등 다양한 정보를 포함하고 있다. 따라서 동양화를 수집하거나 즐기는 사람들에게 낙관은 동양화에 대한 중요한 정보를 제공하는 단서 역할을 한다. 하지만 낙관에 있는 글자들은 대부분 어려운 한자나 간자 혹은 다양한 모양으로 변형되어 있어 일반인들이 쉽게 해석하기 어려운 문제점이 있다. 본 논문에서는 낙관의 정보를 손쉽게 확인할 수 있도록 안드로이드 기반의 낙관 검색 애플리케이션을 개발하였다. 해당 애플리케이션은 촬영한 낙관 이미지를 분석하여 서버에 전송해 서버 내의 데이터베이스에서 촬영한 낙관 사진과 가장 유사한 낙관 후보에 대한 정보를 검색하는 알고리즘을 적용하였다. 또한 제안하는 알고리즘의 성능 분석을 위해서 촬영된 낙관 사진과 170개의 낙관 데이터 후보 중에서 정확하게 낙관을 찾아내는지에 대한 여부와 제공되는 낙관의 순위를 바탕으로 알고리즘의 정확도를 비교 및 분석하였다. 정확도 분석 실험 결과 본 애플리케이션의 검색 알고리즘의 정확도는 약 90%로 확인되었으며 추후 알고리즘의 최적화와 멀티쓰레딩 알고리즘의 보완을 통해 빅 데이터 환경에서 자동으로 이미지를 분석 및 검색하는 플랫폼으로의 발전이 가능할 것으로 기대한다.

의사연관 피드백과 퍼지 연관을 이용한 개인화 문서 스니핏 추출 방법 (Personalized Document Snippet Extraction Method using Fuzzy Association and Pseudo Relevance Feedback)

  • 박선;조광문;양후열;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.137-142
    • /
    • 2012
  • 스니핏(snippet)이란 검색엔진이 사용자에게 제공하는 웹 페이지를 대표할 수 있는 요약된 정보이다. 스니핏은 검색엔진의 페이지 순위와 함께 사용자의 페이지 방문에 큰 영향을 준다. 스니핏을 이용시 가끔 사용자의 의도와는 다른 잘못된 웹 페이지를 방문할 수 있다. 이것은 스니핏을 추출하는 방법이 사용자의 의도를 정확히 이해하는 것이 어렵기 때문이다. 본 논문은 이러한 문제를 해결하기 위해 의사연관 피드백과 퍼지 연관을 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 의사연관 피드백을 이용하여 사용자의 질의를 확장학고, 확장된 질의와 웹 페이지 사이에 퍼지 연관을 이용함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다. 실험결과 제안방법이 다른 방법에 비하여서 스니핏 추출에 더 좋은 성능을 보인다.

온톨로지 기반 법령 검색시스템의 개발: 철도·교통 분야 연구개발사업을 중심으로 (A Development of Ontology-Based Law Retrieval System: Focused on Railroad R&D Projects)

  • 원민재;김동희;정해민;이상근;홍준석;김우주
    • 한국전자거래학회지
    • /
    • 제20권4호
    • /
    • pp.209-225
    • /
    • 2015
  • 철도교통 분야의 연구개발사업은 여러 법령과 긴밀하게 관련되어 있기 때문에, 연구개발을 성공적으로 수행했더라도 법령에 의해 제약되어 연구개발 결과의 실질적인 사업화 또는 실용화를 이루어내지 못하는 사례가 발생하고 있다. 본 논문에서는 이러한 사례를 방지하기 위한 방편으로 철도교통 분야에서 진행되는 연구개발사업과 관련된 법령을 검색할 수 있는 법령검색시스템의 모델을 제시하였다. 사업 내용을 설명하는 연구개발계획서가 시스템에 입력되면 요약서의 내용을 대상으로 형태소 분석을 수행하여 명사들만을 남긴다. 국가법령정보센터에서 제공하는 법령정보공동활용서비스를 사용하여 명사들 중 법령용어를 분류하고, 법령용어와 해당 법령용어를 정의하는 법령과의 관계를 지능형 지식 베이스인 온톨로지에 저장한다. 온톨로지에 저장된 법령들은 본 연구에서 개발한 추가적인 지표 계산과정을 거쳐 연구개발사업과 관련된 정도를 기준으로 순위가 매겨진 후, 시스템 사용자에게 제공된다. 사용자는 연구개발에 영향을 미칠 수 있는 법령을 검색할 수 있게 되어 사업 시작 전에 연구 방향을 결정하는 데 참고하거나, 사업 진행하는 과정에서도 참고자료로 사용할 수 있다. 궁극적으로, 법령에 의해 철도교통 분야 연구개발사업이 실패하거나 실용화되지 못하는 경우를 사전에 방지함으로써, 사업에 투자한 예산에 의해 기대되는 충분한 기술적 경제적 효과를 얻을 수 있게 될 것이다.

분산시각 미디어 검색 프레임워크의 성능향상을 위한 부하분산 시스템 (A load Balancing System for improving the Performance of Semantic Web based Visual Media Retrieval Framework)

  • 심준용;원재훈;김세창;김정선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.213-217
    • /
    • 2006
  • 기존의 Ontology를 이용한 이미지 검색 시스템이나 간단한 구조를 가진 메타데이터 기반의 분산 이미지 검색 시스템들의 단점들을 극복하기 위해 다양한 이미지 제공자들의 자율성을 보장하면서, Semantic 기반의 이미지 검색을 지원하는 분산 시각미디어 검색 프레임워크인 HERMES(The Retrieval Framework for Visual Media Service)가 제안되었다. 분산 환경에서는 시스템의 규모가 커지면서 사용자들의 상호작용 성능을 떨어뜨리지 않으면서 다수의 동시 사용자들을 처리할 수 있는 확장성(Scalability)이 중요한 이슈가 된다. 제안된 프레임워크에서는 서비스를 사용하는 다수의 사용자들이 Broker 서버에 동시에 접속했을 경우 발생하는 Overhead에 대한 문제를 해결 할 수 없었기 때문에 성능의 저하와 확장성을 고려할 수 없는 문제를 안고 있다. 이런 문제를 해결하기 위해서 Broker 서버의 내부 컴포넌트의 수행시간을 측정하고 이를 주기적으로 수집하여 저장하는 Monitoring System이 추가로 연구되었지만, 수집한 정보를 가공하여 다수의 Broker 서버에 대한 부하를 분산하는 알고리즘은 제공되지 않았다. 본 논문에서는 다수의 동시 사용자들이 접속했을 경우에도 성능의 저하 없이 비슷한 수준의 서비스를 제공하기 위해서 Broker 서버를 증설하여 Monitoring System으로부터 각각의 Broker 내부 컴포넌트의 수행시간을 측정하여 저장하고, 저장된 데이터에 대하여 각 Broker들에 대한 우선순위를 결정하는 테이블을 작성한다. 사용자로부터 Query를 입력받는 User Interface는 Broker의 Ranking Table을 참조하여 다수의 Query 수행을 여러 서버로 분산처리하게 함으로써 성능에 대한 신뢰성을 향상 시킬 수 있는 Load Balancing System을 제안한다.할 때 가장 효과적인 라우팅 프로토콜이라고 할 수 있다.iRNA 상의 의존관계를 분석할 수 있었다.수안보 등 지역에서 나타난다 이러한 이상대 주변에는 대개 온천이 발달되어 있었거나 새로 개발되어 있는 곳이다. 온천에 이용하고 있는 시추공의 자료는 배제하였으나 온천이응으로 직접적으로 영향을 받지 않은 시추공의 자료는 사용하였다 이러한 온천 주변 지역이라 하더라도 실제는 온천의 pumping 으로 인한 대류현상으로 주변 일대의 온도를 올려놓았기 때문에 비교적 높은 지열류량 값을 보인다. 한편 한반도 남동부 일대는 이번 추가된 자료에 의해 새로운 지열류량 분포 변화가 나타났다 강원 북부 오색온천지역 부근에서 높은 지열류량 분포를 보이며 또한 우리나라 대단층 중의 하나인 양산단층과 같은 방향으로 발달한 밀양단층, 모량단층, 동래단층 등 주변부로 NNE-SSW 방향의 지열류량 이상대가 발달한다. 이것으로 볼 때 지열류량은 지질구조와 무관하지 않음을 파악할 수 있다. 특히 이러한 단층대 주변은 지열수의 순환이 깊은 심도까지 가능하므로 이러한 대류현상으로 지표부근까지 높은 지온 전달이 되어 나타나는 것으로 판단된다.의 안정된 방사성표지효율을 보였다. $^{99m}Tc$-transferrin을 이용한 감염영상을 성공적으로 얻을 수 있었으며, $^{67}Ga$-citrate 영상과 비교하여 더 빠른 시간 안에 우수한 영상을 얻을 수 있었다. 그러므로 $^{99m}Tc$-transierrin이 감염 병소의 영상진단에 사용될 수 있을 것으로 기대된다.리를 정량화 하였다. 특히 선조체에서의 도파민 유리에 의한 수용체 결합능의 감소는 흡연에 의한 혈중 니코틴의 축적 농도와 양의 상관관계를 보였다(rho=0.9, p=0.04). 결론: $[^{11}C]raclopride$ PET을 이용하여 비흡연 정

  • PDF

단면 형상 영상을 이용한 3차원 모델 검색 (3D Model Retrieval Using Sliced Shape Image)

  • 박유신;서융호;윤용인;권준식;최종수
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.27-37
    • /
    • 2008
  • 멀티미디어 기술과 콘텐츠의 발달로 3차원 데이터의 사용 범위가 넓어지고, 이를 보다 효율적으로 관리하고 검색하기 위한 시스템이 필요하다. 본 논문은 효율적인 3차원 모델의 형상 기반 검색을 하기위해 모델의 특징을 추출하는 단면 형상 영상 방법을 제안한다. 3차원 모델의 특징 기술자는 모델에 대한 위치, 회전, 크기에 불변해야 하므로 모델을 정규화 시키는 작업이 필요하다. 본 논문에서는 주성분 분석 방법을 이용하여 정규화하였다. 제안한 알고리즘은 주성분 분석을 통해 각 축의 방향 성분을 찾고, 각 축에 직교하는 n 개의 평면을 생성한다. 이 평면은 각 축의 방향과 직교 성분을 갖으며 단면 형상 영상을 구하는데 사용된다. 단면 형상 영상은 3차원 모델과 각 평면이 교차해서 생기는 2차원 평면 영상이다. 제안한 3차원 모델의 특징 기술자는 단면 형상 영상의 중심점과 2차원 형상(shape)을 이루는 직선까지의 유클리디안 거리(distance)값들의 분포도이다. 검색 성능 평가는 MPEG-7에서 제시한 표준 평가 방법인 표준화된 수정 검색 순위의 평균(ANMRR)을 이용하였고 제안한 방법의 우수성을 실험 결과를 통해 입증하였다.