• 제목/요약/키워드: Density query

검색결과 27건 처리시간 0.018초

질의응답시스템에서 정답 특징에 관한 실험적 분석 (Experimental Analysis of Correct Answer Characteristics in Question Answering Systems)

  • 한경수
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권5호
    • /
    • pp.927-933
    • /
    • 2018
  • 자연어 질문에 대해 답변을 찾아 제공하는 질의응답시스템의 오류에 가장 큰 영향을 미치는 요소 중 하나가 질문으로 정답을 포함하고 있을 만한 문서나 단락을 검색하는 단계이다. 검색의 성능 향상을 위해서는 정답 포함 문서 및 단락의 특징을 잘 이해해야 한다. 본 논문은 질문, 정답 포함 문서, 정답 미포함 문서로 구성된 말뭉치를 사용하여 정답 문서에는 질문 단어가 얼마나 많이 출현하는지, 출현 위치는 어떻게 분포하는지, 질문과 정답 문서의 주제는 얼마나 유사한지 등을 실험적으로 분석한다. 이를 통해 질의응답시스템을 위한 기존의 검색 연구 결과들에 대한 원인을 설명하고 효과적인 검색 단계의 필요 요소에 관해 논의한다.

데이터 웨어하우스에서 클러스터링 기법을 이용한 실체화 뷰 선택 알고리즘 (Materialized View Selection Algorithm using Clustering Technique in Data Warehouse)

  • 양진혁;정인정
    • 한국정보처리학회논문지
    • /
    • 제7권8호
    • /
    • pp.2273-2286
    • /
    • 2000
  • 데이터 웨어하우스에서 실체화 할 뷰들을 알맞게 선택하는 것은 분석적인 질의에 대한 정확하고 신속한 응답을 얻기 위해서 대단히 중요한 문제이다. 기존의 뷰 선택 알고리즘들에서는 릴레이션 전체가 실체화 뷰들로서 고려되었다. 그러나, 릴레이션의 부분 대신 전체를 실체화한다는 것은 시간과 공간 비용측면에서 좋지 못한 성능을 초래한다. 따라서, 우리는 기존 뷰 선택 알고리즘들에서의 문제점을 극복하기 위해서 개선된 실체화 뷰 선택 알고리즘을 제안한다. 제안된 알고리즘 ASVMRT(Algorithm for Selection on Views to Materialize using Reduced Table)에서는 먼저 속성-값들의 농도에 기반을 둔 자동 클러스터링을 사용하여 축약 테이블들을 데이터 웨어하우스에서 생성한 다음, 원래의 베이스 릴레이션들의 조합 대신에 축약 테이블들의 조합을 실체화 뷰들로 고려한다. 제안한 알고리즘의 타당성 검증을 위하여 우리는 실험결과에서 시간 및 공간 모두에서 기존 알고리즘들보다 약 1.8배의 성능향상이 있음을 보인다.

  • PDF

데이터 웨어하우스에서 클러스터링 기법을 이용한 실체화 뷰 선택 알고리즘 (Materialized View Selection Algorithm using Clustering Technique in Data Warehouse)

  • 양진혁;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.28-35
    • /
    • 2000
  • 데이터 웨어하우스에서 실체화 할 뷰들을 알맞게 선택하는 것은 분석적인 질의에 대한 정확하고 신속한 응답을 얻기 위해서 대단히 중요한 문제이다. 기존의 알고리즘들에서는 릴레이션 전체가 실체화 뷰들로서 고려되었다. 그러나, 릴레이션의 부분 대신 전체를 실체화한다는 것은 시간과 공간 비용측면에서 좋지 못한 성능을 초래한다. 따라서, 우리는 이러한 문제를 해결함과 동시에 데이터 웨어하우스의 성능을 향상시키기 위해서 새로운 실체화 뷰 선택 알고리즘을 제안한다. 제안된 알고리즘 ASVMR(Algorithm for Selection of Views to Materialize using Reduced table)에서는 먼저 속성-값들의 농도에 기반을 둔 자동 클러스터링을 사용하여 축약 테이블들을 데이터 웨어하우스에서 생성하고, 그리고 원래의 베이스 릴레이션들의 조합 대신에 축약 테이블들의 조합을 실체화 뷰들로 고려한다. 실험결과에서 시간 및 공간 모두에서 기존 알고리즘들보다 약 1.8배의 성능향상이 있음을 알 수 있다.

  • PDF

이동 데이타베이스 시스템에서 데이타의 위치와 영역 특성을 고려한 캐쉬 교체 기법 (Cache Replacement Strategies considering Location and Region Properties of Data in Mobile Database Systems)

  • 김호숙;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권1호
    • /
    • pp.53-63
    • /
    • 2000
  • 최근 저가의 무선 통신 기술의 발달과 고성능 이동 컴퓨팅 장비의 보급에 따라 이동 컴퓨팅 시장은 점차로 확대되는 추세에 있다. 이동 컴퓨팅 환경에서의 제한된 대역폭, 잦은 단절과 배터리 제한 등의 제약성에 효율적으로 대처하기 위하여 여러 방법이 제안되었고, 특히 지구국에서 전송된 데이타 중 향후 사용 가능성이 높은 데이타를 캐쉬에 저장하고 이용하는 캐쉬 기법에 대한 많은 연구가 이루어지고 있다. 그러나 기존의 캐쉬 교체 기법들은 사용자의 이동성과 데이타의 공간 속성에 의한 특성을 고려하지 못하고 있기 때문에 그 효율성에서 한계를 가지고 있다. 본 논문은 이동 호스트의 위치 변화에 따라 이동 호스트의 캐쉬 내에 저장된 데이타의 가치와 의미가 변경되는 것을 보인다. 또한 지리(geographic) 데이타의 공간적 위치(location)와 지리 데이타가 영향을 미치는 공간적 범위 즉 영역 (region)을 데이타의 공간 속성 (spatial attributes)으로 정의하고, 시간에 따른 사용자의 이동성과 데이타의 공간 속성을 효과적으로 지원하는 새로운 캐쉬 교체 방법들을 제안하였다. 기존의 방법과 본 논문에서 제안한 캐쉬 교체 방법의 비교를 통하여 이동 호스트의 위치와 연관된 질의에 대한 성능 평가를 수행한 결과, 본 논문에서 제안한 캐쉬 교체 방법에 의한 캐쉬 적중률의 향상을 입증하였다. 또한 데이타 밀집도에 따라 캐쉬 교체 방법들의 성능이 변화함을 밝히고 이를 이용하여 이동 호스트가 지나가는 대상 지역의 데이타 밀집도에 따라 서로 다른 캐쉬 교체 방법의 선택이 필요함을 제시 하였다.

  • PDF

DGR-Tree : u-LBS에서 POI의 검색을 위한 효율적인 인덱스 구조 (DGR-Tree : An Efficient Index Structure for POI Search in Ubiquitous Location Based Services)

  • 이득우;강홍구;이기영;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권3호
    • /
    • pp.55-62
    • /
    • 2009
  • 유비쿼터스 컴퓨팅 환경에서의 LBS, 즉 u-LBS는 실세계의 수많은 객체가 위치정보와 밀접히 연관된 대용량 데이타를 대상으로 한다. 특히, 사용자의 위치 정보와 관련하여 검색하려고 하는 객체인 POI에 대한 빠른 검색이 중요하다. 따라서 u-LBS에서 POI의 효율적인 검색을 위한 인덱스 구조에 대한 연구가 필요하다. 본 논문에서는 u-LBS에서 정적 POI를 대상으로 이를 효율적으로 검색하기 위한 DGR-Tree를 제시한다. DGR-Tree는 변형된 R-Tree를 기본 인덱스로 하고 동적 레벨 그리드를 보조 인덱스로 사용하는 구조이다. DGR-Tree는 점 데이타에 적합하도록 최적화하고 있으며 리프 노드 간 겹침 문제를 해결한다. DGR-Tree에서 동적 레벨 그리드는 점 데이타의 밀집도에 따라 동적으로 구성되며, 각 셀은 DGR-Tree의 리프 노드와 연계를 위한 포인터를 저장하여 리프 노드를 직접 접근하도록 함으로써 인덱스 접근 성능을 향상시킨다. 또한, 본 논문에서는 DGR-Tree를 위한 KNN 검색 알고리즘을 제시한다. 이 알고리즘에서는 KNN 검색 시 후보 셀에 빠르게 접근하기 위하여 동적 레벨 그 리드를 활용하며, 후보를 노드별로 구분하여 저장함으로써 후보 리스트 내에서의 정렬 비용을 감소시킨다. 마지막으로 실험을 통해 DGR-Tree의 우수성을 입증하였다.

  • PDF

벨 에포크와 다다이즘 - 근대문화의 총체와 해체 (Belle Epoque and Dadaism in the Modern Culture)

  • 이병수
    • 비교문화연구
    • /
    • 제33권
    • /
    • pp.171-192
    • /
    • 2013
  • The article is a research about the Belle Epoque era and Dadaism in the modern culture as a whole and separate. The years from 1890s to 1914, is known as the Belle Epoque era, in which the European continent including France had developed the climax of the modern culture after the Renaissance. At the same time, it was the period where the postmodern developments were being spread, leading to the present days. Moreover, the main ideologies in art that led to the cultural advancement of the time were impressionism, cubism, art nouveau, evolutionized painting category, symbolism and futurism. It was a literature category that was maintained to present Dadaism and surrealism. Dadaism began since the magazine, Bulletin Dada was published, originating in 1916 by Tristan Tzara of Zurich, Switzerland during the WWI. The extreme motto that the Dadaists supported was a contradiction, as they had to dissolve from their own art movements and expression techniques. However, until Andre Breton introduced 'Manifeste du Surrealisme' in 1924, the "Dada group" had a tremendous influence in France as an epicenter and rejected the modern cause and art that continued during the time, thus attempting its dissolution. First, they rejected the ideology, ethics and customs of rationalism from the previous system and demonstrate an anarchical and anti-bourgeoisie characteristic. They also reject the French lucid thoughts and the artistic techniques. They strongly emphasized on their motto "The idea is created from the mouth", while reframing from the philosophical ideology and at the same time, attempting to express the psychical unconsciousness. Second, the most important catchphrase that the Dadaists supported was the theory of negation. The question "Why do you write?" connotes the negative consciousness about the artistic value and the stereotyped method of the preexisting writing and drawing. Third, the Dadaists bring forward a radical query about all of the former esthetic and morals, and reveal an admirable resistance spirit. They emphasized on the slogan "Dada, means nothing" and insist on 'the anti-literal Dada, anti-artistic Dada, anti-musical Dada'. The Dadaist movement manifested their resistant spirit and the new artistic spirit through the publication of , , and most importantly through the magazine . Fourth, the Dadaists embodied the volume, density, and quality into an image through the auto-technical, cubistic writings and drawings. They ignored the fixed form of arrangements, verses, and rhymes of a poetic diction. The Dadaists utilized an unfamiliar and inversed expression method of applying the combination of the size of print, or capital letters and lowercase letters, even combining printed and handwritten writings. As presented, the auto-technical and cubistic characteristic of expressing the auto-psychical ideology into writing is called as the radical aesthetic and moral and can be considered as the most essential cause of the Dadaists' avant-garde features. As a conclusion, Dadaism demonstrated dual characteristics of consuming the nutritive elements of the modern culture through the most powerful resistance and liberation of the artistic movement of the Belle Epoque era, where at the same time, it deconstructed the modern art. By revolting against the former grounds and expression techniques, and dominating the era with the new artistic spirit, their resistant actions were artistic movements that symbolized the dissolution of the modern times. Moreover, the Dada's expressionism and resistance of saying "There's nothing" can be evaluated as postmodernity's initiative of outweighing the modern history and opening the door for new period of nowadays.

지능형 검색엔진을 위한 색상 질의 처리 방안 (Color-related Query Processing for Intelligent E-Commerce Search)

  • 홍정아;구교정;차지원;서아정;여운영;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.109-125
    • /
    • 2019
  • 지능형 전자상거래 검색 엔진에 대한 관심이 커지면서, 검색 상품의 특징을 지능적으로 추출하고 활용하기 위한 연구들이 수행되고 있다. 특히 전자상거래 지능형 검색 엔진에서 상품을 검색 할 때, 제품의 색상은 상품을 묘사하는 중요한 특징 중에 하나이다. 따라서 사용자의 질의에 정확한 응답을 위해서는 사용자가 검색하려는 색상과 그 색상의 동의어 및 유의어에 대한 처리가 필요하다. 기존의 연구들은 색상 특징에 대한 동의어 처리를 주로 사전 방식으로 다뤄왔다. 하지만 이러한 사전방식으로는 사전에 등록되지 않은 색상 용어가 질의에 포함된 경우 처리하지 못하는 한계점을 가지고 있다. 본 연구에서는 기존에 사용하던 방식의 한계점을 극복하기 위하여, 실시간으로 인터넷 검색 엔진을 통해 해당 색상의 RGB 값을 추출한 후 추출된 색상정보를 기반으로 유사한 색상명들을 출력하는 모델을 제안한다. 본 모델은 우선적으로 기본적인 색상 검색을 위해 671개의 색상명과 각 RGB값이 저장된 색상 사전을 구축하였다. 본 연구에서 제시한 모델은 특정 색상을 검색하는 것으로 시작하며, 검색된 색상이 색상 사전 내 존재하는 지 유무를 확인한다. 사전 내에 검색한 색상이 존재한다면, 해당 색상의 RGB 값이 기준 값으로 사용된다. 만일 색상사전 내에 존재하지 않는다면, Google 이미지 검색 결과를 크롤링하여 각 이미지의 특정 영역 내 RGB값들을 군집화하여 구한 평균 RGB값을 검색한 색상의 기준 값으로 한다. 기준 RGB값을 앞서 구축한 색상 사전 내의 모든 색상의 RGB 값들과 비교하여 각 R, G, B 값에 있어서 ${\pm}50$ 내의 색상 목록을 정렬하고, RGB값 간의 유클리디안 거리 유사도를 활용하여 최종적으로 유사한 색 상명들을 출력한다. 제안 방안의 유용성을 평가하기 위해 실험을 진행하였다. 피설문자들이 생각하는 300 개의 색상 이름과 해당 색상 값을 얻어, 본 연구에서 제안한 방안을 포함한 총 네가지 방법을 통해 얻은 RGB 값들과 피설문자가 지정한 RGB값에 대한 비교를 진행했다. 인간의 눈을 반영하는 측정 기준인 CIELAB의 유클리드안거리는 평균 13.85로 색상사전만을 활용한 방안의 30.88, 한글 동의어사전 사이트인 워드넷을 추가로 활용한 방안의 30.38에 비해 비교적 낮은 색상 간의 거리 값을 보였다. 연구에서 제시하는 방안에서 군집화 과정을 제외한 방안의 색 차는 13.88로 군집화 과정이 색 차를 줄여준다는 것을 확인할 수 있었다. 본 연구에서는 기존 동의어 처리 방식인 사전 방식이 지닌 한계에서 벗어나기 위해, 사전 방식에 새로운 색상명에 대한 실시간 동의어 처리 방식을 결합한 RGB값 기반의 새로운 색상 동의어 처리 방안을 제안한다. 본 연구의 결과를 활용하여 전자상거래 검색 시스템의 지능화에 크게 기여할 수 있을 것이다.