• 제목/요약/키워드: Similar Keyword

검색결과 114건 처리시간 0.025초

허밍 질의 처리 시스템의 성능 향상을 위한 효율적인 빈번 멜로디 인덱싱 방법 (An Efficient Frequent Melody Indexing Method to Improve Performance of Query-By-Humming System)

  • 유진희;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권4호
    • /
    • pp.283-303
    • /
    • 2007
  • 최근 방대한 양의 음악데이타를 효율적으로 저장하고 검색하기 위한 방법의 필요성이 증대되고 있다. 현재 음악 데이타 검색에서 가장 일반적으로 쓰이는 방법은 텍스트 기반의 검색 방법이다. 그러나 이러한 방법은 사용자가 키워드를 기억하지 못할 경우 검색이 어려울 뿐만 아니라 키워드와 정확하게 일치하는 정보만 검색해 주기 때문에 유사한 내용을 가진 정보를 검색하기에 부적절하다. 이러한 문제점을 해결하기 위해 본 논문에서는 내용 기반 인덱싱 방법(Content-Based Indexing Method)을 사용하여 사용자가 부정확한 멜로디(Humming)로 질의하였을 경우라도 원하는 음악을 효율적으로 찾아주는 허밍 질의처리 시스템(Query-By-Humming System)을 설계한다. 이를 위해 방대한 음악 데이타베이스에서 한 음악을 대표하는 의미 있는 멜로디를 추출하여 인덱싱하는 방법을 제안한다. 본 논문에서는 이러한 의미 있는 멜로디를 사용자가 자주 질의할 가능성이 높은 멜로디로서 하나의 음악에서 여러 번 나타나는 반면 멜로디와 긴 쉼표 후에 시작되는 쉼표 단위 멜로디로 정의한다. 실험을 통해 사용자들이 이들 멜로디를 자주 질의한다는 가정을 증명하였다. 본 논문은 성능 향상을 위한 3가지 방법을 제안한다. 첫 번째는 검색속도를 높이기 위해 인덱스에 저장할 멜로디를 문자열 형태로 변환한다. 이때 사용되는 문자 변환 방법은 허밍에 포함된 에러를 허용한 방법으로써 검색 결과의 정확도를 높일 수 있다. 두 번째는 사용자가 자주 질의할 가능성이 높은 의미 있는 멜로디를 인덱싱 하여 검색 속도를 높이고자 한다. 이를 위해 신뢰도가 높은 의미 있는 멜로디를 생성하는 빈번 멜로디 추출 알고리즘과 쉼표 단위 멜로디 추출 방법을 제안한다. 세 번째로는 정확도를 향상시키기 위한 3단계 검색 방법을 제안한다. 이는 데이타베이스 접근을 최소화하여 정확한 검색 결과를 얻기 위하여 제안되었다. 또한 기존 허밍 질의 처리 시스템의 대표적인 인덱싱 방법으로 제안되었던 N-gram 방법과의 성능 비교를 통해 본 논문이 제안하는 방법의 성능이 보다 더 향상되었음을 검증하였다.

워드넷 기반 협동적 평가와 하이퍼링크를 이용한 검색엔진의 성능 향상 (Improving Performance of Search Engine By Using WordNet-based Collaborative Evaluation and Hyperlink)

  • 김형일;김준태
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.369-380
    • /
    • 2004
  • 본 논문에서는 정색엔진의 성능 향상을 위하여 질의어의 모호성 해결과 새로운 가중치 부여 방식을 제안한다. 일반적인 검색엔진은 질의어의 형태와 같은 것들이 포함되어 있는 웹 페이지를 결과로 보여주는 내용기만 방식을 사용하고 있다. 검색 결과로 나타난 웹 페이지들의 순위를 결정하는데 있어서도 주어진 질의어와 웹 페이지 사이의 키워드 매칭에 의한 내용기반 방식을 사용한다. 이와 같이 질의어의 형태만으로 웹페이지들과 유사도를 비교한다는 것은 정확한 검색에 많은 장애를 준다. 또한 질의어의 의미에 모호성이 존재할 경우에는 사용자의 의도와 관련 없는 것들이 결과로 나타나기도 한다. 이러한 원인의 발생은 일반적인 검색엔진들이 내용기반 방법을 기반으로 웹 검색에 이용되기 때문이다. 본 논문에서는 질의어에 모호성이 있는 경우 워드넷을 이용하여 모호성을 해결하도록 하는 사용자 인터페이스를 구현했다. 그리고 사용자의 클릭 수를 각 웹 페이지의 가중치에 누적함으로써 다수 사용자의 협동적 평가에 따른 웹 페이지의 중요도가 검색 순위에 반영되도록 하였다. 클릭수의 누적에 있어서 질의어의 의미 카테고리별로 가중치를 구분하여 저장함으로써 보다 세분화된 웹 페이지 가중치 부여 방식을 사용하였다 그리고 점 페이지의 하이퍼링크를 웹 페이지의 가중치에 적용하였다. 웹 페이지의 가중치에 하이퍼링크를 적용함으로써 웹 페이지의 대표성을 가중치에 부여하여 가중치에 신뢰도를 증가시켰다. 실험용 정색엔진이 일반 검색엔진에 비해 높은 검색 정확도를 나타내는 것을 실험을 통해 확인하였다.

안경원의 브랜드 네임 유형에 관한 연구 - 대구지역 안경원 브랜드를 중심으로 - (A Study on the Brand Name Type of Optical Shop - Centric on Optical Shop in Daegu Region -)

  • 홍성일;손정식
    • 한국안광학회지
    • /
    • 제20권4호
    • /
    • pp.415-423
    • /
    • 2015
  • 목적: 대구지역 안경원 브랜드를 중심으로 안경원 브랜드 네임의 유형 연구를 통해 새로운 브랜드 네이밍에 필요한 객관적인 자료로 활용하고자 하였다. 방법: 브랜드 네임의 개념과 기능 등의 브랜드 네임 특성들을 살펴보고 대구지역의 안경원 브랜드에 대한 한글과 영어, 국 영문 혼합, 음절 그리고 서술적, 암시적, 조어적 브랜드 네임의 유형과 대안의 창출 제시, 많이 사용된 키워드 분석 등으로 브랜드 네임 유형을 분석하였다. 결과: 한글의 자음에는 'o'이 가장 많았고 다음으로 'ㅅ' 이었다. 한글과 영어, 조합 등에서는 브랜드 네임의 57.1%의 과반수가 한글을 사용하는 것으로 나타났고 영어를 사용한 브랜드 네임도 약 32.7%가 되었다. 음절 수는 3음절이 30.4%로 많았지만 2, 4음절도 비슷한 빈도수로 각 29.7%와 25.0%를 차지하였다. 암시적, 서술적 유형이 51개, 40개로 각 17.0%와 13.3%로 나타났으며 대안의 창출에 따른 유형에서는 단어를 조합한 유형이 가장 많았고 상징물 사용이 뒤를 이었다. 기타 유형에서는 타 업종의 이름과 안경원이 소재하고 있는 지역명을 사용하고 있는 브랜드 네임이 많았다. 마지막으로 안경원 브랜드 네임에 사용된 키워드로는 '아이(eye)'가 45회로 빈도수가 가장 많았고 '당'과 '안경'이라는 키워드 순으로 사용된 것으로 나타났다. 결론: 창업을 위해 상호를 만들고 알리는데 그치는 단순한 이름이 아니라 들어서 기억하고 부르기 쉬우며 의미가 있는 브랜드 네임, 안경원에 대한 바람직한 연상과 독특하고 호감을 주는 창의적인 브랜드 네임이 되어야 한다.

빅데이터를 활용한 기후변화와 연계된 생태계서비스 연구 동향분석 (Analysis of Research Trends of Ecosystem Service Related to Climate Change Using Big-data)

  • 서자유;최요한;백지원;김수경;김호걸;송원경;주우영;박찬
    • 한국환경복원기술학회지
    • /
    • 제24권6호
    • /
    • pp.1-13
    • /
    • 2021
  • This study was performed to investigate the ecosystem service patterns in relation to climate change acceleration utilizing big data analysis. This study aimed to use big data analysis as one of the network of views to identify convergent thinking in two fields: climate change and ecosystem service. The keywords were analysed to ascertain if there were any differences in the perceiving problems, policy direction, climate change implications, and regional differences. In addition, we examined the research keywords of each continent, the centre of ecosystem service research, and the topics to be referred to in domestic research. The results of the analysis are as follows: First, the keyword centrality of climate change is similar to the detailed indicators of The Intergovernmental Science-Policy Platform on Biodiversity and Ecosystem Services (IPBES) regulations, content, and non-material ecosystem services. Second, the cross-analysis of terms in two journals showed a difference in value-oriented point; the Ecosystem Service Journal identified green infrastructure as having economic value, whereas the Climate Change Journal perceives water, forest, carbon, and biodiversity as management topics. The Climate Change Journal, but not the former, focuses on future predictions. Third, the analysis of the research topics according to continents showed that water and soil are closely related to the economy, and thus, play an important role in policy formulation. This disparity is due to differences in each continent's environmental characteristics, as well as economic and policy issues. This fact can be used to refer to the direction of research on ecosystem services in Korea. Consistent with the recent trend of expanding research regarding the impacts of climate change, it is necessary to study strategies to scientifically predict and respond to the negative effects of climate change.

내용기반 이미지 검색에 있어 이미지 속성정보를 활용한 검색 효율성 향상 (A Study on Increasing the Efficiency of Image Search Using Image Attribute in the area of content-Based Image Retrieval)

  • 모영일;이철규
    • 한국시뮬레이션학회논문지
    • /
    • 제18권2호
    • /
    • pp.39-48
    • /
    • 2009
  • 본 연구는 내용 기반 이미지 검색 관련한 기존의 이미지 검색 방식에 관한 고찰을 통하여 이미지 검색의 한계점을 살펴보고, 보다 효율적인 내용기반의 이미지 검색을 위한 사용자용 인터페이스와 이미지 속성 활용 방법에 대하여 제안 하고자 한다. 현재 이미지 검색에 관련된 대부분의 연구들은 내용기반을 위주로 연구가 진행되고 있으며, 대표적으로는 이미지의 색상, 질감, 모양, 전체적인 이미지 형태를 기준으로 검색을 시도하고 있다. 하지만 여러 가지 기술적 한계로 인하여 만족할 만한 검색결과를 얻지 못하고 있다. 이에 본 연구에서는 내용기반 이미지 검색과 종래의 키워드 검색 방식을 적용한 새로운 검색방식을 제안하였다. 이는 이미지 내에 텍스트로 속성을 부여하는 방법과, 이미지 내의 속성정보들을 키워드화 하여 검색에 활용함으로써 이미지를 빠르게 검색하는 방법에 대한 것이다. 또한 인터넷상에서의 질의어 생성을 위한 사용자 인터페이스용 시뮬레이션과 이미지 속성을 기반으로 한 검색 시스템개발 시 활용할 수 있는 분야로 인터넷 쇼핑몰의 의류상품 검색을 중심으로 설명 하였다. 본 연구로 인해 인터넷 쇼핑몰에서 새로운 구매유형이 추가될 수 있고, 유사 이미지 검색 분야의 발전에 기여할 것이다.

온톨로지 시각화를 활용한 사용자 리뷰 분석 기반 영화 추천 시스템 (Movie Recommended System base on Analysis for the User Review utilizing Ontology Visualization)

  • 문성민;김기남;최경철;이경원
    • 디자인융복합연구
    • /
    • 제15권2호
    • /
    • pp.347-368
    • /
    • 2016
  • 최근 소비자 구전정보에 대한 연구들은 소비자가 제품 구매 과정에서 다른 소비자의 구전에 의한 정보를 활용한다는 연구 결과를 시사하고 있다. 본 연구는 제품에 대한 소비자의 의견을 파악하고 활용할 수 있도록 오피니언 마이닝과 시각화를 통해 도움을 줄 수 있는 방법을 제안하고자 한다. 이를 위해 최근 들어 관람할 영화를 선택할 때 인터넷 상의 영화리뷰를 참고 하는 상황이 증가함을 고려하여 "영화" 도메인의 온톨로지를 구축하고 오피니언 마이닝을 수행하여 시각화 한 후 그 결과에 대해 논하고자 한다. 온톨로지를 구축하는 과정에서 평가요소에 대한 속성 분류뿐만 아니라 평가요소에 대한 서술어 사전을 구성하였다는 점에서 기존의 연구와 차별성이 있으며 분석 결과를 통해 이러한 방법이 오피니언 마이닝에 유효함을 증명하고자 한다. 연구를 통해 도출한 결과는 크게 세 가지로 나누어 볼 수 있다. 첫째, 본 연구에서는 기존에 구축된 온톨로지를 활용하지 않고 키워드 추출과 토픽모델링을 활용하여 영화 도메인에 대한 온톨로지를 구축하는 방법에 대해 서술하였다. 둘째, 개별 영화에 대한 시각화 분석을 시행하여 영화에 대한 관객의 종합적인 의견을 한눈에 파악할 수 있도록 하였다. 셋째, 제품에 대한 평가 결과에 따라 유사한 평가를 받은 제품끼리 군집화 되는 것을 발견하였으며 본 연구의 분석에 사용된 130개의 영화는 크게 3개의 집단으로 군집화 됨을 보였다.

여가 스포츠 참여동기 척도 분석에 관한 연구 (A Study on Scale of Participation Motive for Leisure Sports)

  • 김지영;김승현
    • 한국체육학회지인문사회과학편
    • /
    • 제54권3호
    • /
    • pp.439-452
    • /
    • 2015
  • 본 연구는 여가 스포츠 참여동기에 대한 척도 탐색을 통해, 향후 여가활동으로서의 스포츠 활동 참여동기의 세분화를 통해 이용자의 심리적 반응들을 토대로 하여 지속적으로 스포츠 활동에 참여할 수 있도록 하고, 여가스포츠에 참여의 활성화를 위한 기초적인 자료를 제시하는데 그 목적이 있다. 이러한 목적을 달성하기 위하여 국내 주요 검색사이트를 이용하여 스포츠 참여동기가 연구되어진 1997년부터 2012년까지 석, 박사학위논문, 학술지논문 자료를 수집하였다. 우선 '동기'의 키워드를 먼저 검색하고, 여가 스포츠 참여동기를 수행한 연구들을 수합하였다. 수합된 각 동기의 키워드 검색을 통해 검색어들을 적절하게 조합하고, 띄어쓰기를 체크하여 검색하여 문헌분석을 실시하였다. 그 결과 여가스포츠 참여동기는 참여동기, 내적동기, 외적동기, 여가동기, 기타동기로 구분되어 각각 참여동기는 23개의 요인으로, 내적동기는 17개의 요인, 외적동기 17개 요인, 여가동기 8개 요인, 기타동기는 57개의 요인으로 사용되고 있음이 파악되었다. 각각의 요인들을 토대로 하여 그 의미가 비슷하거나 중복되는 요인들을 제외한 76개의 요인을 여가스포츠 참여동기 연구를 위한 요인으로 사용되고 있음이 파악되었다.

근대의학 논문의 계량학적 방법을 통한 연구 경향 비교 분석 - 의학전문학교 학술지 2종을 중심으로 - (A Comparative Analysis of Research Trends in Korean Modern Medicine: Focusing on Two Journals of Medical School)

  • 서미진;이지수
    • 한국비블리아학회지
    • /
    • 제34권4호
    • /
    • pp.29-54
    • /
    • 2023
  • 본 연구는 한국 근대의학을 대표하는 의학교육기관에서 발행된 논문을 계량학적으로 분석하여 공통 및 학술지별 연구 주제를 파악하고 기관에 따른 저자 특성, 연구 경향을 살펴보고자 하였다. 경성의학전문학교와 경성제국대학 의학부에서 발행한 학술지 2종에 수록된 연구 논문 총 682건을 대상으로 저자 분석, 빈도 분석, 주제 분석을 수행하였다. 연구 결과, 경성의전 기요에 참여한 저자의 소속은 학교 및 병원 등 다양한 기관이 조사되었으며, 기초의학 전공과 임상의학 전공이 비슷한 비율을 차지하였다. 경성제대 의학부 기요는 학교 소속 저자만이 참여하였으며, 기초의학 전공은 96.33%임에 비해 임상의학 전공은 3.36%로 현저히 적었다. MeSH on Demand를 활용하여 논문 제목에서 추출한 MeSH 용어를 대상으로 동시출현 네트워크 분석을 실시한 결과, 두 학술지에서 공통으로 등장한 중심 주제어는 'erythrocytes'로 여러 장기 및 질병에 따른 적혈구 상태를 분석한 연구가 진행되었다. 빈도 분석 결과, 두 학술지에서 공통으로 혈액 및 혈구에 초점을 맞춘 연구와 당시 유행했던 질병인 빈혈과 결핵에 대한 연구가 등장하였다. 각 학술지의 주요 연구 주제를 비교한 결과, 경성의전 기요는 염증 질환에 대한 연구와 사람을 대상으로 한 임상병리학적 연구가 다수 확인되었으며, 경성제대 의학부 기요는 동물을 대상으로 한 해부학적 연구와 의약품에 대한 약리학적 연구가 주로 진행되었다. 본 연구를 통하여 설립 목표가 다른 두 의학전문학교에서 진행된 연구 주제와 주요 키워드를 파악하고, 학술지에 따른 연구 영역의 차이를 확인할 수 있었다.

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.

온라인 상품 판매 성과에 영향을 미치는 상품 소개글 효과 측정 기법 (Measuring the Economic Impact of Item Descriptions on Sales Performance)

  • 이동원;박성혁;문송천
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.1-17
    • /
    • 2012
  • 온라인 상에서 판매되는 상품은 매우 다양하지만, 소비자에게 판매 가격을 제시하거나 소개글을 통해서 상품에 대한 구체적인 설명을 제공한다는 점은 모든 상품에 있어서 가장 기본이 되는 공통적인 특징이다. 만약, 상품의 실제 품질이나 가격과는 독립적으로 상품 소개글이 판매에 미치는 영향력을 파악할 수 있다면 어떠한 소개글이 상품의 판매를 촉진하는 측면에서 더 좋은 글인지 분별할 수 있게 된다. 이런 관점에서 본 연구는 상품 소개글과 판매 성과의 관계를 파악하기 위한 목적으로 수행되었으며, 구체적으로는 온라인 시장에서 한글로 작성된 상품 소개글에 쓰인 각각의 표현 별로 소비자가 구매를 결정하는 데에 어떤 영향을 미치는지를 분석하고자 하였다. 한글 형태소 분석기를 사용하여 국내 앱 시장에서 수집된 앱 소개글 및 판매이력 데이터로부터 상품을 설명하는 주요 속성과 그 속성에 대한 평가를 추출하였으며, 추출된 키워드를 입력 변수로 구성한 계량경제학 모형을 구축하였고, 구체적으로 특정 표현들이 판매 성과에 미치는 영향을 구축된 모형을 사용하여 계량적으로 측정하였다. 앱의 카테고리 별로 표현의 종류가 상이하게 나타남이 관찰됨에 따라, 분석은 각 카테고리 별로 수행되었다. 유료 앱과 무료 앱에 대해서 데이터 분석을 수행한 결과, 판매 성과에 영향을 미치는 '속성과 평가' 키워드를 그 영향력의 크기 별로 파악할 수 있었으며, 특히 무료 앱의 경우는 무료로 이용할 수 있음에도 불구하고 품질이 좋다는 것을 강조했을 때 판매량을 더 높일 수 있다는 것이 확인되었다. 본 연구는 모바일 앱에 대해 수행되었으나, 온라인에서 거래되는 다양한 상품에 대해서도 소개글이 판매 성과에 미치는 영향을 분석할 수 있는 모형으로 활용될 수 있다. 마지막 장에서는 기업의 마케팅 매니저가 본 연구에서 제시하는 연구 방법론과 분석 결과를 활용할 수 있는 방안을 제시하였다.