• Title/Summary/Keyword: 유사 키워드

검색결과 311건 처리시간 0.027초

시맨틱 주석을 이용한 내용 기반 데이터 검색 (Content based data search using semantic annotation)

  • 김병곤;오성균
    • 디지털콘텐츠학회 논문지
    • /
    • 제12권4호
    • /
    • pp.429-436
    • /
    • 2011
  • 인터넷검색의 대상이 되는 각종 문서, 이미지, 동영상 등의 자료가 늘어날수록 이에 대한 효율적인 검색의 문제가 중요시되고 있다. 효율적인 검색의 관점은 초기의 키워드 중심의 검색에서 자료가 지니는 의미적인 요소들을 종합적으로 판단하여 이들의 연관성을 찾아 검색하는 의미적 검색의 방향으로 진행되고 있다. 이에 따라, 각종 자료에 대한 의미적 검색을 위하여 메타데이터 처리를 위한 시맨틱 주석을 생성, 운영하는 시스템들이 연구되어 왔다. 그러나, 동일한 종류의 자료에 대한 주석 위주로 진행되었고, 각기 다른 방법과 형태로 생성된 주석 데이터 간에는 호환적인 검색이나 처리가 어렵다. 본 연구에서는 이 문제를 해결하기 위하여 다양한 주석문서를 내용분석에 따라 단계별 형태로 분류하고, 상이한 종류의 자료 간에도 검색이 가능하도록 문서간의 유사도를 측정하는 방법을 제시하였다. 주석문서간의 유사도 측정은 소스문서와 유사도가 높은 주석문서를 검색하여 결과적으로 자료의 종류나 형태에 상관없이 가장 유사한 내용을 지니는 문서나 이미지, 동영상 등을 검색하는데 사용할 수 있다.

컬러 분포와 WordNet상의 유사도 측정을 이용한 의미적 이미지 검색 (Semantic Image Retrieval Using Color Distribution and Similarity Measurement in WordNet)

  • 최준호;조미영;김판구
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.509-516
    • /
    • 2004
  • 의미기반 이미지 검색에서의 의미적 내용 인식은 주석 위주의 텍스트 정보를 이용하는 것이 일반적이다. 이러한 텍스트 정보 기반 이미지 검색은 전통적인 검색 방법인 키워드 검색 기술을 그대로 사하여 쉽게 구현할 수 있으나, 텍스트의 개념적 매칭이 아닌 스트링 매칭이므로 주석 처리된 단어와 정확한 매칭이 없다면 검색할 수 없는 단점이 있었다. 이에 본 논문에서는 Ontology의 일종인 WordNet을 이용하여 깊이, 정보량, 링크 타입, 밀도 등을 고려한 단어간 의미 유사도를 측정하여 패턴 매칭의 문제점을 해결하고자 한다. 또한, 이미지의 컬러 분포 유사도를 측정하여 저차원 특징과 결합한 의미적 이미지 검색이 가능하도록 설계하였다. 제안된 검색 방안에 대해 'Microsoft Design Gallery Live'의 주석을 포함한 이미지를 대상으로 실험한 결과, 기존 의미기반 검색 시스템보다 향상된 결과를 확인하였다.

빅 데이터 환경에서 계층적 문서 유형 분류를 위한 클러스터링 기반 다중 SVM 모델 (Multi-class Support Vector Machines Model Based Clustering for Hierarchical Document Categorization in Big Data Environment)

  • 김영수;이병엽
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.600-608
    • /
    • 2017
  • 최근 인터넷의 급격한 확장에 따른 정보의 양이 기하급수적으로 증가하고 있다. 그러나 실제 사용자에게 필요한 정보는 극히 일부분으로 사용자가 원하는 정보를 찾는데 까지는 부가적인 시간과 노력이 요구된다. 따라서 검색어로 검색된 문서에 대한 유사도 평가를 통한 계층적 유사 정보와 검색 우선순위에 대한 정보를 제공할 필요성이 있다. 이를 위해서 검색어를 구성하고 있는 키워드의 동시 발생 빈도를 고려한 검색 문서에 대한 유사도를 기반으로 문서 클러스터를 구성하고 SVM을 적용한 빅 데이터 기반 계층적 유형 분류 모델을 제안한다. 계층적 분류방법과 SVM 분류기의 결합은 문서의 계층이 기하급수적으로 늘어나는 웹 문서의 경우에 높은 성능을 얻을 수 있다. 제안된 모델은 정확하고 신속한 검색을 제공하는 정보검색시스템의 응용 모델로 활용될 수 있다.

데이터분석을 이용한 서술형 강의평가 연구 (A Study on the Data Analysis of the Written Comments in Lecture Evaluation)

  • 최정웅;안동규
    • 디지털융복합연구
    • /
    • 제14권11호
    • /
    • pp.101-106
    • /
    • 2016
  • 대학 교육현장에서 강의와 관련한 수많은 비정형화된 데이터가 생산되고 있는데 그중 관심 있게 볼 부분은 학생들의 서술형 강의평가이며, 본 논문에서는 대학에서 시행하는 서술형 강의평가를 활용하여 분석하였다. 분석방법으로 먼저 학기가 끝난 후 수행된 강의평가에서 동일학과 유사과목을 강의했던 교수자 2인을 선택하고 학생들이 평가한 서술형 강의평가 내용에서 기존 문헌연구를 통해 얻은 학습자 상호작용과 관련한 키워드를 추출하고 이를 코사인유사도 분석을 이용해 상호작용 점수를 도출한 후 기존의 5점척도 강의평가 점수와 비교하였다. 분석을 위해 텍스트 마이닝 기법을 활용하였으며 분석결과 수업에서 필요한 학습자 상호작용은 주로 흥미, 기회, 열정, 재미, 참여, 유익, 친절 등으로 나타났다. 기존의 5점 척도 강의평가 점수와 새롭게 도출한 서술형 강의평가 점수를 비교했을 때 유사한 것으로 나타났으며 특히, 상호작용이 높을수록 더 높은 점수가 나타났다. 본 연구에서는 상호작용점수라는 새로운 지표를 만들었고 이에 대한 가능성을 확인하였다. 향후 학과단위 또는 학교단위의 데이터분석을 통해 정성적, 정량적 강의평가 지표를 개발함으로써 기존의 평가방식을 개선할 필요가 있다.

공간 정보를 가지는 데이터셋의 준자동 융합 기법 (Semi-automatic Data Fusion Method for Spatial Datasets)

  • 윤종찬;김한준
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.1-13
    • /
    • 2021
  • 빅데이터 관련 기술이 발달함에 따라 이전에는 처리할 수 없었던 방대한 규모의 데이터를 처리할 수 있게 되었다. 이에 따라 데이터 선정 및 융합 자동화 프로세스 구축은 빅데이터 기반 서비스 구현에 있어 선택이 아닌 필수인 시대가 되었다. 본 논문은 공간 정보를 담고 있는 데이터셋을 융합하여 유의미한 새로운 정보를 생성하기 위한 준자동화 기법을 제안한다. 우선 Node2Vec 모델을 활용하여 주어진 데이터셋의 키워드를 이용해 데이터셋의 임베딩 벡터를 생성한다. 생성된 각 임베딩 벡터를 이용해 코사인 유사도를 계산하여 데이터셋 간의 시멘틱 유사도를 구한다. 이후 사람이 개입하여 그 시멘틱 유사도가 상대적으로 높은 데이터셋 쌍 중에서 공간 정보를 가진 데이터셋을 선별하고, 데이터셋 쌍을 융합하여 시각화한다. 이러한 일련의 준자동 융합 프로세스를 통해 단일 데이터셋으로부터는 얻을 수 없는 유의미한 융합정보를 생성할 수 있음을 보인다.

텍스타일 영상에서의 감성 기반 검색 시스템

  • 김영래;신윤희;김은이
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.82-87
    • /
    • 2009
  • 본 논문에서는 감성 기반으로 텍스타일을 자동으로 색인하고 검색 할 수 있는 시스템을 제안한다. 제안된 시스템은 영상 수집기, 감성 색인기, 검색기(Matcher), 질의 인터페이스로 구성되어 있다. 감성 색인기는 텍스타일 영상에 포함된 컬러와 패턴 정보를 기반으로 감성개념을 인식하고, 이를 이용하여 영상을 색인한다. 이때, 감성 어휘로 고바야시가 정의한 8개 (romantic, natural, casual, elegant, chic, classic, dandy, modern)를 사용한다. 질의 인터페이스에서 사용자는 두 가지 방식으로 질의를 선택할 수 있다. 첫 번째 방법은 감성 키워드를 사용하는 것이고, 두 번째는 사용자의 의도를 설명할 수 있는 영상을 이용하는 예제 기반 질의 방식이다. 질의가 주어지면, 검색기는 랭킹 알고리즘을 사용하여 검색 결과를 생성한다. 이 때, 유사도 비교방식은 선택된 질의방식에 따라 달라진다. 제안된 시스템의 성능을 검증하기 위해 웹 검색에 익숙한 50명(남자: 32명, 여자: 18명)을 대상으로 웹에서 수집한 3,416 장에 대해서 3가지 항목으로 사용자 평가를 하였다. 사용자 평가의 항목인 적합도(Relevance), 노력(Search Effort), 만족도(Satisfaction)의 결과로 사용자가 검색한 결과영상에서 적합도의 수치가 낮게 나왔지만, 만족도와 노력의 수치는 높게 평가되었다. 제안된 시스템에서 사용자는 자신이 선호하는 결과 영상을 상위 40개의 영상 내에서 얻을 수 있었다. 이는 제안된 시스템이 사용자들이 원하는 영상을 효율적으로 검색할 수 있다는 것을 증명했다.

  • PDF

한국어 문형을 이용한 문장 정규화 기반의 FAQ 자동 응답 시스템 (An Automated FAQ Answering System Based on Sentence Normalization Using Korean Sentence Patterns)

  • 배경만;백종탁;고영중;김종훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.172-176
    • /
    • 2008
  • 인터넷 쇼핑몰과 같은 웹사이트에서 FAQ 검색의 중요성은 갈수록 증가되고 있다. 일반적으로 FAQ 검색을 하기 위해서 사용자가 직접 FAQ 리스트에서 FAQ를 찾거나 키워드 검색을 통해 FAQ를 찾는다. 하지만 이 방법은 FAQ 리스트를 찾는데 시간이 오래 걸리고 사용자가 만족하는 결과를 보여주지 못하는 경우가 많다. 이를 해결하기 위해 사용자의 자연어 질의에 대해 자동으로 FAQ를 찾아주는 FAQ 시스템이 필요하다. 자동화된 FAQ 시스템은 사용자의 질의 문장에 대해 FAQ 목록 중에 가장 유사한 FAQ 문장을 찾아준다. 이를 위해 각 문장을 유니그램과 바이그램 단어 집합으로 표현하여 문장 간의 유사도를 계산한다. 본 논문에서는 유니그램과 바이그램 단어 집합뿐만이 아니라 한국어 문형을 기반으로 한 문장 정규화를 통해 단어의 문장 성분 정보와 성분 내 위치 정보를 이용하여 문장을 표현함으로써 자동화된 FAQ 시스템의 성능을 향상 시키는 것을 목표로 한다.

  • PDF

커밋 히스토리에 기반한 버그 및 커밋 연결 기법 (A Technique to Link Bug and Commit Report based on Commit History)

  • 채영재;이은주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권5호
    • /
    • pp.235-239
    • /
    • 2016
  • 커밋-버그 링크는 커밋히스토리(commit history)와 버그 리포트(bug report) 간의 연결(Link)을 뜻한다. 커밋-버그 링크는 소프트웨어 유지보수와 결함 예측, 버그 추적 시스템(Bug Tracking System)에 이용이 되며, 특히 결함 예측 측면에서는 성능면에서의 기반이 된다. 일반적으로 링크를 자동으로 연결하는 방식은 텍스트 유사도(text similarity)나 시간 간격(time interval), 키워드(keyword) 등을 통해서 추출하였다. 하지만 기존 방식은 커밋히스토리(commit history)의 질적인 부분에 의존적이기 때문에 다수의 링크를 놓치게 된다는 단점이 존재한다. 본 논문에서는 커밋히스토리의 메시지(message)부분에만 의존하지 않고, 버그리포트에서 연결된 커밋히스토리의 파일간의 유사도를 이용하여 링크를 연결할 수 있는 방식을 제안하고 실험을 통하여 본 기법의 적용성을 보인다.

사회적경제의 부상과 북한학 연구의 접목에 대한 소고

  • 권영태
    • KDI북한경제리뷰
    • /
    • 제21권10호
    • /
    • pp.3-28
    • /
    • 2019
  • 사회적기업, 협동조합, 소셜벤처 등 사회적경제의 부상으로 이들이 전체 경제에서 차지하는 비중이 커지고 있어 북한, 통일 관련 연구에서도 접목이 필요하다. 사회적경제는 북한·통일 문제와 어떤 연관이 있는지에 대해 통일정책과 통일 역량 강화의 측면에서 나누어 고찰했다. 전자에 포괄되는 주제로는 통일국가의 미래상, 북한경제의 유사성 및 변화가 있다. 후자와 관련되는 주제로는 남북교류협력, 북한이탈주민정책, 통일교육에 대한 함의를 다뤘다. 통일국가의 미래상과 관련하여 사회적경제는 통일경제의 부작용에 대한 완충기제로 작동할 수 있을 것으로 예상된다. 사회적경제는 자본주의의 발전에 따라 제기되는 사회적 문제를 해결하고자 하는 보완적 성격의 경제활동으로 이해된다. 따라서 향후 자유시장경제 방식의 통일이 진행되는 경우, 남한 자본주의의 문제점이 전 한반도로 확산되는 부작용에 대한 대안적 해결방안으로 작동할 수 있을 것으로 기대된다. 사회적경제가 북한경제, 나아가 사회주의 경제와 유사성이 있는지에 대해서는 논란이 있다. 향후 이에 대한 연구 성과에 따라 북한경제의 변화를 추동하는 동력으로서 사회적경제의 영향력을 가늠할 수 있을 것이다. 남북교류협력과 관련해서는 우선, 교류협력이 재개되는 경우 사회적경제기업의 참여를 어떻게 추동하고 지원할 것인지에 대한 대안을 내놓을 필요가 있다. 일반 기업 또한 사회적경제 관점을 활용해 북한 진출에 나설 수 있을 것으로 예상할 수 있고, 이 때 중요한 사회적경제의 키워드는 BOP 시장이다. 사회적경제는 북한이탈주민을 취약계층으로 자리매김하고 있는데, 향후에는 적극적으로 사회적경제의 창업의 주체로 육성할 필요성이 있다는 점도 제기하였다. 통일교육과 관련해서는 대상, 주체, 내용과 관련한 시론적 차원의 접근을 정리하였다. 사회적경제의 부상이 북한학 연구에 미치는 영향에 대해서는 더 많은 새로운 상상력의 발휘가 요구된다.

인스타그램 프로필 사진 유사도 분석을 통한 마약 유통 계정 추적 기술 (Tracking Drug Distribution Accounts Through Similarity Analysis of Instagram Profile Photos)

  • 박은영;조경현;김지연;김창훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.199-201
    • /
    • 2023
  • 국내·외 소셜미디어 사용자가 증가하면서 마약 유통, 불법 촬영물 유포 등과 같은 사이버 범죄가 소셜미디어를 통하여 발생하고 있다. 사이버 범죄 수사를 위해 소셜미디어 크롤링 연구가 진행되고 있지만, 주로 'N번방' 등 불법 촬영물 및 성 착취물 유포와 같은 성범죄 수사를 대상으로 한다. 그러나 최근에는 성범죄뿐 아니라, 소셜미디어를 통한 마약 유통이 급격히 증가하고 있으므로 소셜미디어 크롤링을 통한 마약 수사 기술 개발이 필요하다. 본 논문에서는 소셜미디어 중, 인스타그램의 마약 유통을 추적하기 위해 실제 사용되는 마약 은어를 정의하고, 정의된 은어를 검색 키워드로 입력하여 사용자 계정을 수집하였다. 또한, 수집된 사용자 계정의 프로필 사진을 추출하고 유사도 분석을 수행하여 동일 마약 유통자 식별에 프로필 사진이 효과적임을 검증하였다.

  • PDF