• Title/Summary/Keyword: 키워드검색기법

검색결과 254건 처리시간 0.031초

FCA 기반 계층적 구조 표현을 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure Representation based on the Formal Concept Analysis)

  • 김태환;박제현;최중민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.388-392
    • /
    • 2006
  • 가공해서 사용하는 정보량이 많아질수록 원하는 정보를 찾는 데 더 많은 노력이 필요하게 마련이다. 따라서 사람들은 대대로 정보를 구조화하는 방법들을 고안해왔으며, 여러 가지 계층적 구조화 방법들을 사용했었다. 이렇게 구현된 정보의 계층 구조는 키워드 검색을 바탕으로 수평적 계층 구조만을 가지는 구조였다. 자료가 전문화되고 정보를 검색하는 사용자 또한 검색된 정보와 관련된 정보를 더 원하는 현 시점에서 정보의 수평적 계층 구조만으로 사용자의 만족도를 충족할 수 없다. 이러한 문제점을 해결하기 위해 이 논문에서는 특정 도메인의 문서를 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 체크하여 그 단락의 계층적 트리를 구성하고, 단락별 트리를 이용하여 문서의 내용을 트리로 재구성할 수 있게 된다. 이렇게 만들어진 문서의 트리들은 트리의 구조를 보고 특정 문서에 더 구체적인지 아니면 더 일반적인지 측정하여 문서와 문서간의 관계 또한 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색해 주는 자동화 문서 계층 구조를 제안한다.

  • PDF

실시간 SNS 스트림 처리를 통한 산림재해 관련 메시지 검출 시스템 구현 (Implementation of Forest Disaster Message Detection System by Processing Real-time SNS Stream)

  • 문지혜;임지수;송석일
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.311-312
    • /
    • 2017
  • 이 논문에서는 SNS 스트림을 분석하여 산림재해 (산불, 산사태 등)에 관련한 메시지를 검출하는 시스템을 구현한다. 구현하는 시스템은 SNS 스트림에서 사전에 부여된 산림 재해 과련 키워드들을 포함하는 메시지를 실시간으로 검색한다. 검색 결과에 대해 산림재해와의 관련성을 관리자가 분류를 하고 분류한 결과는 기계학습 기법을 통해 학습되어 보다 정확한 산림재해 메시지 검출을 가능하게 한다. 제안하는 방법은 Spark Streaming 과 MLIB를 기반으로 구현한다.

  • PDF

온톨로지 기반 지식추론 기법 (Ontology-based Method for automatic Knowledge Reasoning)

  • 이정원;박세형;이언경;방건동;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.292-294
    • /
    • 2001
  • 제품 개발을 담당하는 부서에서, 다양한 이유로 핵심인력이 빠져나간다. 이때마다 제품개발 현장에서는 심각한 지식 누수현상이 나타나게 된다. 따라서, 지식 누수 현상을 방지하기 위한 방법은 기업 내부에 존재하는 핵심인력의 노하우를 형식지로 저장해 관리하는 것이다. 제품을 개발을 담당하는 부서에는 수많은 문서들이 존재한다. 특히 품질 관리 문서는 제품개발과 관련된 핵심인력의 노하우가 농축되어있는 지식이다. 그래서 많은 기업에서는 기업내부에서 발생하는 그 지식을 관리하고 재활용하고자, 문서관리를 위한 시스템을 도입, 사용하고 있다. 그러나 설계 지식의 공유를 지원하는 시스템을 갖추었어도, 단순히 설계지식을 저장해놓은 경우가 많아, 개발자는 필요한 자료를 다시 선정해야 하는 문제가 발생한다. 이는 개발자에게 있어서 부담이 되며, 풍부한 지식활용률을 떨어뜨리게 만드는 한 요인이 된다. 본 논문에서는 이 문제를 해결하기 위해, 온톨로지를 기반으로 문서를 분류하고, 이 온톨로지에 정의된 키워드를 바탕으로 새로운 지식을 자동적으로 추론하여, 제품에 대한 기술적 지식을 가지고 검색하게 함으로서 필요 없는 검색 결과를 최소화 하고, 설계자의 지식 활용률을 높이고자 하였다.

  • PDF

저장 공간의 효율성을 위한 분산 파일 시스템의 중복 데이터 제거 기법 (Eliminating Redundant Data for Storage Efficiency on Distributed File Systems)

  • 김정훈;임병홍;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.111-112
    • /
    • 2009
  • 최근 IT 분야의 키워드 중 하나인 클라우드 컴퓨팅에서, 분산 파일 시스템의 선택은 대용량의 데이터를 관리하기 위해 매우 중요하다. 오픈소스 분산 파일 시스템 중 하나인 HDFS는 데이터의 효율적인 저장과 검색의 장점을 통해 최근 널리 사용되고 있다. HDFS는 데이터를 3단계 중복저장을 통해 신뢰성을 보장한다. 그러나 이러한 중복저장은 데이터 저장의 효율성 저하의 문제점을 갖고 있다. 따라서 본 논문에서는 MD5 해쉬 기술을 적용한 중복 데이터 제거 기법을 제안한다. 본 기법은 시뮬레이션을 통해 저장 공간의 효율성을 향상의 결과를 확인하였다.

스마트 카드를 이용한 패스워드 기반의 검색 가능한 암호화 기술 (A Password-Based Searchable Encryption using Smart Cards)

  • 이동근;이현숙;임종인
    • 전자공학회논문지CI
    • /
    • 제49권3호
    • /
    • pp.56-61
    • /
    • 2012
  • 사용자 인증은 인터넷 상의 많은 리소스를 인가된 사용자만 사용하도록 안전한 시스템 구축의 필수 요소이며 암호화 기법은 데이터 프라이버시를 제공하는 것을 목적으로 한다. 또한, 검색 가능한 암호화 기법은 데이터의 프라이버시와 함께 키워드를 이용한 검색으로 데이터의 효율적인 관리를 목적으로 한다. 공개키 기반의 검색 가능한 암호화 시스템은 사용자의 공개키에 대한 인증이 미리 이루어져야 하고 사용자 별 공개키/개인키에 대한 안전한 관리가 요구된다. 클라우드 환경에서는 다양한 디바이스를 통해 인터넷 클라우드 환경의 다양한 리소스를 사용가능하도록 하는 것이 목적이며 이에 반해서 다양한 디바이스들은 실제로 공개키/개인키에 대한 관리 및 인증서를 관리하기에는 리소스가 부족할 수 있으며 디바이스마다 이러한 클라이언트를 구현한다는 것은 쉽지 않다. 이러한 문제점들을 해결하기 위해서 H/W적인 안전성을 보장하는 temper-resistant한 device인 스마트 카드(smart card)를 이용한 암호화된 데이터에서의 패스워드 기반의 인증된 사용자의 검색 기술을 제안한다.

내용기반 음악검색 시스템의 비교 분석 (A Comparative Analysis of Content-based Music Retrieval Systems)

  • 노정순
    • 정보관리학회지
    • /
    • 제30권3호
    • /
    • pp.23-48
    • /
    • 2013
  • 본 연구는 웹에서 접근 가능한 내용기반 음악검색(CBMR) 시스템들을 조사하여, 탐색질의의 종류, 접근점, 입출력, 탐색기능, 데이터베이스 성격과 크기 등의 관점에서 특성을 비교 분석하고자 하였다. 비교 분석에 사용된 특성을 추출하기 위해 내용기반 음악정보의 특성과 시스템 구축에 필요한 파일의 변환, 멜로디 추출 및 분할, 색인자질 추출과 색인, 매칭에 사용되는 기술들을 선행연구로 리뷰하였다. 15개의 시스템을 분석한 결과 다음과 같은 특성과 문제점이 분석되었다. 첫째, 도치색인, N-gram 색인, 불리언 탐색, 용어절단검색, 키워드 및 어구 탐색, 음길이 정규화, 필터링, 브라우징, 편집거리, 정렬과 같은 텍스트 정보 검색 기법이 CBMR에서도 검색성능을 향상시키는 도구로 사용되고 있었다. 둘째, 시스템들은 웹에서 크롤링하거나 탐색질의를 DB에 추가하는 등으로 DB의 성장과 실용성을 위한 노력을 하고 있었다. 셋째, 개선되어야 할 문제점으로 선율이나 주선율을 추출하는데 부정확성, 색인자질을 추출할 때 사용되는 불용음(stop notes)을 탐색질의에서도 자동 제거할 필요성, 옥타브를 무시한 solfege 검색의 문제점 등이 분석되었다.

대용량 멀티미디어 데이터의 내용 기반 검색을 위한 고확장 지원 색인 기법 (A Scalable Index for Content-based Retrieval of Large Scale Multimedia Data)

  • 최현화;이미영;이규철
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.726-730
    • /
    • 2009
  • 카메라 기술의 발전 및 사용자 중심의 인터넷 패러다임인 웹 2.0을 토대로 멀티미디어 데이터가 급증하면서, 멀티미디어 검색은 인터넷 서비스로서 그 중요성이 날로 증가되고 있다. 현재 멀티미디어 검색은 단순한 키워드(keyword) 검색에 의존하고 있는 실정으로, 정보 검색의 정확도 및 사용자의 만족도를 충족시키기 위해서는 내용 기반 검색 지원이 필요하다. 본 논문에서는 대용량의 멀티미디어 데이터의 내용 기반 검색을 지원하기 위하여, 데이터의 분포에 따른 다중 길이의 시그니처를 기반으로 한 새로운 분산 인덱스 구조를 제안한다. 제안하는 인덱스 구조는 고차원 데이터의 클러스터링에 따라 데이터의 분포를 분석하여 서로 다른 요약 파일을 분산 생성하고, 이를 기반으로 유사 검색을 병렬로 수행할 수 있도록 설계되었다. 그리하여, 클러스터 환경 하에서 고차원 데이터의 분산 저장이 용이하고, 각 노드들은 서로 다른 시그니처 파일을 기반으로 검색을 병렬 수행함으로써 효율적인 검색을 지원한다.

  • PDF

스마트 TV 환경에서 키넥트 센서를 이용한 사진 검색 시스템 (Photo Retrieval System using Kinect Sensor in Smart TV Environment)

  • 최주철
    • 디지털융복합연구
    • /
    • 제12권3호
    • /
    • pp.255-261
    • /
    • 2014
  • 디지털 카메라, 스마트폰, 타블렛과 같은 스마트 기기의 대중화와 소셜 네트워크 서비스를 통해서 사진과 같은 멀티미디어 데이터의 양이 빠르고, 급격하게 확산되고 있다. 사진 검색 방법은 키워드 기반의 검색 방법, 예제 기반의 검색 방법, 시각화 질의 기반의 검색 방법의 세 가지 분류될 수 있다. 이전에 연구된 사진 검색 기법은 일반 PC 환경에 최적화되었기 때문에 최근에 등장한 스마트 TV 환경에서 사진 검색하기 위한 방법으로 사용하는 것은 적합하지 않은 상황이다. 본 논문에서는 스마트 TV 환경에서 키넥트를 이용한 소셜 네트워크에 존재하는 사진 검색 시스템을 제안하였다. 이를 위해서 키넥트 센서를 사용하여 마우스의 컨트롤을 제어할 수 있도록 구현하였으며, 제안하는 시스템의 검색 결과는 임계값이 0.7일 때, 평균 재현율과 평균 정확도는 각각 81%, 80%의 성능을 보였다.

소셜 네트워크에 적합한 효율적인 프라이버시 보호 데이터 공유 기법 (An efficient privacy-preserving data sharing scheme in social network)

  • 전두현;천지영;정익래
    • 정보보호학회논문지
    • /
    • 제22권3호
    • /
    • pp.447-461
    • /
    • 2012
  • 소셜 네트워크 서비스는 실시간 정보 공유의 새로운 매개체로 각광을 받고 있다. 하지만 소셜 네트워크를 통해 공유되는 정보는 사용자의 신분이나 생활 패턴 등을 노출시킬 수 있는 민감한 정보가 포함되어 있기 때문에 사용자의 프라이버시 침해가 빈번히 발생한다. 이러한 문제를 해결하기 위해 소셜 네트워크 환경에서 프라이버시를 보호하는 데이터 공유 기법에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 소셜 네트워크에 적합한 프라이버시 보존 데이터 공유 기법을 제안한다. 제안하는 기법은 암호화된 데이터에서 검색자가 선택한 키워드가 모두 포함되어 있는 데이터를 검색할 수 있으며, 스토리지 서버에 대한 접근 권한을 부여받은 사용자는 누구나 데이터를 저장하고 검색할 수 있다. 또한 동적 환경인 소셜 네트워크의 특징에 적합하도록 효율적인 가입/탈퇴 기능을 제공한다.

디지털 성범죄 추적을 위한 트위터 크롤링 기법 연구 (A Study on Twitter Crawling Techniques for Tracking Digital Sexual Crimes)

  • 이현우;이수빈;안동휘;김지연;김창훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.203-205
    • /
    • 2023
  • 소셜미디어 사용이 증가하면서 성 착취물, 불법 촬영물과 같은 디지털 성범죄 또한 확산되는 추세이다. 소셜미디어에서 검색어 차단 정책 등을 통해 디지털 성범죄를 제재하기 위한 노력이 이루어지고 있으나, 은어 및 다양한 변형어를 사용한 우회 검색을 모두 차단하는 것이 어려울 뿐 아니라, 단시간에도 방대한 양의 데이터가 생성되는 소셜미디어 특성상 범죄 관련 게시글을 모두 식별해 내는 것이 현실적으로 불가능하다. 따라서 능동적이고 고도화된 크롤링 기술 개발을 통해 소셜미디어상의 범죄를 실시간 탐지하는 연구가 필요하다. 본 논문에서는 디지털 성범죄 관련 데이터가 빈번하게 관찰되는 트위터를 대상으로 성 착취물 및 불법 촬영물 정보를 수집하기 위한 검색 키워드를 정의하고, 실제 트위터 크롤링을 수행하여 텔레그램, 디스코드, 라인 등과 같은 다른 소셜미디어에 성범죄물이 유포되는 정황을 URL, 코드, 해시태그 추출을 통해 확보하는 수사 기술을 개발한다.

  • PDF