• 제목/요약/키워드: 리소스 검색

검색결과 66건 처리시간 0.026초

2단계 한국어 복합명사 분해기 (Two-Stage Korea Compound Noun Decomposer)

  • 박찬준;류법모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.495-497
    • /
    • 2018
  • 복합명사는 둘 이상의 명사가 결합된 명사로, 한국어는 무한한 복합명사 생성이 가능하며 기계번역, 정보검색 등 다양한 분야에서 시스템의 정확도를 향상시키는데 중요한 역할을 한다. 본 논문은 리소스 확장을 이용한 사전 기반 복합명사 분해기[1]의 후속연구로 한국어 복합명사 분해기를 총 2단계에 걸쳐 분해하는 시스템을 제안한다. 먼저 대용량 복합명사 입출력쌍 사전을 구축한 후 1단계 분해를 진행하며, 1단계에서 분해가 실패한 경우 2단계에서 자체 구축한 Unigram사전을 기반으로 복합명사 분해를 진행한다. 실험결과 97.4%의 정확률이 나왔으며 기존의 리소스확장을 이용한 방법론보다 5.6%의 성능향상을 보였다.

  • PDF

딥러닝 알고리즘을 이용한 유사 판례 매칭 데이터셋 구축 방안 연구 (A Study on the building Dataset of Similar Case Matching in Legal Domain using Deep Learning Algorithm)

  • 강예지;강혜린;박서윤;장연지;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.72-76
    • /
    • 2021
  • 판례는 일반인 또는 법률 전문가가 사건에 참조하기 위해 가장 먼저 참고할 수 있는 재판의 선례이다. 하지만 이러한 판례의 유용성에도 불구하고 현 대법원 판례 검색 시스템은 판례 검색에 용이하지 않다. 왜냐하면 법률 전문 지식이 없는 일반인은 검색 의도에 부합하는 검색 결과를 정확히 도출하는 데 어려움이 있으며, 법률 전문가는 검색에 많은 시간과 비용이 들게 되기 때문이다. 이미 해외에서는 유사 케이스 매칭 데이터셋을 구축하여 일반인과 전문가로 하여금 유사 판례 검색을 용이하게 할 뿐만 아니라 여러 자연어 처리 태스크에도 활용하고 있다. 하지만 국내에는 법률 AI와 관련하여 오직 법률과 관련한 세부 태스크 수행에 초점을 맞춘 연구가 많으며, 리소스로서의 유사 케이스 매칭 데이터셋은 구축되어 있지 않다. 이에 본 논문에서는 리소스로서의 판례 데이터셋을 위해 딥러닝 알고리즘 중 문서의 의미를 반영할 수 있는 Doc2Vec 임베딩 모델과 SBERT 임베딩 모델을 적용하여 판례 문서 간 유사도를 측정·비교하였다. 그 결과 SBERT 모델을 통해 도출된 유사 판례가 문서 간 내용적 유사성이 높게 나타났으며, 이를 통해 SBERT 모델을 이용하여 유사 판례 매칭 기초 데이터셋을 구축하였다.

  • PDF

연구리소스 지식그래프를 활용한 국가과학기술정보 탐색 (Exploring National Science and Technology using Research Resource Knowledge Graph)

  • 조민희;임형준;송사광
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.621-623
    • /
    • 2021
  • 공공의 자금을 통해 산출된 연구 성과물을 온라인으로 공개하여 공유, 활용하는 오픈 사이언스 정책이 확산되고 있다. 오픈사이언스를 활성화기 위한 정책으로 공개되는 성과물을 쉽게 검색 및 액세스하고 재사용할 수 있도록 하는 연구 지원 서비스에 관심이 증대되고 있다. 연구자에게 풍부한 정보를 제공하기 위한 서비스 지원을 위하여 흩어진 다양한 성과물 데이터들 사이의 관계를 의미적으로 표현하기 위한 연구리소스 지식그래프 모델을 제안한다. 본 논문에서는 지식 그래프 구축을 통해 국가 R&D 과제정보, 연구자정보, 성과정보, 연구데이터정보 등을 의미적으로 연결해 연구개발에 필요한 전반적인 연구리소스 정보 탐색이 가능하도록 하여 국가연구데이터플랫폼 DataON의 서비스 향상에 기여한다.

  • PDF

패턴매칭을 위한 오토마타의 상태복잡도 (The state complexity of ${\sum}^*L$ for pattern matching)

  • 엄해성;한요섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.478-480
    • /
    • 2011
  • 우리는 패턴매칭에서 많이 사용되는 정규언어의 연산 ${\sum}^*L$에 대한 일반적인 경우의 상태복잡도와 단항 알파벳인 경우의 상태복잡도를 살펴본다. 정규언어의 상태복잡도는 해당 정규언어를 승인하는 최소결정적 유한 인식기의 상태 개수를 말한다. 패턴매칭, 검색엔진에 많이 사용되는 어떤 정규언어 L 에 대한 연산 ${\sum}^*L$의 상태복잡도를 살펴봄으로써, 좀 더 효율적인 리소스 관리를 통해 좀 더 빠른 검색을 할 수 있다.

시멘틱 웹상의 RDF 데이터 관리 시스템 (An RDF Data Management System On The Semantic Web)

  • 서명희;안재용;민준기;정진완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.560-562
    • /
    • 2003
  • 시멘틱 웹상에서는 정보 리소스들이 서로 의미적으로 연결되어. 이를 컴퓨터가 처리할 수 있다. Resource Description Framework (RDF)는 이런 의미적 연결성을 제공한다. 시멘틱 웹이 발전하기 위해서는 RDF 데이터를 효율적으로 관리하기 위한 방법이 매우 중요하다. 본 논문에서는 RDF 데이터를 XML 데이터베이스 시스템에 저장하고 이를 검색하는 기법을 제안한다 XML 데이터베이스 시스템을 사용함으로써 XML 데이터와 RDF 데이터를 통합적이고 효율적으로 관리할 수 있다. 또한. 효율적인 검색 방법과 성능을 향상시킬 수 있는 방법들을 제안하고 있다. 논문에서 제안한 질의 처리 기법은 기존 연구 보다 나은 성능을 보여준다.

  • PDF

온톨로지 기반의 쇼핑 사이트 고객을 위한 검색 시스템 (Ontology based Retrieval System for Shopping Sites Customer)

  • 구미숙;황정희;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.51-54
    • /
    • 2004
  • 시멘틱 웹은 기존의 웹과는 달리 정보의 의미가 정의되고, 이들 간의 의미적 연결을 지원한다는 특징이 있어서, 최근 차세대 웹으로 부각되고 있다. 이러한 의미적 연결을 위해서 시맨틱 웹의 기반인 온톨로지가 필요하다. 온톨로지는 리소스에 대한 메타데이터를 정의하여 의미적 연결이 가능하게 하므로 효율적인 정보 검색이 가능하다. 이 논문에서는 정보 검색의 효율을 증가시키기 위해서 시맨틱 웹의 핵심인 온톨로지 기반의 정보 검색 시스템을 제안한다. 쇼핑 사이트에서 효율적인 마케팅을 위해 사용자의 구매 패턴을 조사하여 고객에게 알맞은 정보 추천을 하기 위한 것을 목적으로 한다. 온톨로지의 구축은 XTM을 기반으로 토픽맵을 이용하였다. 그리고 온톨로지를 기반으로, 사용자의 구매패턴을 찾아서 정확한 정보 전달을 위해서 데이터 마이닝 기법을 이용하였다. 빈발패턴 트리 기법을 기반으로 하는 멀티 레벨 멀티 디멘션 빈발 패턴 마이닝 알고리즘을 이용하여 사용자 패턴을 분석하여 정보 검색에 효율을 기하였다.

  • PDF

온톨로지 기반 정보제공 시스템 (Ontology-Based Adaptive Information Providing System)

  • 손영태;이상근;이지혜;김재관;한요섭;박면웅
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.596-600
    • /
    • 2009
  • Web 2.0의 사용자 참여, 개방, 공유 중심의 인터넷 환경은 대량의 다양한 정보가 생성, 공유되고 있으며, 효율적인 검색기법만으로는 원하는 시점에 필요한 정보를 효과적으로 제공받지 못하는 상태이므로, 정보검색이나 필터링 과정에 추가적인 기법들이 요구되고 있다. 또한, 유비쿼터스 환경이 구축됨에 따라 정보검색은 장소와 시간에 관계없이 수행되며, 상황과 환경에 능동적이며 실시간적인 응답을 요구받고 있으므로. 정보검색이나 추천과정에서는 사용자의 상황과 요구조건에 적합한 정보를 결정하는 효율적인 리소스 매칭기법이 필수적이다. 본 논문에서는 연구개발을 주 업무로 하는 임의조직을 대상으로 구성원들의 정보활동을 효과적으로 지원하는 정보서비스 시스템의 개발에 관련된 방법론으로 대상조직의 소프트웨어적 분석과 구성의 정의, 정보와 지식의 표현과 관리, 리소스 매칭기법 등을 기술하고, 이를 응용한 정보서비스 시스템을 구현하여 타당성을 보이고자 한다.

  • PDF

실시간 비디오 포토 모자이크를 위한 이미지 집합 최적화 (Image Set Optimization for Real-Time Video Photomosaics)

  • 최윤석;구본기
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.502-507
    • /
    • 2009
  • 본 논문에서는 실시간 포토 모자이크 생성을 위한 이미지 집합 최적화 기법을 소개한다. 포토 모자이크 기법은 작은 포토 이미지를 사용하여 한 장의 큰 사진을 완성하는 기법으로 이미지를 일정한 영역의 셀로 분할한 후 각 셀 영역을 색상, 모양, 무늬 등에서 적합한 이미지로 대체한다. 큰 사진을 구성하는 이미지에 필요한 다양한 패턴을 얻기 위해서는 많은 양의 포토 타일 이미지가 필요하게 된다. 많은 양의 포토 이미지는 이미지 패턴 검색 시간을 오래 걸리게 하고, 이미지 저장을 위해 많은 리소스를 필요로 한다. 이러한 제약은 실시간 처리나 리소스의 제한이 있는 휴대용 기기에서의 포토 모자이크의 적용을 힘들게 한다. 본 논문에서는 패턴 검색 시간 향상과 메모리 요구 최소화를 위해 유전 알고리즘 활용하여 전체 이미지 데이터베이스에서 가장 특징이 있는 이미지를 선별하여 작은 이미지 집합을 구축한다.

  • PDF

시멘틱 웹 데이터를 위한 키워드 인덱싱 기법 (Indexing Scheme for keyword-based Query Processing on Semantic Web)

  • 신혜연;김연희;정균락;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.51-55
    • /
    • 2006
  • 시맨틱 웹은 현재 웹의 확장된 개념으로 사람뿐만 아니라 컴퓨터 스스로가 데이터를 이해하고 처리할 수 있도록 정보에 의미를 부여하는 것이다. 시맨틱 웹 데이터를 기술하는 RDF를 통해 메타데이터를 표현하고 의미론적 추론이 가능하게 되었다. 따라서 기존에 일반 사용자가 쉽게 사용할 수 있는 키워드 검색 방법을 시맨틱 웹 데이터인 RDF/RDF 스키마에 적용함으로써 차세대 웹으로 인식되고 있는 시맨틱 웹을 일반 사용자도 쉽게 활용할 수 있도록 한다. 본 논문에서는 RDF 문서의 효율적인 검색을 위해 RDF 인스턴스와 RDF 스키마 정보를 저장하고, 키워드, 속성, 클래스 타입의 복합 조건 검색을 만족시키는 키워드 인덱스와 스키마 테이블 구조를 제안한다. 본 논문에서 제안한 구조는 다양한 조건들을 만족하는 리소스 정보의 빠르고 정확한 검색이 가능하도록 한다.

  • PDF

차량 네트워크에서 RSU를 이용한 리소스 검색 및 클라우드 구축 방안 (A RSU-Aided Resource Search and Cloud Construction Mechanism in VANETs)

  • 이윤형;이의신
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권3호
    • /
    • pp.67-76
    • /
    • 2020
  • 무선 통신 및 차량 기술의 발전으로 차량 간 네트워크(VANETs)는 차량간에 데이터를 전달할 수있게 되었다. 최근 VANETs은 차량의 자원을 공유하고 사용하여 부가가치 서비스를 창출하기 위해 차량 클라우드(VC)모델이 등장했다. VC를 구성하기위해서 차량은 자원을 제공하는 차량을 검색해야한다. 하지만 단일 홉 검색은 범위가 작고 통신 범위 밖에 공급차량을 검색할 수 없다. 반면 멀티 홉 검색은 넓은 통신범위를 검색 하지만 차량의 이동성으로 인해 연결 끊김이 잦고 검색에 사용되는 트래픽이 크다. 최근 많은 도로변 장치(RSU)가 도로에 배치되어 차량 정보를 수집하고 인터넷에 연결하는 역할을 한다. 따라서 VANETs에서 RSU를 이용한 차량 자원 검색 및 클러스터 구성 메커니즘을 제안한다. 본 논문에서 RSU는 차량의 위치 및 이동성 정보를 수집하고 수집된 정보를 통해 요청 차량의 VC를 구성하는데 필요한 자원을 제공 할 수 있는 공급차량을 선정한다. 제안 방안에서, 자원을 공급하는 차량을 결정하기 위한 기준으로 각 후보 차량과 요청 차량 사이의 연결 지속시간, 각 후보 차량의 가용 자원 및 요청 차량에 대한 연결 시작 시간을 고려한다. 시뮬레이션을 통해 기존 방안들과 비교하고 성능의 향상을 확인 하였다.