• 제목/요약/키워드: Paper Retrieval

검색결과 2,133건 처리시간 0.031초

불법 동영상 검출을 위한 효율적인 동영상 정합 방법 (Efficient video matching method for illegal video detection)

  • 최민석
    • 디지털융복합연구
    • /
    • 제20권1호
    • /
    • pp.179-184
    • /
    • 2022
  • 정보통신 기술의 발전으로 디지털 콘텐츠의 생산과 유통이 급격히 증가하고 있으며 이와 함께 불법적인 복제 컨텐츠의 유통도 증가하여 여러 문제를 야기하고 있다. 컨텐츠의 불법적인 유통을 막기 위하여 DRM(Digital Rights Management) 기반의 접근 방법을 이용할 수 있지만, 이미 복제되어 유통되는 상황에서는 복제된 컨텐츠를 검색하여 검출하는 방법이 요구된다. 본 논문에서는 동영상 콘텐츠의 내용에 기반한 복제 검출 방법을 제안한다. 제안된 방법은 동영상에서 추출된 비주얼 리듬을 이용하여 동영상을 장면 단위로 분할하고, 분할된 각 장면의 재생 시간과 색상 특징값을 계층적으로 적용하여 대용량 데이터베이스에서 빠르고 효율적으로 복제 동영상 검출이 가능하다. 실험을 통하여 제안된 방법이 다양한 복제 변형에 대하여 안정적 검출이 가능함을 보였다.

생성 모델과 검색 모델을 이용한 한국어 멀티턴 응답 생성 연구 (A study on Korean multi-turn response generation using generative and retrieval model)

  • 이호동;이종민;서재형;장윤나;임희석
    • 한국융합학회논문지
    • /
    • 제13권1호
    • /
    • pp.13-21
    • /
    • 2022
  • 최근 딥러닝 기반의 자연어처리 연구는 사전 훈련된 언어 모델을 통해 대부분의 자연어처리 분야에서 우수한 성능을 보인다. 특히 오토인코더 (auto-encoder) 기반의 언어 모델은 다양한 한국어 이해 분야에서 뛰어난 성능과 쓰임을 증명하고 있다. 그러나 여전히 디코더 (decoder) 기반의 한국어 생성 모델은 간단한 문장 생성 과제에도 어려움을 겪고 있으며, 생성 모델이 가장 일반적으로 쓰이는 대화 분야에서의 세부 연구와 학습 가능한 데이터가 부족한 상황이다. 따라서 본 논문은 한국어 생성 모델을 위한 멀티턴 대화 데이터를 구축하고 전이 학습을 통해 생성 모델의 대화 능력을 개선하여 성능을 비교 분석한다. 또한, 검색 모델을 통해 외부 지식 정보에서 추천 응답 후보군을 추출하여 모델의 부족한 대화 생성 능력을 보완하는 방법을 제안한다.

의료서비스를 위한 키워드와 문서의 연관성 향상을 위한 LSTM모델 설계 (LSTM Model Design to Improve the Association of Keywords and Documents for Healthcare Services)

  • 김준겸;서진범;조영복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.75-77
    • /
    • 2021
  • 현재 다양한 검색엔진들이 사용되고 있다. 검색엔진은 메타태그 정보를 기본으로 크롤링, 색인생성, 검색 결과 출력의 3단계를 거치며, 사용자가 원하는 자료의 검색을 도와준다. 그러나 키워드를 기반으로 검색해서 얻은 방대한 문서가 관련이 없거나 적은 문서일 경우도 많다. 이러한 문제점 때문에 검색 결과에서 내용을 파악하여 정확도를 분류를 해야 하는 번거로운 일이 발생하게 된다. 다양한 검색엔진을 통해 추출된 결과의 경우 검색엔진의 인덱스는 주기적으로 업데이트 되지만 가중치에 대한 기준과 업데이트 주기는 검색엔진마다 다르고 검색 순위 산정 기준이 서로 다르기 때문에 동일한 키워드를 검색어로 입력하고도 서로 다른 검색 순위를 보여주는 단점을 가지고 있다 따라서 본 논문에서는 기존 검색엔진 대신 사용자가 입력한 키워드와 문서의 연관성을 추출하여 사용자가 찾고자 하는 키워드를 입력했을 때 키워드와 문서의 연관성을 향상 시킬 수 있는 LSTM모델을 설계하고자 한다.

  • PDF

정보보호 공시 데이터를 이용한 정보보호 관리체계 인증과 조직의 특성 분석 (Analysis on ISMS Certification and Organizational Characteristics based on Information Security Disclosure Data)

  • 김선주;김태성
    • 경영정보학연구
    • /
    • 제25권4호
    • /
    • pp.205-231
    • /
    • 2023
  • 정보보호 관리체계(Information Security Management System, ISMS)는 정보 자산의 기밀을 유지하고 결함이 없게 하며 언제든 사용할 수 있게 하는 보호 절차와 과정이고, 국내의 ISMS-P와 국외의 ISO/IEC 27001이 가장 대표적인 ISMS 인증제도이다. 본 논문에서는 ISMS 인증과 조직의 특성과의 관계를 파악하기 위해서 한국인터넷진흥원(KISA), 과학기술정보통신부 전자공시시스템(ISDS), 금융감독원 전자공시시스템(DART)로부터 데이터를 수집하고, Probit 회귀 분석을 실시하였다. Probit 분석 시 ISMS-P 취득여부, ISO/IEC 27001 취득여부, ISMS-P와 ISO/IEC 27001 모두 취득여부의 세 가지 경우에 대해 독립변수 4개와의 관련성을 확인하였다. 분석 결과, ISMS-P, ISO/IEC 27001 모두 취득한 기업은 총 임직원 수와는 양의 상관관계, 업력과는 음의 상관관계가 있음을 알 수 있었다. 이외에도 ISMS-P 인증제도와 정보보호 공시제도의 개선방향에 대해서도 확인할 수 있었다.

다중 레벨 양자화 기법을 적용한 오디오 핑거프린트 추출 방법 (Audio Fingerprint Extraction Method Using Multi-Level Quantization Scheme)

  • 송원식;박만수;김회린
    • 한국음향학회지
    • /
    • 제25권4호
    • /
    • pp.151-158
    • /
    • 2006
  • 본 논문은 필립스의 음악 검색 기법을 기반으로 필터 뱅크 에너지 변화량과 음악의 통계적인 특성을 이용한 오디오 핑거프린트 추출 방법을 제안하였다. 기존의 필립스 방식은 제한된 주파수 영역을 너무 많은 필터 뱅크로 분할하여 분석함으로써 밴드들 사이에 연계성 및 왜곡에 대한 민감도가 증가하는 특징을 보일 수 있다. 제안된 방법은 필터 뱅크의 밴드 수를 줄여 왜곡에 대한 강인성을 증진시키고, 필터 뱅크 에너지의 변화량의 부호와 크기 정보를 통계적 특성을 고려한 양자화 기법을 이용해 2비트로 할당함으로써 오디오 핑거프린트의 고유성을 확보하였다. 추출된 2비트는 4개의 레벨로 정보를 표현함으로 각 레벨 사이에 연계성이 존재하게 된다. 이 같은 레벨 사이의 연계성은 유사도 측정 시 이용될 뿐만 아니라 오디오 핑거프린트를 기준으로 검색 영역을 확장하는 제안된 방식에서는 효율적인 검색 영역을 선택할 수 있는 정보로 활용 되었다. 제안된 방식은 다양한 주변 잡음환경 (거리, 백화점, 자동차, 사무실, 식당)에서의 실험을 통하여 주변 잡음에 강인한 특성을 보일 뿐만 아니라 검색 속도 또한 향상되는 특징을 보였다.

검색 속도와 메모리 효율 최적화를 위한 메타데이터 기반 데이터 구조 분석 (Metadata-Based Data Structure Analysis to Optimize Search Speed and Memory Efficiency)

  • 김세연;임영훈
    • 정보처리학회 논문지
    • /
    • 제13권7호
    • /
    • pp.311-318
    • /
    • 2024
  • 인공지능과 인터넷의 발전으로 인한 데이터의 증가로 데이터 관리의 중요성이 부각되고 있는 상황에서, 데이터 검색과 메모리 공간의 효율적 활용이 매우 중요한 시대가 도래하였다. 본 연구에서는 메타데이터를 기반으로 데이터 구조를 분석하여 검색 속도와 메모리 효율을 최적화하는 방안을 연구한다. 연구방법으로는 사진 이미지의 메타데이터를 활용하여 배열, 연결리스트, 딕셔너리, 이진 트리, 그래프의 데이터 구조에 대한 성능을 시간적, 공간적 복잡도를 중심으로 비교하고 분석하였다. 실험을 통해 대규모의 이미지 데이터를 다루는 상황에서 딕셔너리 구조는 수집속도에서, 그래프 구조는 검색 속도에서 가장 우수한 성능을 보여주는 것을 확인할 수 있었다. 본 논문의 결과는 이미지 데이터 검색 속도와 메모리 효율을 최적화하기 위한 데이터 구조를 선택하는데 실용적인 가이드라인을 제시할 것으로 기대한다.

분포형 비차등위상차를 이용한 S-밴드 이중편파레이더의 정량적 강우 추정 (Quantitative Rainfall Estimation for S-band Dual Polarization Radar using Distributed Specific Differential Phase)

  • 이건행;임상훈;장봉주;이동률
    • 한국수자원학회논문집
    • /
    • 제48권1호
    • /
    • pp.57-67
    • /
    • 2015
  • 이중편파레이더는 강우입자의 모양, 크기, 위상, 방향에 대한 정보를 제공해줌으로써 단일편파레이더보다 정확한 정량적 강우 추정에 장점이 있다. 본 연구에서는 대표적인 이중편파레이더 강우 추정 알고리즘인 JPOLE 알고리즘과 CSU 알고리즘을 이용하여 강우량을 산정 비교하였다. 이 두 알고리즘은 강우의 크기에 따라 반사도, 차등반사도, 비차등위상차를 각각 이용하거나 조합하여 강우량을 계산한다. 비차등위상차는 강우입자의 모양과 분포밀도에 대한 정보를 주는 차등위상차에 필터링이나 회귀분석기법을 이용하여 계산되는데, 대류성 강우 지역에서는 비차등위상차의 첨두값이 과소 추정되거나 음의 값을 보일 수 있으며, 약한 강우지역에서는 진동하기도 한다. 본 연구에서는 이러한 문제를 해결하고자 Lim et al. (2013)에서 제안된 새로운 분포형 비차등위상차 산정방법의 이용을 제안하였다. 2012년도의 두 강우사상에 대한 국토교통부의 비슬산 레이더 자료를 이용하여 분포형 비차등위상차를 산정한 후 강우 추정 알고리즘에 적용하였다. 산정된 분포형 비차등위상차는 첨두값이 개선되었으며, 크게 진동하거나 음의 값이 산정되지 않았다. 이를 이용하여 추정된 강우량에 있어서는 일강우량 80mm 이상의 강한 강우에 대해 일강우량의 누적값이 AWS 관측값에 가깝게 개선되는 것을 확인하였으며 80mm 이하의 약한 강우에서는 개선 정도가 미약하였다. 이는 강우 추정 알고리즘에서 강우강도가 높은 경우에 비차등위상차가 사용되고, 낮은 경우에는 반사도와 차등반사도가 사용되기 때문인 것으로 판단된다. 본 연구를 통해 향후 이중편파레이더를 이용한 강우량 추정의 정확도를 향상시킬 수 있을 것으로 기대된다.

네이밍 에이전트의 메타데이터를 이용한 멀티 에이전트의 협력 및 노드 이주 기법 (Collaboration and Node Migration Method of Multi-Agent Using Metadata of Naming-Agent)

  • 김광종;이연식
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.105-114
    • /
    • 2004
  • 본 논문에서는 멀티 에이전트 모델에서 각 에이전트의 협력 방법을 제안하고 네이밍 에이전트의 메타데이터를 이용한 MA(Mobile Agent)의 노드 이주 알고리즘을 제시한다. 멀티 에이전트의 협력은 에이전트 시스템의 안정성과 분산 환경에서의 정보 검색의 신뢰성을 향상시킨다. 이러한 멀티 에이전트의 중요한 구성 요소 중, 네이밍 에이전트는 상호 에이전트를 식별하고 특정 객체를 참조하도록 에이전트 이름을 지원하며, 각 에이전트는 이러한 고유의 이름으로서 특정 객체를 참조한다. 또한 네이밍 에이전트는 에이전트 특성에 따라 SPA(Server Push Agent), CPA(Client Push Agent) 및 SPA(Server Push Agent) 등으로 각 에이전트를 분류하여 네이밍 서비스를 통합하고 관리하는 역할을 수행하며, 특정 MA에 노드 이주 정보를 제공하게 된다. 그러므로 MA의 노드 이주 시 적중 문건의 수, 적중률, 노드 처리 시간 및 네트워크 지연시간에 따른 우선순위를 부여하여 노드 이주의 효율성을 높일 수 있는 방안이 요구된다. 따라서 본 논문은 통합된 네이밍 서비스를 위한 네이밍 에이전트를 설계하고 적중 문건의 수, 적중률 및 탐색 문건의 수 등으로 구성된 메타데이터 구조를 보인 후, 멀티 에이전트의 협력을 통한 메타데이터의 생성과 갱신 및 적중 문건의 수에 따른 노드 이주 방법을 보인다.

다차원 텍스트 큐브를 이용한 호텔 리뷰 데이터의 다차원 키워드 검색 및 분석 (Multi-Dimensional Keyword Search and Analysis of Hotel Review Data Using Multi-Dimensional Text Cubes)

  • 김남수;이수안;조선화;김진호
    • 정보화연구
    • /
    • 제11권1호
    • /
    • pp.63-73
    • /
    • 2014
  • 웹의 발달로 텍스트 등으로 이루어진 비정형 데이터의 활용에 대한 관심이 높아지고 있다. 웹상에서 사용자들이 작성한 대부분의 비정형 데이터는 사용자의 주관이 담겨져 있어 이를 적절히 분석할 경우 사용자의 취향이나 주관적인 관점 등의 아주 유용한 정보를 얻을 수 있다. 이 논문에서는 이러한 비정형 텍스트 문서를 다양한 차원으로 분석하기 하는데 OLAP(온라인 분석 처리)의 다차원 데이터 큐브 기술을 활용한다. 다차원 데이터 큐브는 간단한 문자나 숫자 형태의 정형적인 데이터에 대해 다차원 분석하는데 널리 사용되었지만, 텍스트 문장으로 이루어진 비정형 데이터에 대해서는 활용되지 않았다. 이러한 텍스트 데이터베이스에 포함된 정보를 다차원으로 분석하기 위한 방법으로 텍스트 큐브 모델이 최근에 제안되었는데, 이 텍스트 큐브는 정보 검색에서 널리 사용하는 용어 빈도수(Term Frequency)와 역 인덱스(Inverted Index)를 측정값으로 이용하여 텍스트 데이터베이스에 대한 다차원 분석을 지원한다. 이 논문에서는 이러한 다차원 텍스트 큐브를 활용하여 실제 서비스되고 있는 호텔 정보 공유 사이트의 리뷰 데이터 분석에 활용하였다. 이를 위해 호텔 리뷰 데이터에 대한 다차원 텍스트 큐브를 생성하였으며, 이를 이용하여 다차원 키워드 검색 기능을 제공하여 사용자 중심의 의미있는 정보 검색이 가능한 시스템을 설계 및 구현하였다. 또한, 본 논문에서 제안하는 시스템에 대해 다양한 실험을 수행하였으며 이를 통해 제안된 시스템의 실효성을 검증하였다.

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.