• 제목/요약/키워드: 정보구조화

검색결과 929건 처리시간 0.024초

객체지향 데이터베이스를 이용한 구조화된 문헌의 저장 및 관리에 관한 연구 (A Study on Storing and Managing Structured Documents with an Object-Oriented Database)

  • 이재진;문성빈
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.209-212
    • /
    • 1997
  • 문헌의 구조화를 통한 전문의 이용은 검색에 있어 많은 효율을 가져올 것으로 기대된다. 여기에서 구조화된 문헌을 저장하고 관리하기 위한 데이터베이스는 그 특성을 반영하여 구축되어야 한다. 본 연구에서는 이를 위한 데이터베이스로서 객체지향 데이터베이스를 선정하고 객체지향 모델링 기법을 이용하여 구조화된 문헌을 위한 데이터베이스를 설계하고 구현하였다.

  • PDF

인트라넷의 구조화는 곧 비즈니스의 구조화

  • 윤진섭
    • 디지털콘텐츠
    • /
    • 9호통권76호
    • /
    • pp.8-10
    • /
    • 1999
  • 정보기술 분야 전문가들은 인트라넷의 문제점들을 해소하기 위한 가장 유력한 정보기술을 'Corporate Portal'로 보고 있다. Yahoo, AOL, Microsoft, Netscape 등의 인터넷 포탈 사이트들이 인기를 누리는 이유는 인터넷상의 정보들을 구조화하여 이용자들이 쉽게 정보를 찾을 수 있기 때문이다. 마찬가지로 인트라넷이 구축되어 있는 기업 역시 Corporate Portal을 구축함으로써, 기 구축된 인트라넷의 활용도를 극대화할 수 있게 된다.

  • PDF

객체정보를 이용한 내용기반 비디오 검색 시스템

  • 정성호;이상렬;황병곤
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1998년도 춘계공동학술대회 발표논문집 IMF시대의정보화 추진전략
    • /
    • pp.107-110
    • /
    • 1998
  • 비디오를 이용한 여러응용들 중에서 비디오 검색은 중요한 부분을 차지한다고 볼 수 있다. 구조화된 비디오의 물리적 정보와 논리적 정보를 이용한 비디오 검색이 일반적이다. 그중 논리적 정보는 비디오 DB 에 구축된 구조화된 비디오를 이용한다. 비디오 검색은 구조화 과정에서 정의된 인덱스에 따라 사용자가 원하는 비디오를 검색하게 된다. 본 연구에서는 비디오 검색 시 운영체제를 고려하여 비디오 검색 정보를 아이콘화 시켜 관련된 비디오 샷을 찾아내는 시스템을 연구하였다. 본 연구의 결과는 비디오 검색 및 편집은 물론이며 멀티미디어 정보활용등의 여러 응용분야에 효과적으로 적용할 수 있을 것으로 생각된다.

구조화된 번역 메모리 기반 영한 메신저 자동 번역 시스템에 관한 연구 (A Study on English-Korean Messenger MT System based on Structured Translation Memory)

  • 최승권;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.361-364
    • /
    • 2011
  • 본 논문의 목표는 크게 두 가지이다. 하나는 2010년에 개발한 메신저 자동번역 시스템을 소개하는 것이고, 다른 하나는 메신저 대화체 문장을 더욱 고품질로 번역하기 위한 구조화된 번역 메모리(Structured Translation Memory)를 소개하는 것이다. 구조화된 번역 메모리는 기존의 문자열 기반의 번역 메모리와 자동 번역 시스템의 경계를 허무는 개념으로 구조를 표현하는 계층적 번역 메모리들로 구성된다. 구조화된 번역 메모리는 문자열 번역 메모리, 원형 어휘로 구성된 번역 메모리, 고유명사가 청킹된 번역 메모리, 날짜/숫자가 청킹된 번역 메모리, 기본명사구가 청킹된 번역 메모리, 문장 패턴 번역 메모리로 단계적으로 구성된다. 구조화된 번역 메모리를 적용하기 전의 2010년의 영한 메신저 자동 번역 시스템의 번역률이 81.67%였던 반면에, 구조화된 번역 메모리를 적용하려는 2011년의 영한 메신저 자동 번역 시스템의 시물레이션 번역률은 85.25%인 것으로 평가되었다. 따라서 구조화된 번역 메모리를 적용하였을 때는 기존의 번역률보다 3.58% 향상할 것으로 예측된다.

XQuery 작성기 설계 및 구현

  • 김태권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.22-24
    • /
    • 2004
  • XML은 관계형 데이터는 물론 구조화 또는 반구조화 된 데이터를 효과적으로 조직화하여 표현할 수가 있다. XQuery는 구조화된 XML 데이터를 대상으로 필요한 정보를 검색하는 질의어이다. 평면적인 테이블 형태의 SQL과는 달리 XQuery는 데이터의 내부구조 정보 없이는 질의어를 작성하는데 어려움이 따른다. 이 논문은 내부적으로 구조화된 XML데이터에서 필요한 정보를 검색하는 검색언어 XQuery질의를 효과적으로 작성할 수 있도록 질의 대상이 되는 XML 데이터 구조를 트리 형태로 보여주고, 필요한 경로식을 효과적으로 지정함으로써 질의어를 보다 쉽게 작성하도록 도와주는 XQuery 작성기를 설계하고 구현한다.

  • PDF

과학 논문 초록 말뭉치 구축 및 선학습 트랜스포머 기반 초록 자동구조화 방법 (Scientific Paper Abstract Corpus and Automatic Abstract Structure Parsing using Pretrained Transformer)

  • 김서경;조윤희;허세훈;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.280-283
    • /
    • 2020
  • 논문 초록은 논문의 내용을 요약해 제시함으로써 독자들의 연구결과물에 대한 빠른 검색과 이해를 도모한다. 초록의 구성은 대부분 전형적인 경우가 많기 때문에, 초록의 구조를 자동 분석하여 색인해두면 유사구조 초록을 검색하거나 생성하는 등의 연구효율화에 기여할 수 있다. 허세훈 외 (2019)는 초록 자동구조화를 위한 말뭉치 SPA2019 및 기계학습기반의 자동구조화 방법을 제시하였다. 본 연구는, 기존 SPA2019 의 구조화 오류를 바로잡고, SPA2019 에서 추출한 1,346 개의 초록데이터와 2,385 개의 초록데이터를 추가한 SPA2020 말뭉치를 새로이 소개한다. 또한, 다양한 선학습 기반 트랜스포머들을 활용하여 초록 자동구조화를 수행하였으며, 그 결과 BERT-0.86%, RoBERTa-0.86%, ALBERT-0.84%, XLNet-0.86%, DistilBERT-0.85% 등의 자동구조화 성능을 보임을 확인하였다.

  • PDF

CAPP 지원을 위한 사례베이스의 구조화

  • 김진백;김유일
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 1997년도 추계학술대회논문집 기업경쟁력 향상을 위한 정보통신 기술의 활용
    • /
    • pp.149-164
    • /
    • 1997
  • 사례기반형 추론(CBR)은 과거의 경험을 이용해서 문제를 해결하려는 방법으로서 규칙기반형 추론(RBR)과 달리 문제해결경험이 풍부한 도메인에 적합한 방법이다. CBR은 정적인 측면에서 사례의 표현과 구조화문제가 중요시되며, 동적인 측면에서는 사례의 검색 절차와 수정이라는 해결안 생산과정이 중요시된다. 본 논문은 정적 측면에서 효과적인 CAPP 지원을 위해 사례베이스(CB)를 계층적으로 구조화하였다. 또한 CB의 구조화시 시스 템의 문제해결 능력을 향상시켜주기 위하여 CB를 응용도메인 종속적 CB(DDCB)와 독립적 CB(DICB)로 분리하여 과거의 문제해결 경험에 관한 지식은 DDCB에 나타내었으며, 도메인 전문가가 가지는 일반적인 문제해결 지식은 DICB에 나타내었다.

  • PDF

사실관계 확인을 위한 다중 대규모 언어모델의 입출력 제어 구조화 방법 (Structuring Input and Output Control of Multiple Large Language Models for Fact-Checking)

  • 정지수;이치현;강현석;정상근;노윤형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.155-161
    • /
    • 2023
  • 최근 대규모 언어 모델의 활용 방법에 대한 많은 관심이 지속되고 있다. LLM이 생성한 정보의 가장 중요한 도전 과제는 출력 문장이 사실인지 판단하기 어렵다는 점이다. 본 논문은 하나 또는 복수의 LLM를 구조화하여, 생산되는 다양한 결과를 활용하는 방안을 탐구한다. LLM이 생성한 출력 정보를 고려하여 사실 관계 확인 과제를 수행함에 있어서, 성능 향상 가능성을 평가하기 위한 실험을 진행했다. 대규모 언어모델의 구조화를 통해 입력 정보의 제어를 할 경우, 기존 최고 성능보다 4.75의 정확도 향상을 관찰할 수 있었다.

  • PDF

비디오 검색을 이용한 비디오 편집시스템

  • 황병곤;정성호
    • 한국산업정보학회논문지
    • /
    • 제2권1호
    • /
    • pp.89-101
    • /
    • 1997
  • 본 논문에서는 기존의 비디오 편집 시스템에서의 단점을 보완하여 논리적인 비디오 편집을 위한 방법을 제안하였다. 또한 본 논문에서는 비디오를 체계적으로 관리하고 비디오 편집등의 비디오 응용 분야에 효과적으로 적용할 수 있도록 기존의 비디오를 구조화된 형태의 논리적 비디로로 재구성한 구조화된 논리적 비디오를 제안하였다. 제안한 구조화된 비디오는 비디오의 물리적 정보뿐만 아니라 비디오의 논리적 정보를 포함하며 이러한 정보를 이용하여 기존의 비디오가 제공하지 못하는 비디오의 논리적 단위 편집등의 다양한 기능을 제공할 수있고, 비디오 브라우징, 검색, 비디오 편집등의 여러 비디오 응용 분야에 효과적으로 적용할 수 있으므로 비디오 재사용성을 높일 수 있다. 본 논문에서는 기존의 비디오를 구조화된 논리적 비디오로 재구성하여 관리하는 비디오 데이터베이스 관리 시스템과 이를 이용한 논리적 단위의 비디오 편집 시스템을 설계 및 구현하였다.

구조화된 문헌의 이미지정보 검색시스템에 관한 연구 (Design of an Image Retrieval System for Structured Documents)

  • 박현주;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.79-82
    • /
    • 1997
  • 전자도서관 환경에서의 필요성으로 인해 이미지정보에 대한 관심과 정보로서의 가치 및 중요성이 널리 인정됨에 따라, 이를 위한 효과적인 색인방법과 검색시스템이 요구되고 있다. 이에 본 연구에서는 구조화된 문헌의 이미지정보를 자동으로 색인하여 데이터베이스를 구축하고 WWW상에서 이용할 수 있는 이미지정보 검색시스템을 구현하였다.

  • PDF