• 제목/요약/키워드: 웹문서

검색결과 1,600건 처리시간 0.027초

2단계 퍼지 지식베이스를 이용한 질의 처리 모델 (Query Processing Model Using Two-level Fuzzy Knowledge Base)

  • 이기영;김영운
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.1-16
    • /
    • 2005
  • 웹 기반의 학술분야 전문 검색 시스템은 사용자의 정보 요구 표현을 극히 제한적으로 허용함으로써 검색된 정보의 내용 분석과 정보 습득의 과정이 일관되지 못해 무분별한 정보 제공이 이루어진다. 따라서 본 논문에서는 문서 지식 구조를 파악하여 사용자 질의 용어와 색인어 사이의 내용 기반 유사도를 반영한 순위 재조정 모델을 제안한다. 이를 위해 전자는 시소러스 및 유사관계 행렬을 구축하여 주제 분석 메커니즘을 제공하고, 후자는 사용자 요구를 분석하기 위해 질의 확장 등의 탐색 모형을 수립하는 알고리즘을 제안한다. 따라서 본 논문에서 제안한 알고리즘은 검색 시스템의 정보 구조를 활용한 검색으로 재현율을 유지하면서 동시에 기존 퍼지 검색 모델의 단점인 정확률을 향상시키는 2단계 탐색모형을 수립하는 내용 기반검색 기법이라 할 수 있다.

  • PDF

다중 정규 경로 질의 처리를 위한 효율적 기법 (An Efficient Technique for Evaluating Queries with Multiple Regular Path Expressions)

  • 정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.449-457
    • /
    • 2001
  • 최근에 XML이 웹 상에서 문서 교환의 표준으로 등장하면서 XML로 표현된 데이터에 대한 질의 처리 분야가 주목받고 있다. 이때 XML 질의는 그래프로 표현된 데이터 그래프에서 특정 정규식으로 도달되는 객체를 찾는 정규 경로 질의 (regular path query)를 기반으로 한다. 그런데 사용자의 다양한 형태의 질의를 처리하기 위해서는 질의에 하나 이상의 정규 식을 가지는 질의의 처리가 필요함에도 기존의 연구 즉, 비정형 데이터 모델 하에서의 부를 이용한 질의 변환(query rewriting)이나, 질의 최적화 기법에서는 주로 단일 정규식으로 이 루어진 질의를 다루었다. 본 논문에서는 이러한 다중 정규식을 가지는 질의의 처리에서 1. 뷰의 몸체에서 질의 몸체로의 변수 매핑을 통한 질의 변환과정과 2. 변환된 질의의 각 조각 (conjunct)의 질의 결과를 효율적으로 구하고 결과를 조합하는 두 단계로 이루어진 효율적 인 질의 처리 기법을 제안한다. 제안하는 질의 변환 알고리즘이 안전성(soundness)을 가짐 을 보이고, 질의 처리 기법이 기존 질의 처리 방식에 비하여 효율적임을 보인다.

  • PDF

멀티미디어 스트림의 QoS를 보장하는 통합형 파일시스템 (An Integrated File System for Guaranteeing the Quality of Service of Multimedia Stream)

  • 김태석;박경민;최정완;김두한;원유집;고건;박승민;김정기
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권9호
    • /
    • pp.527-535
    • /
    • 2004
  • 통합형 파일시스템이 차세대 파일시스템으로 주목받으면서 디지털 셋톱박스나 스트리밍 서버에서 멀티미디어 서비스의 QoS를 보장함과 동시에 텍스트 기반의 웹 문서나 그림 파일 등의 입출력 요청을 처리하는 것이 중요한 이슈로 부각되고 있다 그러나 하나의 파일서버에서 다양한 요구사항을 지닌 입출력들을 동시에 처리해야 하는 경우, 입출력 요청들의 디스크 탐색시간을 최소화하는 것을 목표로 하는 기존의 파일시스템에서는 멀티미디어 스트림의 QoS를 만족할 수가 없다. 본 논문에서는 이처럼 다양한 입출력 요청이 혼재하는 통합형 환경에서 멀티미디어 스트림의 QoS를 보장하는 파일시스템 개발에 대해 논의하고자 한다. 먼저 다양한 응용프로그램들의 입출력 요청을 QoS 요구사항에 따라 크게 두 가지-주기적인 요청, 산발적인 요청-로 구분하고, 입출력 요청 처리 수준에서 주기적인 요청에 높은 우선순위를 부여함으로써 멀티미디어 스트림의 QoS를 보장하도록 하였다. 또한, 이러한 메커니즘을 리눅스 운영체제에 구현하여 그 성능과 효과를 검증하였다.

빅데이터 분석을 활용한 사물인터넷 키워드에 관한 조망 (An Insight Study on Keyword of IoT Utilizing Big Data Analysis)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.146-147
    • /
    • 2017
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 글로벌 리서치 기관들은 빅데이터 분석을 2011년 이래로 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 새로운 가치 창출을 위해 노력을 하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석 도구인 소셜 매트릭스를 활용하여 분석하였다. 2017년 10월 8일 시점 1개월 기간을 설정하여 "사물인터넷" 키워드에 대한 대중들의 인식을 분석하였다. 빅데이터 분석의 결과는 다음과 같다. 첫째, 사물인터넷 키워드에 대한 1위 연관 검색어는 기술(995)인 것으로 나타났다. 결과를 바탕으로 연구의 한계와 시사점을 제시하고자 한다.

  • PDF

혁신확산이론 기반 소비자 행위의도에 관한 메타분석 (A Meta Analysis of Innovation Diffusion Theory based on Behavioral Intention of Consumer)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.140-141
    • /
    • 2017
  • 빅데이터 분석은 데이터 저장소에 저장된 대용량 데이터 속에서 의미 있는 새로운 상관관계, 패턴, 추세를 발견하여 새로운 가치를 창출하는 과정이다. 또한 빅데이터 분석은 소셜 빅데이터, 실시간 사물지능통신(M2M; Machine to Machine), 센서 데이터, 기업 고객관계 데이터 등 도처에 존재하는 다양한 성격의 빅데이터를 효과적으로 분석하는 것을 말한다. 빅데이터 시대에는 단순히 데이터 베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 폭발적으로 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 빅데이터를 효과적으로 분석하는 것이 무엇보다 중요해졌다. 그런데 메타분석은 여러 실증연구의 정량적인 결과를 통합과 분석을 통해 전체 결과를 조망할 기회를 제공하는 통계적 통합 방법이다. 따라서 본 연구는 우리나라에서 2000년-2017년 사이 혁신확산이론 모델을 기반으로 한 주제로 출판된 연구 50개 논문 750개 샘플을 대상으로 하였다.

  • PDF

특징적 단어 및 이모티콘 집합을 활용한 모바일 기기 내 성별 예측 프레임워크 (On-Device Gender Prediction Framework Based on the Development of Discriminative Word and Emoticon Sets)

  • 김소이;최예림;김윤정;박규연;박종헌
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권11호
    • /
    • pp.733-738
    • /
    • 2015
  • 사용자의 인구통계학적 정보는 추천 시스템과 같은 개인화 서비스 발달에 도움이 되며, 모바일 사용 데이터는 사용자의 인구통계학적 정보 예측에 활용될 수 있다. 특히 텍스트 데이터는 성별 예측에 효과적인 것으로 알려져 있지만, 모바일 텍스트 데이터는 프라이버시 이슈가 존재하여 그 활용이 제한되고 있다. 본 연구에서는 디바이스 내 예측 방법론을 제안하여 모바일 텍스트 데이터를 사용하면서 프라이버시 이슈를 최소화는 동시에 사용자의 성별을 효과적으로 예측하고자 한다. 우선, 성별에 따른 특징이 반영된 웹문서를 수집하여 각 성별에 따른 특징적 단어 집합과 특징적 이모티콘 집합을 구성한다. 단어 집합과 이모티콘 집합을 디바이스 내에서 사용자의 모바일 데이터와 비교하여 성별을 각각 예측하고, 두 예측 결과를 앙상블하여 최종적인 성별 예측 결과를 도출한다. 피실험자들의 모바일 텍스트 데이터를 사용하여 성별 예측 실험을 수행하였으며 제안 방법론의 우수한 성능을 확인하였다.

3차원 그래픽 이미지를 위한 XML 데이타베이스 시스템 (An XML Database System for 3-Dimensional Graphic Images)

  • 황종하;황수찬
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권2호
    • /
    • pp.110-118
    • /
    • 2002
  • 본 논문에서는 3차원 이미지의 내용기반 검색을 지원하는 XML 기반의 3차원 그래픽 데이터 베이스 시스템에 대해 기술한다. 현재 대부분의 그래픽 응용들은 2차원 이미지를 대상으로 하고 있으며 3차원 그래픽스 분야에서는 3차원 이미지의 표현에 대해서만 중점적으로 연구가 되고 있을 뿐 이미지가 포함하고 있는 의미 단위로서의 객체 모델링이나 이들 간의 공간 관계에 대한 처리는 아직 미흡한 실정이다. 본 논문의 모델에서 3차원 이미지는 공간관계를 가지고 있는 3차원 그래픽 객체의 조합으로 표현된다. 복잡한 3차원 객체는 기존의 그래픽 시스템에서 사용하는 선과 면 대신에 기본적인 객체들을 이용하여 모델링된다. 이렇게 구성된 3차원 그래픽 이미지들은 객체 모양이나 객체간의 공간관계를 이용한 내용기반 검색의 대상이 된다. 3차원 그래픽 이미지들은 XML 문서 형태로 표현되며, 이를 위한 3DGML DTD를 정의하였다. 끝으로 웹 기반으로 구현된 프로토타입 시스템에서의 질의 예를 보인다.

2019 개정 RDA 특징 분석에 관한 연구 (A Study on Analyzing the Features of 2019 Revised RDA)

  • 이미화
    • 한국도서관정보학회지
    • /
    • 제50권3호
    • /
    • pp.97-116
    • /
    • 2019
  • 본 연구는 2019년 RDA 개정에 따라 개정 RDA의 특징을 분석하고 이를 바탕으로 목록 측면에서 고려사항을 제안하고자 문헌연구를 실시하였다. 개정 RDA 분석을 통해 목록분야에서 고려사항으로 다음 3가지를 제시하였다. 첫째, 목록데이터를 시맨틱 웹 구축이 가능한 링크드데이터로 변환하려면 목록데이터 보완 및 어휘집 구축과 같은 고품질의 데이터 구축이 우선되어야 한다. 둘째, MARC 데이터를 링크드데이터로 완전하게 변환하기 전까지 MARC가 서지데이터의 유일한 인코딩 포맷이므로 개정 RDA에 반영된 LRM 및 링크드데이터의 새로운 개념을 MARC에서 수용할 수 있도록 이를 확장할 필요가 있다. 셋째, 개정 RDA에 포함된 개체 및 요소별로 다양한 조건과 옵션이 있고, 자료유형에 따라서도 입력 요소가 다르기 때문에 일관된 기술을 위해서는 정책 문서와 이에 적합한 응용프로파일이 구체적으로 개발되어야 한다. 본 연구를 시작으로 앞으로 MARC뿐만 아니라 BIBFRAME에서도 개정 RDA의 새로운 개념을 적용하기 위한 연구가 필요하며, 또한, 목록 규칙의 개정이 필요한 국가 및 도서관에서는 개정 RDA 규칙과 레지스트리를 이용할 수 있도록 RDA를 수용하는 방안을 고려해 볼 필요가 있다.

빅데이터 분석 도구 R을 이용한 비정형 데이터 텍스트 마이닝과 시각화 (Text Mining and Visualization of Unstructured Data Using Big Data Analytical Tool R)

  • 남수태;신성윤;진찬용
    • 한국정보통신학회논문지
    • /
    • 제25권9호
    • /
    • pp.1199-1205
    • /
    • 2021
  • 빅데이터 시대에는 단순히 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 실시간 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 빅데이터를 효과적으로 분석하는 것이 매우 중요하다. 빅데이터 분석은 데이터 저장소에 저장된 빅데이터 속에서 의미 있는 새로운 상관관계, 패턴, 추세를 발견하여 새로운 가치를 창출하는 과정이다. 빅데이터 분석 도구인 R 언어를 이용하여 비정형 논문 데이터를 빈도분석을 통해 분석결과를 요약과 시각화하고자 한다. 본 연구에서 사용된 데이터는 한국정보통신학회 학회지 논문 중에서 2021년 1월호-5월호 총 논문 104편을 대상으로 분석하였다. 최종 분석결과 가장 많이 언급된 키워드는 "데이터"가 1,538회로 1위를 차지하였다. 따라서 분석결과를 바탕으로 연구의 한계와 이론적 실무적 시사점을 제시하고자 한다.

영화 스크립트 내 감정 정보를 이용한 시각화 (Visualization using Emotion Information in Movie Script)

  • 김진수
    • 한국융합학회논문지
    • /
    • 제9권11호
    • /
    • pp.69-74
    • /
    • 2018
  • 인터넷 기술과 다양한 정보 기술의 융합을 통해 광대한 정보를 수집 및 가공하여 사용자 취향에 맞는 다양한 지식을 서로 주고받을 수 있게 되었다. 특히, 영화 미디어 속에 내포된 감정 변화의 흐름을 통해 사용자의 취향과 연결된 밀접한 콘텐츠를 선호하는 경향이 있다. 사용자는 스크립트에 나타난 정보를 바탕으로 전체적인 감정의 흐름이나 특정한 등장인물, 또는 특정한 장면에서의 감정의 흐름을 보다 빠르게 이해하기 위해 시각화하고자 한다. 본 논문에서는 영화 웹페이지로부터 정제되지 않은 데이터를 획득한 후, 정제 과정을 거쳐 표준화된 스크립트 형식으로 변환한다. 정제된 데이터를 XML 문서로 변환하여 다양한 정보를 쉽게 획득한 후, 감정 예측 시스템에 각 문단을 입력하여 다양한 감정을 예측한다. 예측된 감정들의 흐름과 스크립트에 포함된 정보량을 혼합하여 사용자가 필요로 하는 다양한 감정의 전체적 또는 특정 부분에서 캐릭터들 간의 감정 상태의 변화를 시각화를 통해 쉽게 이해할 수 있는 시스템을 제안한다.