• 제목/요약/키워드: 웹 검색

검색결과 2,248건 처리시간 0.034초

웹 이용자를 위한 통계 메타데이터: 통계정보 제공사이트의 메타데이터 제공 수준 평가 사례 연구 (Statistical Metadata for Users: A Case Study on the Level of Metadata Provision on Statistical Agency Websites)

  • 오정선
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.161-179
    • /
    • 2007
  • 디지털 도서관을 통해 제공되는 정보 자원의 형태와 종류가 다양화됨에 따라 자료의 유형별로 적정 수준의 메타데이터를 정의하고 제공하는 것이 또 다른 과제로 대두되고 있다. 일반 텍스트 자료와 달리 수치로 표현된 데이터에 대한 해석을 필요로 하는 통계 자료의 특성상, 통계 도메인에서 메타데이터는 통계 자료의 검색뿐 아니라 검색된 자료의 정확한 이해와 활용을 위한 필수적인 도구로 인식되고 있다. 하지만 기존의 통계 메타데이터 연구는 통계 작성 기관이나 분석 기관의 전문적인 요구에 중점을 두고 있어, 인터넷을 통해 통계 자료에 접근하는 일반 이용자들의 관점에서의 논의는 상대적으로 부족한 실정이다. 일반 이용자를 위한 통계 메타데이터에 대한 논의의 단초로서, 본 연구는 미국의 연방 통계 기관인 the Bureau of Labor Statistics (BLS, http://www.bls.gov/) 및 the Energy Information Administration (EIA, http://eia.doe.gov/)의 웹사이트에 대한 내용 분석을 통해, 현재 인터넷을 통해 통계 자료에 접근하는 이용자들에게 제공되고 있는 메타데이터의 현황을 평가하였다. 본 사례 연구의 결과는 이들 웹사이트를 통해 제공되는 방대한 양의 자료에도 불구하고 메타데이터의 제공 수준은 국제 기구에 의해 정의된 최소 수준에 미치지 못함을 나타내고 있어, 이용자 중심의 메타데이터 설계의 필요성을 재확인 하고 있다.

데이터 본질 기반의 데이터 분류 방법론 (A Data Taxonomy Methodology based on Their Origin)

  • 최미영;문창주;백두권;권주흠;이영무
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권2호
    • /
    • pp.163-176
    • /
    • 2010
  • 조직의 데이터를 효과적으로 관리하는 대표적 방법은 기존 데이터의 공유와 재사용을 촉진하여 데이터의 중복 생산을 방지하는 것이다. 데이터 공유와 재사용의 촉진을 위해서 기존 데이터의 체계적 구조화와 효율적인 검색이 지원되어야 한다. 이러한 점이 고려되지 않은 조직간 단절된 데이터 개발은 데이터 중복을 양산하고 데이터의 품질을 저하시킨다. 데이터 분류는 관리하는 데이터에 대한 체계적 정리로 원하는 데이터 요소의 빠른 검색을 가능하게 한다. 본 논문에서는 데이터 공유, 재사용과 통합을 극대화하고 MDR과 시멘틱 웹에서 효과적으로 사용될 수 있는 본질기반 데이터 분류 방법론을 제안한다. 본질기반 데이터 분류 방법론은 데이터 본질을 기반으로 데이터 분류 구조를 구성하여 업무분류에 독립적인 데이터 분류가 가능하다. 또한 제시된 데이터 분류 구조를 지원하는 데이터 분류 절차를 제시하여 다양한 데이터 요소들을 데이터 분류 구조에 따라 배치하는 방법을 보인다. 사례연구에서는 제안된 데이터 분류 구조와 데이터 분류절차가 효과적으로 실제에 적용 될수 있음을 보였다.

웹에서의 XML 질의 캐쉬 기법 (Techniques of XML Query Caching on the Web)

  • 박대성;강현철
    • 한국전자거래학회지
    • /
    • 제11권1호
    • /
    • pp.1-23
    • /
    • 2006
  • e-Commerce와 같은 응용 등에 의해 점에서 XML데이터의 양이 많아짐에 따라 XML질의 처리를 신속하게 해주는 기술이 필요하게 되었다. 이를 가능하게 해주는 것이 XML질의 캐슁이다. 자주 제기되는 질의에 대하여 질의 결과를 캐쉬한 후, 동일 질의에 재사용 함으로써 빠른 응답 시간을 보장할 수 있다. 본 논문에서는 XML 질의 결과의 포맷으로 가장 보편적으로 사용되고 있는 노드 식별자 집합(NIS)을 캐쉬하여 XML 질의 성능을 향상시키는 기법을 제안한다. 캐쉬되는 NIS는 질의 결과를 구성하는 소스 XML 엘리먼트들의 식별자 집합이다. 따라서 NIS는 질의 결과의 재구성, 변형, 다른 데이터와의 통합 등 정 응용의 데이터 검색 요건을 충족시키기에 적절하고, XML 소스의 변경에 따른 점진적 갱신에 효율적이다. 그러나 XML문서 형태로 질의 결과를 반환해야 할 경우에는 소스 XML 엘리먼트를 검색하는 실체화 과정을 필요로 한다. 본 논문에서는 세 가지의 서로 다른 NIS의 구성을 고려하여 이들의 생성, 실체화. 점진적 갱신 알고리즘을 제안하고 RD BMS를 이용하여 구현하였다. 다양한 실험을 통한 성능 평가 결과 본 논문에서 제시하는 XML질의 캐쉬 기병의 효율성을 확확하였다.

  • PDF

결합형 방법론 관점에서의 플랫폼 비즈니스의 성공과 실패에 대한 연구 (Research on Success & Failure of Platform business in perspective of multi-method research)

  • 진동수
    • 통상정보연구
    • /
    • 제15권2호
    • /
    • pp.387-410
    • /
    • 2013
  • 기업들 간의 경쟁양상이 기존의 기업 대 기업에서 기업군 대 기업군 혹은 생태계로도 명명되는 플랫폼 대 플랫폼으로 변모하고 있는 가운데, 이와 같은 플랫폼을 기반으로 한 비즈니스가 주목받고 있다. 애플사와 같이 하드웨어와 소프트웨어를 결합한 플랫폼이 제공하는 장점들을 결합한 플랫폼 비즈니스는 소셜 네트워크, 검색엔진, 운영 시스템과 같은 영역에서 활발히 나타나고 있다. 본 연구에서는 이와 같은 비즈니스적 상황을 주목하면서, 플랫폼과 플랫폼 비즈니스를 정의하고 관련 기존 연구문헌 들에 대하여 고찰하였다. 플랫폼 비즈니스라는 영역이 기존 정보시스템 연구 영역 중에서 상대적으로 새로운 영역이라는 부분에 주목하고, Yin(2011)의 사례연구 방법론, Eisenhardt(2007)의 사례분석 방법론, Romano(2003)등의 웹 기반 정성 데이터 분석 방법, Creswll(2010)의 개방 코딩 기법의 네 가지 연구방법을 분석하고, 네 가지 방법이 가지는 장점을 혼합하여 본 연구에서의 연구 방법론을 제안하였다. 이와 같은 연구방법을 바탕으로, 플랫폼 비즈니스 영역 중에서 가장 상업화 정도가 활발하다고 판단한 스마트폰 플랫폼 비즈니스, 소셜 플랫폼 비즈니스, 검색엔진 플랫폼 비즈니스에 대한 성공 및 실패 사례들을 각각 선택하고 본 연구의 방법론 관점에서 개별 사례를 분석하여 성공과 실패에 영향을 미치는 주요 요인들을 도출하였다. 발견된 주요 요인을 바탕으로, 플랫폼 비즈니스의 상업적인 성공에 영향을 미칠 수 있는 세 가지 전략적인 요인들을 제시하고, 본 연구의 한계 및 향후 연구 방향에 대하여 제시하였다.

  • PDF

영화리뷰 감성 분석을 통한 평점 예측 연구 (Sentiment Analysis of movie review for predicting movie rating)

  • 조정태;최상현
    • 경영과정보연구
    • /
    • 제34권3호
    • /
    • pp.161-177
    • /
    • 2015
  • 인터넷 포털은 많은 양의 정보를 빠르고 쉽게 이용 할 수 있다는 특성 때문에 지속적으로 영향력이 커지고 있다. 웹 이용자들은 다양한 정보 습득, 네티즌 간의 정보 교환 등 다양한 목적을 위해 포털 사이트를 사용하고 있다. 문화콘텐츠 이용자들은 타인의 경험을 미리 알아보기 위해 포털 사이트에서 정보를 검색한 후 해당콘텐츠를 사용하고 개인적인 의견을 게시하기도 한다. 영화를 보고자 하는 이용자들은 관련 정보를 검색하고 얻는 과정에서 영화에 대한 다른 이용자들이 게시한 다양한 정보들을 접하게 된다. 영화 관련 포털사이트에서는 영화에 대한 제한된 글자수의 리뷰와 평점을 제공하는데 이와 같은 정보의 영향으로 영화에 대한 태도를 형성할 뿐 아니라, 영화 관람 여부를 결정하도록 만들 수 있다. 하지만 영화 리뷰는 사용자가 전체를 읽을 수 없기 때문에 일부 리뷰와 리뷰 개개의 평점보다는 전체 평점을 참고 하여 의사결정을 하는 정도가 대부분이다. 이처럼 전체 평점만을 참고하게 되면 편향적인 정보 습득으로 인하여 잘못된 판단을 할 수 있게 된다. 이러한 리뷰의 특성에도 불구하고 리뷰는 사용자의 의견을 풍부하게 드러내고 영화를 보지 않은 다른 이용자들의 선택에 영향을 미친다는 점에서 다양한 실용적 활용성을 갖는 데이터임은 분명하다. 본 연구에서는 리뷰 데이터를 활용하여 평점을 예측하기 위한 평점예측 연구를 수행하였다. 리뷰테이터를 형태소로 추출하고 형태소별로 극성값을 계산하여 리뷰에 대한 평점을 예측하는 모형으로서, 기존의 긍부정 값만을 근거로 하는 모형에 비해 정확도가 높아진 것을 확인하였다.

  • PDF

지질용어 시소러스 시스템의 설계 및 구축 (Design and Implementation of Thesaurus System for Geological Terms)

  • 황재홍;지광훈;한종규;연영광;류근호
    • 한국지리정보학회지
    • /
    • 제10권2호
    • /
    • pp.23-35
    • /
    • 2007
  • 최근 정보 검색 분야에서 시맨틱 웹 기술에 따른 인터넷 용어사전과 더불어 시소러스의 필요성이 더욱 중요시되고 있다. 시소러스는 분류와 사전의 결합으로 상위 및 하위개념 사이의 전후관계를 명확히 하기 위해서 공식적으로 조직, 통제된 색인어의 어휘로 인간의 학습, 탐구활동 등 제반 지식활동의 대상이 되는 개념(용어)간의 관계를 표현한 지식구조의 토픽 맵이다. 하지만 시소러스가 용어의 통제 및 표준화와 더불어 정보를 능률적으로 처리하고 검색하는데 필수적인 수단으로 평가되고 있음에도 불구하고 아직까지 지질분야에서 우리말 시소러스가 없는 실정이다. 시소러스를 구축하기 위해서는 표준화되고 잘 정의된 지침이 필요하다. 이러한 표준화된 지침은 보다 효율적인 정보 관리를 가능하게 할 것이며, 정보 이용자 또한 보다 정확한 정보를 쉽고 편리하게 이용할 수 있게 될 것이다. 본 연구는 지질정보 중 가장 기본이 되는 용어 시소러스 시스템 구축 연구이다. 이를 위해서 첫째, 국내외 지질용어 표준화 동향을 살펴보았다. 둘째, 15개 분야에 대한 지질학적 주제를 정하고 각 주제에 대한 분류체계(안)를 마련하였다. 셋째, 지질용어 시소러스 분류체계를 바탕으로 지질용어 시소러스 명세서를 작성하였다. 마지막으로 이 명세서를 이용하여 인터넷기반 지질용어 시소러스 시스템을 설계하고 구축하였다.

  • PDF

플로우 전달 특성 기반의 P2P 헤비 트래픽 검출 알고리즘 (An Algorithm to Detect P2P Heavy Traffic based on Flow Transport Characteristics)

  • 최병걸;이시영;서영일;위즈빈;전재현;김승호
    • 한국정보과학회논문지:정보통신
    • /
    • 제37권5호
    • /
    • pp.317-326
    • /
    • 2010
  • 최근 분산 컴퓨팅 환경이 확대되고 네트워크 기반의 응용프로그램이 다양하게 개발됨에 따라 네트워크 트래픽이 증가되고 있으며, 트래픽 종류도 P2P(Peer to Peer), 실시간 동영상등과 같이 다양해지고 있다. 네트워크 트래픽 중에서 P2P 트래픽이 지속적으로 증가되면서 많은 대역폭을 차지하고 있기 때문에 웹, 파일 전송 및 실시간 동영상등과 같은 다른 네트워크 응용프로그램의 서비스 품질을 보장하지 못하는 상황이 빈번하게 발생하고 있다. P2P 트래픽으로 인한 문제점을 해결하기 위해 기존에 포트 기반의 P2P 트래픽 검출 기법과 패킷들의 내용을 검사하는 DPI(Deep Packet Inspection) 방식의 검출 기법들이 제시되었으나 최근의 P2P 용용프로그램들이 고정된 포트를 사용하지 않으며, 패킷들의 내용을 암호화하여 전송함으로써 기존의 연구 방법을 P2P 트래픽 검출에 적용하기가 어려운 상황이다. 본 논문에서는 기존의 포트 기반의 P2P 트래픽 검출 기법과 DPI 기법의 문제점들을 해결할 수 있는 플로우(flow) 매개 변수의 상관 관계를 이용한 플로우 전달 특성 기반의 P2P Heavy 트래픽 검출 알고리즘을 제시한다. 본 논문에서 제시하는 알고리즘은 P2P 트래픽 중에서 네트워크 대역폭을 가장 많이 차지하는 컨텐츠 다운로드 P2P 트래픽을 검출하는 것이다. P2P 트래픽은 컨텐츠를 가지고 있는 상대 노드(Peer)들을 검색하는 단계와 검색된 노드들 중에 하나 이상의 노드로부터 컨텐츠를 다운로드하는 단계로 이루어진다. 이러한 P2P 응용프로그램들의 특성을 P2P 플로우 패턴으로 정의하고 이를 기반으로 P2P Heavy 트래픽을 검출하는 알고리즘을 개발하였다.

국민참여형 위성영상 블로그 시스템 구축 (Building a Satellite Image Rinsed Blog System Using PPGIS (People Participatory GIS))

  • 이기환;이동천;박석호;김일;신상희
    • 대한원격탐사학회지
    • /
    • 제23권2호
    • /
    • pp.125-130
    • /
    • 2007
  • 전라남도 국민참여형 위성영상 블로그 시스템은 2006년도 행정자치부 자치단체정보화지원사업의 일환으로 구축된 것으로서, 사용자가 고해상도 위성영상 위에 직접 자신의 글, 사진, 동영상을 올리고, 이를 다른 사용자나 시스템과 공유할 수 있도록 구축된 시스템이다. 본 시스템이 궁극적으로 구현하고자 했던 과제는 다음과 같다. (1)지리정보 혹은 기타 정보의 고정성을 탈피하고, (2)지리정보와 멀티미디어 자료의 효율적 통합을 통해 geoUCC를 구축하며, (3)사용자의 참여를 통한 지리정보 제공 방식의 쌍방향성을 구현하여, (4) 사용자를 일방적 자료 활용자에서 자료 생성자로 발전시키고 궁극적으로는 자치단체와 국민 간 새로운 방식의 소통 방식을 생성하는 것이다. 본 시스템 구축의 결과로서 본 시스템에서 일반 국민에게 서비스되는 내용은 다음과 같다. (1) 전라남도 전역의 1m급 고해상도 위성영상의 대국민 서비스, (2)전라남도 전역에 대한 지번 단위까지의 주소 검색 서비스, (3)웹 상에서의 실시간 3차원 GIS 서비스, (4)Web2.0의 철학을 반영한 RSS, Trackback 기능 및 Tag 검색 기능, (5)사용자가 직접 고해상도 위성영상 위에 자신의 글, 사진, 동영상, 홈페이지 등을 올릴 수 있는 "위성영상 블로그 쓰기 기능", (6)국내 거의 모든 포털 사이트의 블로그와 홈페이지를 지원하는 시스템 연계(퍼가기) 기능 등이다. 결론적으로 본 시스템의 사용자는 고해상도 위성영상 기반의 지도 위에 자신의 여행기, 사진, 동영상을 올림으로써 자신만의 사용자제작콘텐츠(UCC)를 생성할 수 있을 뿐만 아니라, 이를 다른 사용자와 공유, 활용함으로써 실질적인 쌍방향, 참여형 지리정보시스템을 이용하게 된 것이다.

텍스트 마이닝을 활용한 노인장기요양보험에서의 작업치료: 2007-2018년 (Occupational Therapy in Long-Term Care Insurance For the Elderly Using Text Mining)

  • 조민석;백순형;박엄지;박수희
    • 고령자・치매작업치료학회지
    • /
    • 제12권2호
    • /
    • pp.67-74
    • /
    • 2018
  • 목적 본 연구의 목적은 텍스트 마이닝이라는 빅데이터 분석 기법 중 하나를 활용하여 노인장기요양보험에서 작업치료의 역할을 정량적으로 분석하는 것이다. 연구방법 신문기사 분석을 위해 2007~208년까지 기간 설정 후 "노인장기요양보험+작업치료"를 주제어로 수집하였다. Textom이라는 웹 크롤링(Web Crawling)을 활용해 국내 검색엔진 네이버에서 <네이버뉴스>의 데이터베이스를 활용하였다. 수집결과 노인장기요양보험+작업치료 검색에서 510편의 뉴스 데이터의 기사제목과 원문을 수집한 후 연도별 기사 빈도, 핵심어분석을 시행하였다. 연구결과 연도별 기사 발행 빈도를 살펴보면 2015년과 2017년 발행한 기사 수가 70편(13.7%)으로 가장 많았고, 핵심어 분석 상위 10개의 용어는 '치매'(344)가 가장 많았으며, 작업과 핵심어의 관례를 알아보면, 치매, 치료, 병원, 건강, 서비스, 재활, 시설, 제도, 등급, 어르신, 전문, 급여, 공단, 국민이 관련이 있는 것으로 나타났다. 결론 본 연구에서는 텍스트 마이닝 기법을 통해 11년간의 노인장기요양보험의 언론 보도 동향을 토대로 관련 핵심 키워드에서 치매와 재활에 대해 사회적 요구와 작업치료사의 역할을 보다 객관적으로 확인하였다는 점에서 의의가 있다. 이 결과를 바탕으로 다음 연구에서는 연도에 따른 다양한 분석방법을 통해 연구방법론을 보완하여야 할 것이다.

AI를 활용한 메타데이터 추출 및 웹서비스용 메타데이터 고도화 연구 (Metadata extraction using AI and advanced metadata research for web services)

  • 박성환
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.499-503
    • /
    • 2024
  • 방송 프로그램은 자체 방송 송출 외에도 인터넷 다시 보기, OTT, IPTV 서비스 등 다양한 매체에 제공되고 있다. 이 경우 콘텐츠 특성을 잘 나타내는 검색용 키워드 제공은 필수적이다. 방송사에서는 제작 단계, 아카이브 단계 등에서 주요 키워드를 수동으로 입력하는 방법을 주로 사용한다. 이 방식은 양적으로는 핵심 메타데이터 확보에 부족하고, 내용 면에서도 타 매체 서비스에서 콘텐츠 추천과 검색에 한계를 드러낸다. 본 연구는 EBS에서 개발한 DTV 자막방송 서버를 통해 사전 아카이빙 된 폐쇄형 자막 데이터를 활용하여 다수의 메타데이터를 확보하는 방법을 구현했다. 먼저 구글의 자연어 처리 AI 기술을 적용하여 핵심 메타데이터를 자동으로 추출하였다. 다음 단계는 핵심 연구 내용으로 우선순위와 콘텐츠 특성을 반영하여 핵심 메타데이터를 찾는 방법을 제안한다. 차별화된 메타데이터 가중치를 구하는 기술로는 TF-IDF 계산법을 응용하여 중요도를 분류했다. 실험 결과 성공적인 가중치 데이터를 얻었다. 이 연구로 확보한 문자열 메타데이터는 추후 문자열 유사도 측정 연구와 결합하면 타 매체에 제공하는 콘텐츠 서비스에서 정교한 콘텐츠 추천용 메타데이터를 확보하는 기반이 된다.