• 제목/요약/키워드: Web Document Analysis

검색결과 139건 처리시간 0.031초

Publication trends of somatic mutation and recombination tests research: a bibliometric analysis (1984-2020)

  • Tagorti, Ghada;Kaya, Bulent
    • Genomics & Informatics
    • /
    • 제20권1호
    • /
    • pp.10.1-10.15
    • /
    • 2022
  • Human exposure to pollutants has been on the rise. Thus, researchers have been focused on understanding the effect of these compounds on human health, especially on the genetic information by using various tests, among them the somatic mutation and recombination tests (SMARTs). It is a sensitive and accurate method applicable to genotoxicity analysis. Here, a comprehensive bibliometric analysis of SMART assays in genotoxicity studies was performed to assess publication trends of this field. Data were extracted from the Web of Science database and analyzed by the bibliometric tools HistCite, Biblioshiny (RStudio), VOSViewer, and CiteSpace. Results have shown an increase in the last 10 years in terms of publication. A total of 392 records were published in 96 sources mainly from Brazil, Spain, and Turkey. Research collaboration networks between countries and authors were performed. Based on document co-citation, five large research clusters were identified and analyzed. The youngest research frontier emphasized on nanoparticles. With this study, how research trends evolve over years was demonstrated. Thus, international collaboration could be enhanced, and a promising field could be developed.

래퍼 기반 경제 데이터 수집 시스템 설계 및 구현 (Wrapper-based Economy Data Collection System Design And Implementation)

  • 박철호;구영현;유성준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.227-230
    • /
    • 2015
  • 경제의 흐름, 주가 등을 분석, 예측을 위해 경제 뉴스, 주가 등 데이터 수집이 필요하다. 일반적인 웹 크롤러는 자동적으로 웹서버를 방문하면서 웹페이지 내용을 분석하고 URL들을 추출하면서 웹 문서를 수집한다. 반면 특정한 주제의 문서만을 수집할 수 있는 크롤러 형태도 있다. 특정 사이트에서 경제 뉴스 정보만 수집하기 위하여 사이트의 구조를 분석하고 직접적으로 데이터를 수집해올 수 있는 래퍼 기반 웹 크롤러 설계가 필요하다. 본 논문에서는 빅데이터를 기반으로, 경제뉴스 분석 시스템을 위한 크롤러 래퍼를 설계, 구현하여 경제 전문 분야의 뉴스 데이터를 수집하였다. 2000년부터 현재까지 미국 자동차 시장의 주식 데이터를 래퍼 기반으로 가져오고, 사이트 상에서의 데이터가 업데이트되는 주기를 판단하여 주기적으로 업데이트 함으로써 중복되지 않게 하였다. 그리고 미국, 한국의 경제 기사를 래퍼 기반의 웹 크롤러를 사용하여 수집하고, 향후 분석이 쉽게 데이터를 정형화 시켜 저장한다.

  • PDF

SMIL, RDF, WIDL 문서의 통합 객체 모델링 (Integrated Object Modeling for SMIL, RDF, WIDL Documents)

  • 김상은;하얀;김용성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권1호
    • /
    • pp.14-25
    • /
    • 2001
  • XML은 다양하게 응용할 수가 있어 여러 분야에서 널리 사용되고 있다. 그러나 이러한 응용들에 대해서 통합적으로 관리해 주는 시스템은 제안된 바 없어, 각각의 응용에 대해 별개의 언어로 사용되고 있다. 따라서, 본 논문은 XML의 다양한 응용 중에 웹을 기반으로 하는 대표적인 응용인 SMIL, RDF, WIDL에 대해, 이들의 DTD와 문서 인스턴스를 통합하여 객체 모델링을 하고자 한다. 각 XML 응용에 대해 객체 모델링 규칙과 알고리즘을 통합할 수 있는 시스템을 제안한다. 이를 통해 XML 종류에 상관없이 웹 기반 XML 응용의 구조를 쉽게 파악할 수 있으므로 문서 생성을 용이하게 하며, 객체지향 스키마를 쉽게 생성할 수 있으므로 객체지향 데이터베이스 문서관리의 기반이 될 것이다.

  • PDF

웹 서비스 보안에 관한 연구 (A Study on Web service security)

  • 김배현;나원식;권문택
    • 한국사이버테러정보전학회:학술대회논문집
    • /
    • 한국사이버테러정보전학회 2004년도 제1회 춘계학술발표대회
    • /
    • pp.85-90
    • /
    • 2004
  • 웹 서비스로의 진화는 기존에 존재하고 있는 다양한 시스템들을 통합하여 운영해줌으로써 기업의 비즈니스 환경에 변화를 가져올 뿐 아니라 다양한 분야에서 활용될 것이다. 하지만 아직 웹 서비스 표준이 완전히 정립되지 않았고, 업체 간 상호운영성 및 보안 문제 등 웹 서비스가 실제적으로 운영되기 위해서 해결 되어할 문제가 아직 많다. 특히 웹 서비스 보안 문제를 해결하지 않는다면 웹 서비스 기술은 더 이상 활성화되지 않을 것이다. 그러므로 웹 서비스의 특성에 적합한 보안기술 개발이 요구된다. 본 논문은 웹 서비스가 실제적으로 운영되기 위한 몇 가지 문제점들 가운데 보안에 관련된 문제점을 해결하기 위한 웹 서비스 보안 기술의 개발 방향과 발전 방향을 분석하여 제시하고자 한다.

  • PDF

Knowledge Domain and Emerging Trends of Intelligent Green Building and Smart City - A Visual Analysis Using CiteSpace

  • Li, Hongyang;Dai, Mingjie
    • 국제학술발표논문집
    • /
    • The 7th International Conference on Construction Engineering and Project Management Summit Forum on Sustainable Construction and Management
    • /
    • pp.24-31
    • /
    • 2017
  • As the concept of sustainability becomes more and more popular, a large amount of literature have been recorded recently on intelligent green building and smart city (IGB&SC). It is therefore needed to systematically analyse the existing knowledge structure as well as the future new development of this domain through the identification of the thematic trends, landmark articles, typical keywords together with co-operative researchers. In this paper, Citespace software package is applied to analyse the citation networks and other relevant data of the past eleven years (from 2006 to 2016) collected from Web of Science (WOS). Through this, a series of professional document analysis are conducted, including the production of core authors, the influence made by the most cited authors, keywords extraction and timezone analysis, hot topics of research, highly cited papers and trends with regard to co-citation analysis, etc. As a result, the development track of the IGB&SC domains is revealed and visualized and the following results reached: (i) in the research area of IGB&SC, the most productive researcher is Winters JV and Caragliu A is most influential on the other hand; (ii) different focuses of IGB&SC research have been emerged continually from 2006 to 2016 e.g. smart growth, sustainability, smart city, big data, etc.; (iii) Hollands's work is identified with the most citations and the emerging trends, as revealed from the bursts analysis in document co-citations, can be concluded as smart growth, the assessment of intelligent green building and smart city.

  • PDF

Web에서의 협력 환경 구축 방안 연구 (A Study on the Construction Method of Collaboration Environment for Web)

  • 이재호
    • 정보교육학회논문지
    • /
    • 제1권1호
    • /
    • pp.74-81
    • /
    • 1997
  • 현재 World Wide Web (이하 Web) 자체를 일반 사용자들이 인터넷으로 인식하고 있는 상황에서 잘못된 정보의 전달은 매우 큰 문제이며, 이것은 존재하는 정보를 잘못 가공하는 데에서 기인하게 된다. 잘못 가공된 정보의 전달을 방지하는 방법으로 여러가지가 있으나, 이중 가장 대표적인 것으로 인식되는 것이 바로 CSCW이다. CSCW 환경은 클라이언트-서버 환경과 같은 단일 시스템에서의 공동 작업 공간을 다중의 사용자에게 제공하여 주는 것으로 인터넷 또는 인트라넷 환경과 같은 분산 공유 정보 시스템 환경 즉, 다중의 이질적인 시스템과 다중 사용자 환경에서 사용시는 다수의 추가적 요소를 필요로 하게 된다. 이러한 문제점을 해결하려는 것이 협력으로 폐쇄적인 인터넷인 인트라넷에서의 이질적인 전산환경 특히, 교육, 생산, 마케팅 분야 및 정부에서 사용시 많은 이점이 있다. 본 논문에서는 현재 협력의 골격이 되는 CSCW, 그룹 웨어등의 개념을 먼저 살펴보고, 다음으로 협력의 정의와 분류, 문제점 분석, 그리고 Web에서의 협력 환경 구축 방안에 대하여 기술하겠다.

  • PDF

웹기반 '인공호흡관리' 교육프로그램 개발 (The Development of Web-Based Ventilator Management Education Program)

  • 최영순
    • 한국산학기술학회논문지
    • /
    • 제13권11호
    • /
    • pp.5284-5291
    • /
    • 2012
  • 본 이 연구는 간호현장의 간호요구를 반영한 웹기반의 '인공호흡관리' 교육프로그램을 개발하여 간호업무에 도움을 주기 위한 것이다. 교육프로그램은 ISD 모델 구축과정인 분석, 설계, 개발, 운영, 평가의 방법으로 개발되었다. 교육프로그램 개발은 2011년 4월부터 7월까지이며, 자료분석은 SPSS 18.0을 이용하였다. 분석단계에서 문헌고찰과 요구도분석, 내용분석, 학습자분석, 기술 및 환경분석 등이 실시되었다. 이 과정에서 인공호흡실무에 대한 교육요구가 높았고 대상자의 다수는 30세 이하로 3년 미만의 중환자실 경력을 보이는 것으로 조사되었다. 설계단계에서는 내용전문가 집단이 제공한 콘텐츠 교육내용을 프로그램 전문가와의 협의를 통해 정보설계, 상호작용설계, 동기설계가 시행되었다. 또한, 학습자가 학습해야 할 학습단원의 정보를 구분하여 구성하고, 각 주제 단원마다 그래픽, 음성, 동영상을 삽입하여 교육의 효과를 증진할 수 있도록 구성하였다. 그리고, 교수자와 학습자간 상호작용을 돕기 위한 다양한 방법을 포함하여 설계하였다. 개발단계에서는 이야기 전개도를 작성하고 관련문헌과 자료 검토를 통해 자료를 수집하여 통합 제작하였다. 운영 및 평가단계에서는 개발된 '인공호흡관리' 교육프로그램을 실행하고, 전문가와 대상자로부터 교육프로그램을 평가한 후 평가결과를 바탕으로 내용을 수정 보완하였다. 본 웹기반 '인공호흡관리' 교육프로그램은 프로그램 구축단계에서 간호실무의 다양한 요구를 반영하여 개발되어 간호업무 향상에 기여할 것으로 사료된다.

웹기록물 보존을 위한 전자기록물 장기보존포맷 확장 설계 (Extension of the Long-term Archival Information Package for Electronic Records to Accommodate Web Records)

  • 박병주;차승준;이규철
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.33-47
    • /
    • 2010
  • 웹기록물은 공공기관의 업무활동이나 전자상거래에 대한 법적증거로 활용될 수 있기 때문에 보존할 가치가 있는 정보이지만 웹기록물의 특징 중 하나인 '휘발성'으로 인해 소실되고 있다. 따라서 이렇게 사라지는 웹기록물을 장기보존하기 위한 장기보존포맷이 정의되어야 한다. 웹기록물은 전자기록물의 일종이기 때문에 전자기록물 장기보존포맷에 보존할 수 있어야 한다. 하지만 현재 표준으로 제시된 포맷은 웹기록물의 특성을 고려하지 않고 정의되었기 때문에 웹기록물을 보존할 수 없다. 본 논문에서는 표면/심층 웹기록물 문서보존포맷으로 연구된 KoDeWeb/KoSurWeb과 전자기록물 장기보존포맷을 분석하고, 이를 바탕으로 웹기록물을 보존할 수 있는 확장된 전자기록물 장기보존포맷을 정의하였다. 정의된 포맷을 활용하면 웹기록물도 전자기록물들과 같이 보존되어 활용될 수 있고, 전자 상거래에 관련된 공공기관의 웹기록물을 보존함으로써 전자 상거래에 대한 법적 증거로서 활용될 수 있다.

xPlaneb: XML문서 검색을 위한 3차원 비트맵 인덱스 (xPlaneb: 3-Dimensional Bitmap Index for Index Document Retrieval)

  • 이재민;황병연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.331-339
    • /
    • 2004
  • XML은 다양한 장점을 통해 데이타를 표현하고 교환하기 위한 새로운 표준이 되었으며 현대의 많은 연구와 새로운 기술들에서 핵심적인 요소가 되고 있다. 그러나 XML의 장점인 자기 서술적인 특징은 구조적으로 상이한 XML 문서의 확산을 초래하게 되었고 이에 따라 XML의 효과적인 검색에 대한 연구의 필요성이 대두되게 되었다. 본 논문에서는 빠른 검색 속도를 통해 뛰어난 성능을 입증한 비트맵 인덱싱인 BitCube의 문제점을 분석한다. 또한 BitCube의 문제점을 해결하기 위해 연결 리스트를 이용한 새로운 3차원 비트맵 인덱싱인 xPlaneb(XML Plane Web)를 설계 및 구현한다. 제안된 기법은 BitCube의 3차원 배열 인덱스를 효율적인 노드로 재구성하고 BitCube의 연산을 대체하는 새로운 연산들을 활용하여 효과적으로 정보를 추출한다. 성능 평가를 통해 제안된 기법이 클러스터내의 문서의 양이 증가함에 따라 BitCube보다 메모리 사용량과 연산 수행 속도면에서 더 우수하다는 것을 보였다.

조현병 관련 주요 일간지 기사에 대한 텍스트 마이닝 분석 (Text-Mining Analyses of News Articles on Schizophrenia)

  • 남희정;류승형
    • 대한조현병학회지
    • /
    • 제23권2호
    • /
    • pp.58-64
    • /
    • 2020
  • Objectives: In this study, we conducted an exploratory analysis of the current media trends on schizophrenia using text-mining methods. Methods: First, web-crawling techniques extracted text data from 575 news articles in 10 major newspapers between 2018 and 2019, which were selected by searching "schizophrenia" in the Naver News. We had developed document-term matrix (DTM) and/or term-document matrix (TDM) through pre-processing techniques. Through the use of DTM and TDM, frequency analysis, co-occurrence network analysis, and topic model analysis were conducted. Results: Frequency analysis showed that keywords such as "police," "mental illness," "admission," "patient," "crime," "apartment," "lethal weapon," "treatment," "Jinju," and "residents" were frequently mentioned in news articles on schizophrenia. Within the article text, many of these keywords were highly correlated with the term "schizophrenia" and were also interconnected with each other in the co-occurrence network. The latent Dirichlet allocation model presented 10 topics comprising a combination of keywords: "police-Jinju," "hospital-admission," "research-finding," "care-center," "schizophrenia-symptom," "society-issue," "family-mind," "woman-school," and "disabled-facilities." Conclusion: The results of the present study highlight that in recent years, the media has been reporting violence in patients with schizophrenia, thereby raising an important issue of hospitalization and community management of patients with schizophrenia.