• 제목/요약/키워드: Web document

검색결과 759건 처리시간 0.026초

오픈소스 도구를 이용한 기록정보 링크드 오픈 데이터 구축 절차 연구 (A Study on the Procedure for Constructing Linked Open Data of Records Information by Using Open Source Tool)

  • 하승록;임진희;이해영
    • 정보관리학회지
    • /
    • 제34권1호
    • /
    • pp.341-371
    • /
    • 2017
  • 웹을 통해 제공되는 서비스는 현재 문서중심에서 데이터 중심으로 변화를 겪고 있으며, 그 변화의 중심에는 Linked Open Data(LOD)가 존재한다. 본 연구는 이러한 흐름에 부응하여 기록정보의 LOD 구축을 위한 구체적인 절차와 방법을 살펴보고자 하였다. 또한 소규모 아카이브의 서비스 지속가능성을 염두에 두고, 오픈소스 소프트웨어를 활용하여 LOD 구축 절차를 진행하는 범례를 제시하고자 했다. 이에 본 연구에서는 LOD 구축을 위한 5단계의 프레임워크를 제안했다. 그리고 일상아카이브인 '인간과 기억 아카이브'의 일기 기록물 컬렉션을 수집하여, 제안된 5단계 프레임워크에 따라 오픈소스 소프트웨어인 Protege와 Apache Jena Fuseki를 활용하여 POC(Proof of concept)를 진행하였다. 오픈소스를 활용하여 기록정보의 LOD를 구축한 뒤, 상호연결(Interlinking)과 SPARQL 검색을 통해서 외부 LOD와 연결되는 모습을 확인할 수 있었다. 또한 기록정보의 LOD 구축 절차 진행과정의 경험을 바탕으로 내용정보 기술의 품질 향상, 아키비스트의 역량 고도화, 기록정보의 접근성 향상을 위한 상호연결 고도화, LOD 서비스의 수준 결정, LOD 구축을 위한 도구 선정 등, 기록관 LOD 구축을 위한 필요요건을 제시했다.

내장형 소프트웨어 마르코프 체인 모델과 단위 테스트를 이용한 내장형 소프트웨어 신뢰도 분석 도구의 설계와 구현 (A Design and Implementation of Reliability Analyzer for Embedded Software using Markov Chain Model and Unit Testing)

  • 곽동규;유재우;최재영
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권12호
    • /
    • pp.1-10
    • /
    • 2011
  • 내장형 시스템의요구사항이 복잡해짐에 따라 내장형 소프트웨어의 신뢰도를분석하기 위한 도구가 요구되고있다. 소프트웨어의 신뢰도를 분석하는 방법으로는 확률적 모델링을 이용하는데, 다수의 디바이스를 제어하는 내장형 소프트웨어에 적용하기 위해서는 내장형 소프트웨어에 특성화 시킬 필요가 있다. 또한, 기존의 신뢰도 분석 도구는 각 상태간의 전이 확률을 다른 방법으로 측정해야 하고, 한 번 작성한 모델에 대해 재사용을 고려하고 있지 않는다. 본 논문은 내장형 소프트웨어의 신뢰도를 분석하기 위해 내장형 소프트웨어 마르코프 체인 모델과 단위 테스팅 도구를 이용한 신뢰도 분석 도구를 제안한다. 내장형 소프트웨어 마르코프 체인 모델은 신뢰도 분석 방법으로 많이 사용되고 있는 마르코프 체인 모델을 내장형 소프트웨어에 특성화 시킨 모델이다. 그리고 단위 테스팅 도구는 내장형 소프트웨어의 개발환경에 적합한 호스트/타겟 구조를 가지고 있다. 제안하는 도구는 신뢰도 분석을 위해 단위간 전이 확률을 단위 테스트 결과로부터 자동으로 측정하여 기존의 도구보다 용이하게 신뢰도를 분석할 수 있다. 그리고 소프트웨어 모델을 XML 기반의 문서로 표현하여 단위 테스팅 도구가 업데이트 시킨 테스트 결과를 바로 적용할수 있고, 웹 기반의 인터페이스와 SVN 저장소를 이용하여 다수의 개발자가 쉽게 접근할 수 있는 장점을 갖는다. 본 논문에서는 예제를 이용하여 신뢰도의 분석을 보이고 신뢰도 측정에 유용함을 보인다.

PDF 형식 북스캔 파일 불법 유통 방지를 위한 관리 프레임워크 (A framework of management for preventing illegal distribution of pdf bookscan file)

  • 이국헌;정현지;유대걸;이상진
    • 정보보호학회논문지
    • /
    • 제23권5호
    • /
    • pp.897-907
    • /
    • 2013
  • 다양한 스마트 기기의 보급으로 인해 종이책이 아닌 전자책(e-book)으로 책을 읽는 사용자가 증가하고 있다. 하지만 전자책으로 출판되는 책의 다양성이 부족하여 사용자가 직접 원하는 책을 스캔하여 전자책으로 만드는 북스캔(Bookscan)이 생겨났다. 현재 북스캔 서비스는 PDF(Portable Document Format), JPG파일 형태로 제공되고 있으며 파일 관리에 대한 문제점으로 인해 PDF 파일 형식이 보편적으로 사용되고 있다. 북 스캐닝은 고가의 장비와 시간 탓에 북스캔 대행업체가 시장을 형성해가고 있다. 하지만 이는 엄연히 저작권법에 위배되는 불법 행위이다. 또한 북스캔 대행업체는 저작물에 대한 보호조치가 없어 북스캔본이 웹을 통해 불법 공유되고 있다. 북스캔 서비스의 저작권 문제로 출판 산업 시장도 과거 소리바다 음원 시장 붕괴와 같은 절차를 밟을 것으로 보인다. 따라서 북스캔에 대해 법제도 정비를 위한 기술적인 뒷받침이 필요하다. 기존 불법 저작물 추적관리 시스템은 음원, 영화에 대해 적용이 되고 출판물에 대해서는 조치가 없었다. 이에 대해 본 논문에서는 실현 가능한 기술을 기반으로 PDF 형식의 북스캔 파일에 대한 관리 프레임 워크를 제시하고자 한다.

Risk of Breast Cancer and Total Malignancies in Rheumatoid Arthritis Patients Undergoing TNF-α Antagonist Therapy: a Meta-analysis of Randomized Control Trials

  • Liu, Yang;Fan, Wei;Chen, Hao;Yu, Ming-Xia
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권8호
    • /
    • pp.3403-3410
    • /
    • 2014
  • Context: Interest exits in whether TNF-alpha antagonists increase the risk of breast cancer and total malignancies in patients with rheumatoid arthritis (RA). Objectives: To analyze the risk of malignancies, especially breast cancer, in patients with RA enrolled in randomized control trials (RCTs). Methods: A systematic literature search for RCTs from 1 January 1998 to 1 July 2013 from online databases, such as PubMed, WILEY, EMBASE, ISI web of knowledge and Cochrane Library was conducted. Studies included RCTs that compared the safety of at least one dose of the five TNF-${\alpha}$ antagonists with placebo or methotrexate (MTX) (or TNF-${\alpha}$ antagonists plus MTX vs placebo plus MTX) in RA patients for more than 24 weeks and imported all the references into document management software EndNote${\times}6$. Two independent reviewers selected studies and extracted the data about study design, patients' characteristics and the type, number of all malignancies. Results: 28 RCTs from 34 records with 11,741 patients were analyzed. Of the total, 97 developed at least one malignancy during the double-blind trials, and breast cancer was observed in 17 patients (17.5% of total malignancies). However, there was no statistically significant increased risk observed in either the per protocol (PP) model (OR 0.65, 95%CI [0.22, 1.93]) or the modified intention to treat (mITT) model (OR 0.75, 95%CI [0.25, 2.21]). There were also no significant trend for increased risk of total malignancies on anti-TNF-${\alpha}$ therapy administered at approved doses in either model (OR, 1.06, 95%CI [0.64, 1.75], and OR, 1.30, 95%CI [0.80, 2.14], respectively). As to the two models, modified intention to treat model analysis led to higher estimation than per protocol model analysis. Conclusions: This study did not find a significantly increased risk of breast cancer and total malignancies in adults RA patients treated with TNF-${\alpha}$ antagonists at approved doses. However, it cannot be ignored that more patients developed malignancies with TNF-${\alpha}$ antagonists therapy compared with patients with placebo or MTX, in spite of the lack of statistical significance, so that more strict clinical trials and long-term follow-up are needed, and both mITT and PP analyses should be used in such safety analyses.

35-Year Research History of Cytotoxicity and Cancer: a Quantitative and Qualitative Analysis

  • Farghadani, Reyhaneh;Haerian, Batoul Sadat;Ebrahim, Nader Ale;Muniandy, Sekaran
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권7호
    • /
    • pp.3139-3145
    • /
    • 2016
  • Cancer is the leading cause of morbidity and mortality worldwide, characterized by irregular cell growth. Cytotoxicity or killing tumor cells that divide rapidly is the basic function of chemotherapeutic drugs. However, these agents can damage normal dividing cells, leading to adverse effects in the body. In view of great advances in cancer therapy, which are increasingly reported each year, we quantitatively and qualitatively evaluated the papers published between 1981 and December 2015, with a closer look at the highly cited papers (HCPs), for a better understanding of literature related to cytotoxicity in cancer therapy. Online documents in the Web of Science (WOS) database were analyzed based on the publication year, the number of times they were cited, research area, source, language, document type, countries, organization-enhanced and funding agencies. A total of 3,473 publications relevant to the target key words were found in the WOS database over 35 years and 86% of them (n=2,993) were published between 2000-2015. These papers had been cited 54,330 times without self-citation from 1981 to 2015. Of the 3,473 publications, 17 (3,557citations) were the most frequently cited ones between 2005 and 2015. The topmost HCP was about generating a comprehensive preclinical database (CCLE) with 825 (23.2%) citations. One third of the remaining HCPs had focused on drug discovery through improving conventional therapeutic agents such as metformin and ginseng. Another 33% of the HCPs concerned engineered nanoparticles (NPs) such as polyamidoamine (PAMAM) dendritic polymers, PTX/SPIO-loaded PLGAs and cell-derived NPs to increase drug effectiveness and decrease drug toxicity in cancer therapy. The remaining HCPs reported novel factors such as miR-205, Nrf2 and p27 suggesting their interference with development of cancer in targeted cancer therapy. In conclusion, analysis of 35-year publications and HCPs on cytotoxicity in cancer in the present report provides opportunities for a better understanding the extent of topics published and may help future research in this area.

웹 문서의 정보블럭 식별을 통한 효과적인 사용자 프로파일 생성방법 (An Effective User-Profile Generation Method based on Identification of Informative Blocks in Web Document)

  • 류상현;이승화;정민철;이은석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.253-257
    • /
    • 2007
  • 최근 웹 상에 정보가 폭발적으로 증가함에 따라, 사용자의 취향에 맞는 정보를 선별하여 제공하는 추천 시스템에 대한 연구가 활발히 진행되고 있다. 추천시스템은 사용자의 관심정보를 기술한 사용자 프로파일을 기반으로 동작하기 때문에 정확한 사용자 프로파일의 생성은 매우 중요하다. 사용자의 암시적인 행동정보를 기반으로 취향을 분석하는 대표적인 연구로 사용자가 이용한 웹 문서를 분석하는 방법이 있다. 이는 사용자가 이용하는 웹 문서에 빈번하게 등장하는 단어를 기반으로 사용자의 프로파일을 생성하는 것이다. 그러나 최근 웹 문서는 사용자 취향과 관련 없는 많은 구성요소들(로고, 저작권정보 등)을 포함하고 있다. 따라서 이러한 내용들을 모두 포함하여 웹 문서를 분석한다면 생성되는 프로파일의 정확도는 낮아질 것이다. 따라서 본 논문에서는 사용자 기기에서 사용자의 웹 문서 이용내역을 분석하고, 동일한 사이트로부터 얻어진 문서들에서 반복적으로 등장하는 블록을 제거한 후, 정보블럭을 식별하여 사용자의 관심단어를 추출하는 새로운 프로파일 생성방법을 제안한다. 이를 통해 보다 정확하고 빠른 프로파일 생성이 가능해진다. 본 논문에서는 제안방법의 평가를 위해, 최근 구매활동이 있었던 사용자들이 이용한 웹 문서 데이터를 수집하였으며, TF-IDF 방법과 제안방법을 이용하여 사용자 프로파일을 각각 추출하였다. 그리고 생성된 사용자 프로파일과 구매데이터와의 연관성을 비교하였으며, 보다 정확한 프로파일이 추출되는 결과와 프로파일 분석시간이 단축되는 결과를 통해 제안방법의 유효성을 입증하였다.)으로 높은 점수를 보였으며 내장첨가량에 따른 관능특성에서는 온쌀죽은 내장 $2{\sim}5%$ 첨가, 반쌀죽은 내장 $3{\sim}5%$ 첨가구에서 유의적(p<0.05)으로 높은 점수를 보였으나 쌀가루죽은 내장 $1{\sim}2%$ 첨가구에서 유의적(p<0.05)으로 낮은 점수를 보였다. 이상의 연구 결과를 통해 온쌀은 2%, 반쌀은 3%, 쌀가루는 4%의 내장을 첨가하여 제조한 전복죽이 이화학적, 물성적 및 관능적으로 우수한 것으로 나타났다.n)방법의 결과와 비교하였다.다. 유비스크립트에서는 모바일 코드의 개념을 통해서 앞서 언급한 유비쿼터스 컴퓨팅 환경에서의 문제점을 해결하고자 하였다. 모바일 코드에서는 프로그램 코드가 네트워크를 통해서 컴퓨터를 이동하면서 수행되는 개념인데, 이는 물리적으로 떨어져있으면서 네트워크로 연결되어 있는 다양한 컴퓨팅 장치가 서로 연동하기 위한 모델에 가장 적합하다. 이는 기본적으로 배포(deploy)라는 단계가 필요 없게 되고, 새로운 버전의 프로그램이 작성될지라도 런타임에 코드가 직접 이동하게 되므로 버전 관리의 문제도 해결된다. 게다가 원격 함수를 매번 호출하지 않고 한번 이동된 코드가 원격지에서 모두 수행을 하게 되므로 성능향상에도 도움이 된다. 장소 객체(Place Object)와 원격 스코프(Remote Scope)는 앞서 설명한 특징을 직접적으로 지원하는 언어 요소이다. 장소 객체는 모바일 코드가 이동해서 수행될 계산 환경(computational environment

  • PDF

나이브 베이즈 기반 소셜 미디어 상의 신조어 감성 판별 기법 (Sensitivity Identification Method for New Words of Social Media based on Naive Bayes Classification)

  • 김정인;박상진;김형주;최준호;김한일;김판구
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.51-59
    • /
    • 2020
  • 인터넷의 발달과 스마트폰의 보급으로 인하여 그에 따른 소셜 미디어 문화가 형성됨에 따라 PC통신부터 지금까지 소셜 미디어 신조어가 그 문화로 자리 잡아가고 있다. 소셜 미디어의 등장과 사람들의 가교역할을 해주는 스마트폰의 보급화로 신조어가 생기고 빈번하게 사용되고 있는 추세이다. 신조어의 사용은 다양한 문자 제한 메신저의 문제점을 해결하고 짧은 문장을 사용하여 데이터를 줄이는 등 많은 장점을 가지고 있다. 그러나 신조어에는 사전적인 의미가 없으므로 데이터 마이닝 기술이나 빅데이터와 같은 연구에서 사용되는 알고리즘의 성능 저하와 연구에 제약사항이 발생한다. 따라서 본 논문에서는 웹 크롤링을 통해 텍스트 데이터를 추출하고, 텍스트 마이닝과 오피니언 마이닝을 통해 의미부여 및 단어들에 대한 감정적 분류를 통한 문장의 오피니언 파악을 진행하고자 한다. 실험은 다음과 같이 3단계로 진행하였다. 첫째, 소셜 미디어에서 새로운 단어를 수집하여 수집된 단어는 긍정적이고 부정적인 학습을 받게 하였다. 둘째, 표준 문서를 사용하여 감정적 가치를 도출하고 검증하기 위해 TF-IDF를 사용하여 데이터의 감정적 가치를 측정하기 위해 명사 빈도수를 측정한다. 신조어와 마찬가지로 분류된 감정적 가치가 적용되어 감정이 표준 언어 문서로 분류되는지 확인하였다. 마지막으로, 새로 합성된 단어와 표준 감정적 가치의 조합을 사용하여 장비 기술의 비교분석을 수행하였다.

무선 인터넷을 위한 프레임 지원 HTML 변환기의 설계 및 구현 (Design and Implementation of an HTML Converter Supporting Frame for the Wireless Internet)

  • 한진섭;박병준
    • 전자공학회논문지CI
    • /
    • 제42권6호
    • /
    • pp.1-10
    • /
    • 2005
  • 본 논문은 무선 응용 프로토콜 환경에서 무선 인터넷 액세스를 위한 HTML 변환기의 설계 및 구현에 대해 기술한다. 구현된 HTML 변환기는 콘텐츠 변환, 변환 규칙 집합, WML 파일 생성, 프레임 콘텐츠 재구성 모듈로 구성된다. 일반 텍스트 콘텐츠의 경우, 변한 규칙 집합을 참조하여 콘텐츠 변환 모듈에서 일대일 태그 매핑을 통해 WML 콘텐츠로 변환이 되며, 프레임으로 구성된 콘텐츠는 프레임 콘텐츠 재구성 모듈에서 최초에 받은 프레임 셋 소스를 파싱하여, 포함되어 있는 모든 파일 이름들을 가지고 요구 메시지를 구성하여, 파일 개수만큼 다시 서버에 연결해서 각각의 문서들을 받아 처음에 받은 HTML 문서에 연결시키고, 일련의 재구성 과정을 거친 후, 테이블 형태의 WML 콘텐츠로 변환이 된다. 이미지 맵이 포함된 콘텐츠는 이미지 맵 관련 태그를 파싱한 후, 링크되어 있는 HTML 문서의 이름을 추출해서 WML 콘텐츠 데이터로 대체하고, 해당 콘텐츠로 링크시킴으로써 변환이 가능하게 한다. 제안한 프레임 콘텐츠 변환 방법은 기존 상용 변환기와는 달리 사용자의 편의와 상호 운용성이 고려된 변환 방법이며, 이미지 맵의 경우 상용 변환기에서는 지원되지 않는 부분이다.

갱신 연산을 고려한 XML문서의 접근제어 (Access Control of XML Documents Including Update Operators)

  • 임청환;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.567-584
    • /
    • 2004
  • 웹 상에 많은 정보들이 XML 형태로 표현되면서 XML 보안에 대한 요구가 커지고 있다. 현재까지 XML 보안에 대한 연구는 전자서명이나 암호화 기법을 이용한 통신상의 보안을 중심으로 진행되어 왔다. 하지만 XML 데이타가 방대해지고 복잡해짐에 따라 XML에 대한 통신상의 보안뿐만 아니라 관리적인 보안까지 필요하게 되었다. 이러한 관리적인 보안은 접근제어를 통해 보장할 수 있는데, 기존의 XML 접근제어 모델에서는 검색 연산만 고려하고 있다. 이러한 모델은 XML 문서나 구조의 변경이 필요한 현실적인 환경에서 사용자의 갱신 질의의 경우에는 접근제어를 할 수 없는 한계점이 있다. 본 논문에서는 검색 연산뿐만 아니라 갱신 연산까지 지원하는 XML 접근제어 모델과 기법을 제안하고, XML 갱신에 필요한 연산자를 정의한다. 또한 복잡한 접근권한 정보를 체계적으로 관리하고, 다양한 갱신 질의를 효율적으로 처리하기 위해 새로운 액션 타입(action type)을 정의한다. 이러한 액션 타입을 이용하면 DOM 기반의 DTD 검증 과정으로 인한 저장 공간과 검색 비용을 줄일 수 있고, 초기에 불필요한 질의를 여과함으로써, 전체적으로 접근제어의 단계를 줄일 수 있다. 제안한 접근제어 모델은 검색 질의의 경우 액션 타입을 결정하기 위한 약간의 오버헤드(overhead)가 발생하지만, 갱신 질의의 경우에는 기존의 접근제어 모델에 비해 좋은 성능을 보인다.

부동산 유동화 NFT와 FT 분할 거래 시스템 설계 및 구현 (Real Estate Asset NFT Tokenization and FT Asset Portfolio Management)

  • 김영근;김성환
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권9호
    • /
    • pp.419-430
    • /
    • 2023
  • 대체 불가능 토큰 (NFT: non-fungible Token)은 분할할 수 없다는 고유한 특징을 가지고 있다. 현재 NFT는 디지털 콘텐츠에 대한 소유권 증명 이상의 용도가 명확하지 않고, 토큰의 유동성이 거의 없으며, 이로 인한 가격의 예측이 어렵다. 현실에서의 부동산은 대개 가격이 매우 높은 특징으로 인해 투자 진입장벽이 매우 높다. 현물 부동산을 NFT 화하고, FT (fungible token)으로 분할하면 유동성의 증가, 접근성의 증가에 따른 투자자 커뮤니티 볼륨의 증가를 기대할 수 있다. 본 논문은 일반 투자자들이 개별적으로 구매하기 어려운 현물 부동산을 대량의 FT로 분할하고 이를 Black Litterman 모델 기반의 Portfolio 투자 인터페이스를 통해 투자할 수 있는 시스템을 설계하고 구현하였다. 이를 위해, 현물 부동산을 담보로 페깅하고, 보안적으로 안전한 블록체인인 NFT로 발행한다. 상시 변경되는 부동산 가격을 모니터링하기 위한 오라클을 사용하여, 외부 부동산 정보를 블록체인에 반영할 수 있도록 하였다. 현물 부동산 가격을 그대로 유지하고 있는 NFT를 낮은 가격의 대량 FT로 분할함으로써, 큰 유동성을 제공하고 가격 변동성 제한을 두었다. 이를 통해, 높은 가격으로 인해 투자하기 어려웠던 일반 소액 투자자들이 쉽게 투자할 수 있도록 하였다. 또한 소액 투자로 여러 개의 복수 현물 부동산에 투자하기 위한 효과적인 포트폴리오 구성을 위한 자산 포트폴리오 인터페이스를 구현하였다. 이는 Black Litterman 모델을 활용하여, 다수의 현물 부동산 NFT에 대한 투자 비율을 최적화할 수 있는 목적을 가진다. 전체 시스템은 Solidity 언어로 작성한 smart contract, Flask 웹 프레임워크, 공공데이터포털의 "국토교통부_아파트매매 실거래자료 Open API"를 활용하였다.