• 제목/요약/키워드: web based system

검색결과 5,297건 처리시간 0.036초

말기암환자 정보시스템을 이용한 우리나라 암환자 완화의료기관의 이용현황 (The Current Status of Utilization of Palliative Care Units in Korea: 6 Month Results of 2009 Korean Terminal Cancer Patient Information System)

  • 신동욱;최진영;남병호;서원석;김효영;황은주;강진아;김소희;김양혁;박은철
    • Journal of Hospice and Palliative Care
    • /
    • 제13권3호
    • /
    • pp.181-189
    • /
    • 2010
  • 목적: 최근 보건의료 정책 결정은 근거에 기반하여 이루어지는 추세에 있으며, 말기암환자 정보시스템은 이러한 필요에 부응하기 위하여 개발되었다. 본 고에서는 말기암환자 정보시스템의 개발과정 및 6개월 데이터로부터의 통계 결과를 보고하고자 한다. 방법: 말기암환자 정보시스템의 입력항목은 실무 전문가들의 자문을 받아 개발되었으며, 이벨로스 임상연구관리시스템을 기반으로 구축하였다. 2009년 보건복지가족부에서 지정된 34개 암환자완화의료 기관에 2009년 1월 1일부터 6월 30일까지 등록된 환자들에 대한 정보가 수집되었다. 분석은 기술적 통계를 이용하였다. 결과: 총 2,940명의 전국적으로 대표성 있는 데이터로부터 아래와 같은 결과를 얻었다. 평균연령은 $64.8{\pm}12.9$ 세였고, 56.6%가 남자였다. 폐암(18.0%)이 가장 많았다. 2인 이상의 의사에 의하여 말기진단을 받은 경우는 50.3% 였으며, 입원 당시 말기라는 사실을 알고 있는 환자는 69.7%였고, 거의 절반에 가까운 환자가 특별한 의뢰 없이 입원하였다. 평균 통증 및 최고 통증은 입원 1주 후에 통계적으로 유의하게 감소하였다. 사망 퇴원한 환자가 73.4%였으며, 집으로 퇴원하는 경우는 13.3%에 불과했다. 1회당 평균 입원일수는 $20.2{\pm}21.2$일이었으며, 중위값은 13일이었다. 결론: 말기암환자 정보시스템의 운영을 통하여 완화의료 기관 이용 환자 및 가족의 특성, 서비스 제공에 관한 현황 등에 관한 전국적으로 대표성 있는 자료를 얻을 수 있었다.

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

2020 한국인 영양소 섭취기준 활용 자료 개발 (The development of resources for the application of 2020 Dietary Reference Intakes for Koreans)

  • 황지윤;김양하;이행신;박은주;김정선;신상아;김기남;배윤정;김기랑;우태정;윤미옥;이명숙
    • Journal of Nutrition and Health
    • /
    • 제55권1호
    • /
    • pp.21-35
    • /
    • 2022
  • 본 연구 결과, 식품군별 대표식품과 1인 1회 분량이 설정되었으며 생애주기별, 성별 1일 에너지필요추정량에 따른 식품군별 섭취횟수를 계산하여 제시한 권장식사패턴 및 이를 활용한 권장식사구성안 12종이 제시되었다. 지속적으로 증가하고 있는 유지·당류 섭취량의 감소를 위한 인지를 높이기 위해 1인 1회분량과 식품구성자전거에 유지·당류 식품군을 포함하였다. 자료 분석과 일반인 및 전문가 대상 설문조사를 실시하여 2020 KDRIs 기반 생애주기별 영양문제 범주화 및 대국민 메시지에 기반한 사용자 맞춤형 웹기반 영양 콘텐츠 개발 및 홍보를 위한 근거를 마련하였다. 이를 근거로 일반국민과 청소년 대상 카드뉴스 2종, 새로운 2020 식품구성자전거와 권장식사패턴을 홍보하기 위한 카드뉴스 2종과 5개 언어 (한국어, 영어, 일본어, 베트남어, 중국어) 포스터가 제작되었다. 또한 영양교육주제의 우선순위 선정 후 단계별 교육프로그램 설계 후 교육목표에 따른 교수학습안과 교수자료, 평가도구 등이 개발되었다. 이와 같은 자료는 모두 보건복지부와 한국영양학회 누리집을 통해 배포되었으니 다양한 분야에서 다각적인 측면에서 활용되기를 기대한다.

스마트 TV 환경에서 정보 검색을 위한 사용자 프로파일 기반 필터링 방법 (A User Profile-based Filtering Method for Information Search in Smart TV Environment)

  • 신위살;오경진;조근식
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.97-117
    • /
    • 2012
  • 인터넷 사용자는 비디오를 보면서 소셜 네트워크 서비스를 이용하고 웹 검색을 하고, 비디오에 나타난 상품에 관심이 있을 경우 검색엔진을 통해 정보를 찾는다. 비디오와 사용자의 직접적인 상호작용을 위해 비디오 어노테이션에 대한 연구가 진행되었고, 스마트 TV 환경에서 어노테이션 된 비디오가 활용될 경우 사용자는 객체에 대한 링크를 통해 원하는 상품의 정보를 쉽게 확인할 수 있게 된다. 사용자가 상품에 대한 구매를 원할 경우 상품에 대한 정보검색 이외에 상품평이나 소셜 네트워크 친구의 의견을 통해 구매 결정을 한다. 소셜 네트워크로부터 발생되는 정보는 다른 정보에 비해 신뢰도가 높아 구매 결정에 큰 영향을 미친다. 하지만 현재 소셜 네트워크 서비스는 의견을 얻고자 할 경우 모든 소셜 네트워크 친구들에게 전달되고 많은 의견을 얻게 되어 이들로부터 유용한 정보를 파악하는 것은 쉽지 않다. 본 논문에서는 소셜 네트워크 사용자의 프로파일을 기반으로 상품에 대해 유용한 정보를 제공할 수 있는 친구를 규명하기 위한 필터링 방법을 제안한다. 사용자 프로파일은 페이스북의 사용자 정보와 페이스북 페이지의 'Like' 정보를 이용하여 구성된다. 프로파일의 상품 정보는 GoodRelations 온톨로지와 BestBuy 데이터를 이용하여 의미적으로 표현된다. 사용자가 비디오를 보면서 상품 정보를 얻고자 할 경우 어노테이션된 URI를 이용하여 정보가 전달된다. 시스템은 소셜 네트워크 친구들에 대한 사용자 프로파일과 BestBuy를 기반으로 어노테이션된 상품에 대한 의미적 유사도를 계산하고 유사도 값에 따라 순위가 결정한다. 결정된 순위는 유용한 정보를 제공할 수 있는 소셜 네트워크 상의 친구를 규명하는데 사용된다. 참가자의 동의하에 페이스북 정보를 활용하였고, 시스템에 의해 도출된 결과와 참가자 인터뷰를 통해 평가된 결과를 이용하여 타당성을 검증하였다. 비교 실험의 결과는 제안하는 시스템이 상품 구매결정을 하기 위해 유용한 정보를 획득할 수 있는 방법임을 증명한다.

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.

텍스트마이닝 기반의 효율적인 장소 브랜드 이미지 강도 측정 방법 (An Efficient Estimation of Place Brand Image Power Based on Text Mining Technology)

  • 최석재;전종식;비스워스 수브르더;권오병
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.113-129
    • /
    • 2015
  • 장소 브랜딩은 특정 장소에 대한 의미 부여를 통해 장소성의 정체성 및 공동가치를 생성하며 가치 창출을 하는데 중요한 활동이며, 장소 브랜드에 대한 이미지 파악을 통해 이루어진다. 이에 마케팅, 건축학, 도시건설학 등 여러 분야에서는 인상적인 장소 브랜드의 이미지를 구축하기 위하여 많은 노력을 기울이고 있다. 하지만 설문조사를 포함한 대면조사 방법은 대부분 주관적인 작업이며 측정에 많은 인력 또는 고도의 전문 인력이 소요되어 고비용을 발생시키므로 보다 객관적이면서도 비용효과적인 브랜드 이미지 조사 방법이 필요하다. 이에 본 논문은 텍스트마이닝을 통하여 장소 브랜드의 이미지 강도를 객관적이고 저비용으로 얻는 방법을 찾는 것을 목적으로 한다. 제안하는 방법은 장소 브랜드 이미지를 구성하고 있는 요인과 그 키워드들을 관련 웹문서에서 추출하며, 추출된 정보를 통해 특정 장소의 브랜드 이미지 강도를 측정하는 방법이다. 성능은 안홀트 방법에서 평가에 사용하는 전세계 50개 도시 이미지 인덱스 순위와의 일치도로 검증하였다. 성능 비교를 위해 임의로 순위를 매기는 방법, 안홀트의 설문방식대로 일반인이 평가하는 방법, 본 논문의 방법을 사용하되 안홀트의 방법으로 학습한 것으로 유의한 것으로 추정되는 평가 항목만을 반영하는 방법과 비교하였다. 그 결과 제안된 방법론은 정확성, 비용효율성, 적시성, 확장성, 그리고 신뢰성 측면에서 우수함을 보일 수 있었다. 따라서 본 연구에서 제안한 방법론은 안홀트 방식에 상호 보완적으로 사용될 수 있을 것이다. 향후에는 장소 브랜드 이미지를 형성하는 속성 별로 등장횟수를 계산 한 후에 장소 브랜드에 대한 태도, 연상, 그리고 브랜드 자산과의 인과관계를 자동으로 파악할 수 있는 부분까지 구현하고 실증적 실험을 할 예정이다.

선도적 농림기상 국제협력을 통한 농업과 식량안보분야 전지구기후 서비스체계 구축 전략 (Implementation Strategy of Global Framework for Climate Service through Global Initiatives in AgroMeteorology for Agriculture and Food Security Sector)

  • 이병열;페데리카 로씨;레이몬드 모타;로버트 스테판스키
    • 한국농림기상학회지
    • /
    • 제15권2호
    • /
    • pp.109-117
    • /
    • 2013
  • "전지구기후서비스체계" (GFCS)는 2009년 제3차 세계기후회의에서 기후변화 대응 취약 국가와 소외계층에 대해 보다 효율적인 기후정보를 제공하기 위한 전지구차원의 서비스 제공체계 구축 필요성에 대한 공감을 바탕으로 제안되어, 현재 세계기싱기구를 중심으로 관련 UN 및 국제기구간 공조를 통해 향후 약 10년 동안에 걸쳐 이를 이행하기 위한 노력을 기울일 예정이다. GFCS는 과학적 기후정보와 기후예측을 기후변화 적응과 기후위기관리를 상호 연계할 수 있는 기후서비스 개발을 주도하게 된다. GFCS의 기본구조는 5개 주요 요소로 구성되어 있는데, 이에는 관측/모니터링, 연구/모형/예측, 기후서비스정보시스템 및 사용자인터페이스 플랫폼과 함께 이들 모두를 포괄하는 역량개발이 포함되어 있다. 현재 GFCS의 편익분야 중 자연재해경감, 수자원, 보건 분야와 함께 농업/식량안보분야가 4대 우선순위에 포함되어 있는데, WMO의 농업기상위원회(CAgM)은 동분야에 대한 GFCS의 효율적 이행을 지원하기 위해 GFCS의 5개 요소별로 이를 보완하기 위한 전구차원 선도적 협력방안(GIAM)을 제안 추진하고 있다. GIAM의 취지는 기존의 기후서비스체계의 개별적 서비스 구조를 통합하거나 미흡한 부분을 보완하는 방법 등 최소한의 추가적인 자원 투입으로 최대 시너지효과를 도출하는데 중점을 두고 있다. 관측분야는 전구생물계절관측협의체 구축, 연구분야는 지역/전구 농림기상 파일롯프로젝트 도출, 기후서비스분야는 기존 농업기상웹서버인 WAMIS의 지역 및 기능 확대, 사용자인터페이스분야는 기존 사이버농업기상협의체를 보완하기 위한 전구 농림기상학술협의체 구축, 그리고 역량개발분야는 전구농림기상교육훈련센터 구축 등이 추진 중에 있으며, 이들간의 유기적인 연동 지원을 위한 조정기구와 지원사무국의 설립도 기상청에 의해 가시화되고 있으며, 효율적인 운영을 위한 새로운 거버넌스도 미국 조지메이슨대를 중심으로 구축 중에 있다. 한편 GIAM의 성공적인 이행을 위해서는 전산자원 인프라 구축이 선행되어야 함으로 현재 WAMIS를 지원하기 위해서 세계기상기구 정보시스템(WIS)의 자료수집/생산센터(DCPC-WAMIS) 구축 및 회원국간 전산자원공유를 위한 클라우드 및 그리드 환경 구축도 기상청과 KISTI/부경대 등의 협조를 얻어 추진 중에 있다, GIAM의 궁극적인 목표의 하나는 차세대 기후변화 대응 농림기상전문가의 양성에 있는데 이를 구현하는 방안으로 회원국의 추천을 받은 후보자를 전구농림기상 교육훈련센터 대학원 과정에 학비/수업료 면제조건으로 입학시킨 후, 지역 파일롯프로젝트에 연구원으로 참여, 이를 통해 생활비 등 지원을 받는 한편 농림기상 학술협의체 회원 활동, 국내외 실무그룹 활동 등을 통해 농림기상분야 국제전문가로 양성함으로써 향후 회원국 농업/식량안보분야 기후변화 대응에 절대적으로 필요한 핵심정책연구 담당자로서의 역할을 기대할 수 있을 것이다.

GWB: 유전자 서열 데이터의 관리와 분석을 위한 통합 소프트웨어 시스템 (GWB: An integrated software system for Managing and Analyzing Genomic Sequences)

  • 김인철;진훈
    • 인터넷정보학회논문지
    • /
    • 제5권5호
    • /
    • pp.1-15
    • /
    • 2004
  • 본 논문에서는 효율적인 유전자 서열 데이터의 관리와 분석을 위한 웹 기반의 통합 시스템인 GWB(Gene WorkBench)의 설계와 구현에 대해 설명한다. 유전자 서열을 다루는 기존의 시스템들은 서열 데이터의 관리 기능과 분석 기능을 동시에 지원하는 경우가 드물고, 또한 분석 기능 역시 일부 혹은 단일 분석 기능만을 제공하는 단위 프로그램들이 대부분이다. 또 이러한 분석 프로그램들마저 서로 분산되어 있고 다른 수행환경을 필요로 한다. 따라서 이러한 프로그램들을 함께 이용하기 위해서는 많은 수작업과 변환작업을 필요로 하는 등 유전자 서열 데이터를 다루는 많은 생명과학 연구자들이 불편을 겪어왔다. 본 논문에서는 기존 시스템들의 단점을 보완하고 유전자 서열 연구에 효과적으로 도움을 줄 수 있는 보다 편리한 시스템을 구현하고자, 서열 데이터베이스 관리 기능과 다양한 분석 기능들을 하나의 시스템인 GWB로 동합하였다. GWB 시스템 설계의 가상 중요한 이슈는 서로 상이한 분석 프로그램들을 어떻게 하나의 시스템으로 통합할 것이며, 또 이들 프로그램들이 요구하는 서로 다른 서열 데이터 및 서열 데이터베이스 형태를 어떻게 제공할 수 있느냐는 것이다. GWB는 이 문제들을 해결하기 위해 공통의 입출력 인터페이스인 포장기를 이용하여 서로 다른 분석 프로그램들을 시스템에 통합시켰고, 공통 서열 데이터 형식인 KSF를 제안하였으며, 로컬 서열 데이터베이스를 관계형 데이터베이스부분과 색인 순차파일부분으로 나누어 구성하였고, 서로 상이한 서열 데이터 형식간의 변환 기능과 XML 파일로의 변환 기능을 제공하도록 하였다.유의하게 높았다 (P<0.01). 고형물질별 피복지수는 red clover는 V나 V+T(1 : 1)로 피복한 종자에서 높았으며 tall fescue는 T, V, V + T(1 : 1로 피복한 종자)에서 가장 높게 나타났다(P<0.01). 종자피복에 있어서 red clover와 tall fescue 공히 접착제는 CF나 PVA로 하고 고형물질은 V나 V+T(1:1)로 피복함으로서 가장 좋은 피복효과를 얻을 수 있었다.. 쟁점 및 과제들이 제시되었다. cells of these species contained considerable to large amount of neutral mucin, and small to considerable amount of acid mucin, Most of the medium sized and small mucous cells contained neutral mucin and sialomucin, but a few mucous cells contained neutral mucin and strongly sulfomucin or neutral combined with strongly sulfomucin and sialomucin. Most of the esophageal mucous cells pf Bryzoichthys lysimus contained small amount of neutral mucin, while on the other hand a feww mucous cells contained small amount of neutral mucin and minimal

  • PDF

차세대 정보가전 신제품 개발 지원을 위한 지식관리시스템 개발 (A Knowledge Management System for Supporting Development of the Next Generation Information Appliances)

  • 박지수;백동현
    • 경영정보학연구
    • /
    • 제6권2호
    • /
    • pp.137-159
    • /
    • 2004
  • 차세대 정보가전 제품이란 유무선 방식의 홈 네트워크에 연결되어 다른 제품과 데이터 송수신이 가능하고 가정 내외에서 원격으로 제어할 수 있는 차세대 가전제품을 의미한다. 기업들은 다가오는 홈 네트워킹 시대에 주도권을 잡기 위해 많은 투자와 연구를 진행하고 있으나, 새로운 정보가전 개발에 보다 체계적인 접근 방법을 요구하고 있고, 신제품을 개발하는 과정에서 축적된 지식을 서로 공유함으로써 국가적 차원에서 차세대 정보가전 분야를 세계적 수준으로 발전시켜야 할 필요성이 제기되고 있다. 이러한 배경에서 차세대 정보가전 신제품 개발 과정에서 획득된 지식을 지식베이스에 축적하여 이 지식을 정보가전 개발 기업 및 연구소에서 활용할 수 있도록 지원하는 지식관리시스템을 개발하였다. 신제품 개발에 필요한 지식을 획득하기 위해서 일반적인 지식관리시스템에서 사용되는 지식 획득방법과 달리 사용자 중심 설계 방법을 도입하였다. 사용자의 행동 과정과 요구를 분석적인 방법과 관찰적인 방법으로 파악하여 신제품 개발 아이디어를 도출하였고 이 과정에서 획득한 지식을 지식베이스에 저장하여 "사용자 행동분석 지식"과 "사용자 행동관찰 지식"을 구축하였다. 사용자 중심 설계로부터 도출된 신제품 중 사용자 니즈가 분명하고 시장성이 크다고 판단되는 신제품들을 디자인 모형으로 제작하고, 이들 제품이 미래 가정에서 사용되는 실제 상황을 보여주는 비디오를 제작하여 "미래감성 라이프 지식"을 구축하였다. 마지막으로 유럽과 일본에서 개발 중인 미래 주택에 관한 자료와 정보가전과 관련된 국내 신문 기사를 수집하여 "정보가전 기술현황 지식"을 구축하였다. 이러한 과정을 거쳐서 획득한 지식을 정보가전 개발 관련 연구자들이 활용할 수 있도록 웹 기반 지식관리시스템을 개발하였다. 지식 사용자는 지식관리시스템을 활용하여 신제품 개발에 필요한 지식을 얻을 수 있을 뿐만 아니라 새로운 제품 아이디어를 도출할 수 있다.

효과적인 지식확장을 위한 LOD 클라우드에서의 변화수용적 심층검색 (Change Acceptable In-Depth Searching in LOD Cloud for Efficient Knowledge Expansion)

  • 김광민;손용락
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.171-193
    • /
    • 2018
  • 본 연구는 시멘틱 웹의 실질적 구현체인 LOD 클라우드에서 연결정책을 활용함으로써 LOD들간 연결을 효과적으로 제공하고 LOD의 변경된 내용을 검색결과에 빠짐없이 반영할 수 있는 방안을 제시한다. 현재 LOD 클라우드에서는 개체간 연결은 를 이용하여 개체들이 동일함을 명시적으로 기술하는 방식으로 이루어져 있다. 하지만, 이러한 명시적 연결방식은 LOD 클라우드 규모의 방대함에도 불구하고 개체간 동일성을 개체단위에서 파악하여야 하는 어려움이 있으며 주기적으로 LOD에 추가하여야 함에 따라 검색 시 개체들이 누락되는 한계가 있다. 이를 극복하기 위하여 본 연구에서는 명시적 연결을 생성하는 대신 LOD별로 연결하고자 하는 LOD와의 연결정책을 수립하여 LOD와 함께 공개하는 방식을 제안한다. 연결정책을 활용함으로써 연결하여야 할 동일개체를 검색시점에서 파악할 수 있으므로 추가되었던 개체들을 누락됨 없이 검색결과에 포함시킬 수 있고 LOD 클라우드에서의 연결성도 효과적으로 확충할 수 있다. 확충된 연결성은 정보의 지능적 처리의 선행과정인 지식확장의 근간이 된다. 연결정책은 연결하고자 하는 소스와 타겟 LOD의 주어 개체들간의 동일성을 평가하는데 도움이 되는 술어 쌍을 명세하는 방식으로 수립하며 검색 시 이러한 술어쌍에 대응하는 RDF 트리플을 검색하고 이들의 목적어들이 충분히 동일한 것인가를 평가하여 주어개체들의 동일수준을 판단한다. 본 연구에서는 이러한 연결정책을 이용하여 여러 LOD들을 심층적으로 검색하는 시스템을 구현하였다. 검색과정에서는 기존 명시적 연결들도 함께 활용하도록 구현하였다. 검색시스템에 대한 실험은 DBpedia의 주요 LOD들을 대상으로 진행하였다. 실험결과 연결대상 개체들의 목적어들이 0.8 ~ 0.9의 유사수준을 가지는 경우 적정한 확장성을 가지고 충분히 신뢰적인 개체들을 적절하게 포함하는 것으로 확인하였다. 또한, 개체들은 8개 이상의 동일연결을 제공하여야 검색결과가 신뢰적으로 활용될 수 있을 것으로 파악되었다.