• 제목/요약/키워드: 선정과 평가

검색결과 7,386건 처리시간 0.035초

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.

지식베이스 확장을 위한 멀티소스 비정형 문서에서의 정보 추출 시스템의 개발 (Development of Information Extraction System from Multi Source Unstructured Documents for Knowledge Base Expansion)

  • 최현승;김민태;김우주;신동욱;이용훈
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.111-136
    • /
    • 2018
  • 지식베이스를 구축하는 작업은 도메인 전문가가 온톨로지 스키마를 이해한 뒤, 직접 지식을 정제하는 수작업이 요구되는 만큼 비용이 많이 드는 활동이다. 이에, 도메인 전문가 없이 다양한 웹 환경으로부터 질의에 대한 답변 정보를 추출하기 위한 자동화된 시스템의 연구개발의 필요성이 제기되고 있다. 기존의 정보 추출 관련 연구들은 웹에 존재하는 다양한 형태의 문서 중 학습데이터와 상이한 형태의 문서에서는 정보를 효과적으로 추출하기 어렵다는 한계점이 존재한다. 또한, 기계 독해와 관련된 연구들은 문서에 정답이 있는 경우를 가정하고 질의에 대한 답변정보를 추출하는 경우로서, 문서의 정답포함 여부를 보장할 수 없는 실제 웹의 비정형 문서로부터의 정보추출에서는 낮은 성능을 보인다는 한계점이 존재한다. 본 연구에서는 지식베이스 확장을 위하여 웹에 존재하는 멀티소스 비정형 문서로부터 질의에 대한 정보를 추출하기 위한 시스템의 개발 방법론을 제안하고자 한다. 본 연구에서 제안한 방법론은 "주어(Subject)-서술어(Predicate)"로 구분된 질의에 대하여 위키피디아, 네이버 백과사전, 네이버 뉴스 3개 웹 소스로부터 수집된 비정형 문서로부터 관련 정보를 추출하며, 제안된 방법론을 적용한 시스템의 성능평가를 위하여, Wu and Weld(2007)의 모델을 베이스라인 모델로 선정하여 성능을 비교분석 하였다. 연구결과 제안된 모델이 베이스라인 모델에 비해, 위키피디아, 네이버 백과사전, 네이버 뉴스 등 다양한 형태의 문서에서 정보를 효과적으로 추출하는 강건한 모델임을 입증하였다. 본 연구의 결과는 현업 지식베이스 관리자에게 지식베이스 확장을 위한 웹에서 질의에 대한 답변정보를 추출하기 위한 시스템 개발의 지침서로서 실무적인 시사점을 제공함과 동시에, 추후 다양한 형태의 질의응답 시스템 및 정보추출 연구로의 확장에 기여할 수 있을 것으로 기대한다.

기능성위장질환 환자들의 정신사회적 특성 및 삶의 질의 관계에 관한 연구 (A Study on the Psychosocial Characteristics and Quality of Life in Functional Gastrointestinal Disorders)

  • 김소원;장승호;류한승;최석채;노승호;이상열
    • 정신신체의학
    • /
    • 제27권1호
    • /
    • pp.25-34
    • /
    • 2019
  • 연구목적 본 연구에서는 기능성위장질환 환자집단, 기능성 위장증상 양성 집단 및 정상대조집단에서 정신사회적 특성을 비교하고, 기능성위장질환 환자의 삶의 질과 연관된 요인들을 알아보고자 하였다. 방 법 일 대학병원 소화기 내과 전문의에 의해 기능성위장질환으로 진단받은 환자 65명을 기능성위장질환 환자집단으로 선정하였다. 167명의 일 도 지역 공무원을 대상으로 로마III 진단 기준에 따라 기능성 위장증상을 보이지 않는 79명을 정상대조집단, 기능성위장증상을 나타내는 88명은 기능성위장증상 양성 집단으로 선별하였다. 인구통계학적 요인을 조사하였으며 정신사회적 요인을 평가하기 위해 Korean-Beck Depression Inventory-II (K-BDI-II), Korean-Beck Anxiety Inventory (K-BAI), Korean version of Childhood Trauma Questionnaire (K-CTQ), Multi-dimensional Scale of Perceived Social Support (MSPSS), Korean Version of Connor-Davidson Resilience Scale (K-CD-RISC), World Health Organization Quality of Life Assessment Instrument Brief Form (WHOQOL-BREF)를 사용하였다. 일원배치 분산분석을 사용하여 집단들 간의 차이를 비교하고 기능성위장질환 환자군의 삶의 질과 정신사회적 요인들의 상관관계를 분석하기 위해 Pearson correlation test를 시행하였다. 모든 통계는 SPSS 21.0을 사용하였다. 결 과 인구통계학적 특성에서는 학력에서 집단간 차이가 유의했다(p<0.001). FGID 환자집단이 정상대조집단과 FGID-positive집단에 비해 우울(F=29.012, p<0.001) 및 불안(F=27.954, p<0.001)이 유의하게 높았다. 아동기 외상에서 정서학대(F=6.994, p<0.001)와 신체방임(F=5.573, p<0.001)은 FGID환자집단이 정상대조집단과 FGID-positive집단에 비해 유의하게 높았으나, 신체학대, 성 학대 및 정서방임은 세 집단간의 차이가 없었다. 사회적 지지 또한 FGID환자집단이 정상대조집단과 FGID-positive집단에 비해 유의하게 낮은 것으로 나타났다(F=27.664, p<0.001). 회복 탄력성(F=9.623, p<0.001)과 하위영역인 강인성(F=5.123, p<0.001), 인내력(F=8.402, p<0.001), 낙관성(F=15.039, p<0.001) 및 영성(F=5.129, p<0.001)에서도 FGID환자집단이 정상 대조집단과 FGID-positive 집단보다 유의하게 낮은 것으로 나타났다. 삶의 질 척도(F=35.991, p<0.001)와 그 하위영역인 전반적 안녕(F=30.463, p<0.001), 신체적 건강(F=45.247, p<0.001), 심리(F=22.852, p<0.001), 사회(F=20.070, p<0.001), 환경(F=17.851, p<0.001) 모두에서 FGID환자집단이 정상대조집단과 FGID-positive집단에 비해 유의하게 낮은 점수를 나타냈다. FGID 환자집단에서 삶의 질은 회복탄력성과 양의 상관관계를 보였으며(r=0.475, p<0.01), 우울(r=-0.641, p<0.01), 불안(r=-0.441, p<0.01) 및 아동기 외상(r=-0.278, p<0.05)과는 음의 상관관계를 나타냈다. 결 론 연구결과 기능성위장질환 환자집단은 기능성 위장증상 양성 집단 및 정상대조집단에 비해 우울, 불안과 아동기 트라우마가 유의하게 높았으며 사회적 지지 및 회복 탄력성이 낮았다. 따라서 추후 기능성 위장질환 환자의 치료에 있어 정신사회적 요인에 대한 적극적인 개입이 요구된다고 하겠다.

대학 총학생회 자치활동의 설명책임성을 위한 기록관리 방안 연구 - 명지대학교 총학생회를 중심으로 - (A Study on Management of Records for Accountability of University student body's autonomy activity - Focused on Myongji University's student body -)

  • 이유빈;이승휘
    • 기록학연구
    • /
    • 제29호
    • /
    • pp.175-223
    • /
    • 2011
  • 대학은 공공성을 띤 기관으로서 그 운영 과정상 사회에 대한 설명책임성(accountability)을 가진다. 이러한 대학을 이루는 구성원 중 다수를 차지하는 것이 바로 학생이다. 대학에서는 매년 수많은 연구 창작물이 쏟아져 나오고 있는데, 대학생은 이와 같은 기록물의 주요 생산자이다. 그러나 대학의 주체로서 매년 방대한 기록물을 생산해내고 있으면서도 대학생의 역할과 기능, 생산 기록물에 대한 집중적인 조명은 아직 이루어지지 않고 있다. 이처럼 기록학적 관점에서 대학생이 주체가 되어 생산된 기록물에 대한 중요성이 상대적으로 낮게 평가되어 왔던 것이 현실이다. 이러한 배경에서 본 연구는 대학생이 주체가 되어 생산한 기록에 대한 기록학적 관점에서의 접근을 시도하였다. 대학생이 생산하는 기록에는 연구 및 수업 과정에서 생산되는 기록뿐만 아니라 동아리, 학생회 등 각종 자치활동 과정에서 생산되는 기록 등 다양한 유형의 기록이 존재한다. 본 연구에서는 특히 대학생 자치활동 과정에 초점을 맞추고, 대학생의 자치활동 과정에 대한 설명책임성 확보 방안에 중점을 두었다. 활동의 설명책임성 확보를 위해서는 기록관리가 기초되어야 한다. 따라서 대학생 자치활동의 설명책임성 확보를 위한 방안으로서 기록관리체계화 및 기록 활용 방안을 제시하고자 하였다. 이를 위하여 대학생 자치 조직인 대학 총학생회를 대상으로 분석하였으며, 구체적인 대상으로는 명지대학교 인문캠퍼스 총학생회를 선정하였다. 우선 총학생회의 활동과 조직 및 기능, 기록관리 현황 실태를 파악하기 위하여 총학생회장과의 인터뷰를 진행하였다. 이를 통해 대학 총학생회의 활동을 분석하고 그에 따른 설명책임성의 필요성에 대하여 알아보았다. 또한 명지대학교 총학생회의 조직과 기능을 분석하여 각 단계에서 생산되어야 하는 기록의 종류와 특성을 도출하였다. 이처럼 총학생회의 활동과 설명책임성의 필요성, 조직 및 기능에 따른 생산 기록물의 유형을 도출한 후, 현재 총학생회의 기록관리 현황을 분석하였다. 먼저 총학생회 활동의 일반 프로세스 현황을 파악하기 위해 명지대학교 총학생회의 단계별 활동 프로세스를 분석하였다. 그리고 총학생회 기록관리 방법과 책임 주체를 분석하고 실태 분석을 실시하였다. 이러한 분석을 통해 대학 총학생회의 설명책임성 확보를 위한 방안을 기록관리 과정 체계화, 기록관리 인프라 확립, 기록 활용을 통한 설명책임성 확보 방안의 세 가지 범주에서 제안하였다. 본 연구는 대학생 자치 조직인 총학생회를 대상으로, 총학생회의 활동과 기능을 분석하여 사회에 대한 설명책임성을 논하였다. 그리고 총학생회의 설명책임성 확보를 위한 방안으로서 기록관리 환경 정착에 대한 모형을 제안하였다. 그러나 총학생회는 1년 단위로 운영되는 조직이라는 점에서 기록관리 환경이 정착되기 힘든 한계점이 존재한다. 본 연구에서는 이러한 한계점을 지적하고, 총학생회 기록관리 모형 제시를 통해 차후 학생기록관리 분야에서 보다 활발한 연구가 이루어질 때 단초를 제공하고자 하였다. 또한 학교사(史) 정리와 보전 차원에서 본 연구에서 도출된 분석 결과가 의의를 가질 것으로 기대된다.

ERGM 기반의 모수적 및 비모수적 방법을 활용한 수출 유망국가 분석: 정보통신 및 가전 산업 사례를 중심으로 (Analysis of promising countries for export using parametric and non-parametric methods based on ERGM: Focusing on the case of information communication and home appliance industries)

  • 전승표;서진이;유재영
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.175-196
    • /
    • 2022
  • 우리나라의 주력 산업 중 하나였던 정보통신 및 가전 산업은 점차 수출 비중이 낮아지는 등 수출 경쟁력이 약화되고 있다. 본 연구는 이런 정보통신 및 가전 산업의 수출 제고를 돕기 위해서 객관적으로 수출경쟁력을 분석하고 수출 유망국가를 제시하고자 했다. 본 연구는 수출경쟁력 평가를 위해서 네트워크 분석 중 구조적 특징, 중심성 그리고 구조적 공백 분석을 수행했다. 유망 수출 국가를 선정하기 위해서는 기존에 경제적 요인 외에도 이미 형성된 글로벌 무역 네트워크(ITN) 즉 글로벌 밸류체인(GVC)의 특성을 고려할 수 있는 새로운 변수를 제안했다. 국가간 무역 네트워크 분석에서 Exponential Random Graph Model(ERGM)을 통해 도출된 개별적인 링크에 대한 조건부 로짓값(log-odds)을 수출가능성을 나타낼 수 있는 대리변수로 가정했다. 이런 ERGM의 링크 연결 가능성까지 고려해 수출 유망국가를 추천하는 데는 모수적 접근 방법과 비모수적 접근 방법을 각각 활용했다. 모수적 방법에서는 ERGM에서 도출된 네트워크의 링크별 특성값을 기존의 경제적 요인에 추가 고려하여 우리나라 정보통신 및 가전 산업 수출액을 예측하는 회귀분석 모형을 개발했다. 또한 비모수적 접근 방법에서는 클러스터링 방법을 바탕으로 한 Abnormality detection 알고리즘을 활용했는데, 2개 Peer(동배)에서 벗어난 이상값을 찾는 방법으로 수출 유망국가를 제안했다. 연구 결과에 따르면, 해당 산업 수출 네트워크의 구조적 특징은 이전성이 높은 연결망이었으며, 중심성 분석결과에 따르면 우리나라는 수출에 규모에 비해서 영향력이 약한 것으로 나타났고, 구조적 공백 분석결과에서 수출 효율성이 약한 것으로 나타났다. 본 연구가 제안한 추천모델에 따르면 모수 분석에서는 이란, 아일랜드, 북마케도니아, 앙골라, 파키스탄이 유망 수출 국가로 나타났으며, 비모수 분석에서는 카타르, 룩셈부르크, 아일랜드, 북마케도니아, 파키스탄이 유망 국가로 분석되었으며, 분석방법에 따라 추천된 국가에서는 일부 차이가 나타났다. 본 연구결과는 GVC에서 우리나라 정보통신과 가전 산업의 수출경쟁력이 수출 규모에 비해서 높지 않음을 밝혔고, 따라서 수출이 더욱 감소될 수 있음을 보였다. 또한 본 연구는 이렇게 약화된 수출경쟁력을 높일 수 있는 방안으로 다른 국가들과의 GVC 네트워크까지 고려해 수출유망 국가를 찾는 방법을 제안했다는데 의의가 있다.

한국의 세계기록유산 보존 현황 및 과제 (Preservation of World Records Heritage in Korea and Further Registry)

  • 김성수
    • 한국기록관리학회지
    • /
    • 제5권2호
    • /
    • pp.27-48
    • /
    • 2005
  • 이 논문은 한국의 세계기록유산에 대하여 먼저 그 의미와 가치를 재확인하고, 이들 세계기록유산에 대한 보존 관리 및 그 현황을 조사하며, 한국의 기록유산을 디지털화 하는데 있어서의 문제점과 해결책을 모색하고, 추후 한국의 기록유산 중 세계기록유산으로 등록되기를 희망하는 4종의 기록물들에 대한 가치와 의의를 고찰한 연구이다. 본 연구의 상세 사항은 다음과 같다. 첫째, 제2장에서는 한국의 세계기록유산에 대한 가치와 의의를 고찰하였다. 먼저 세계기록유산의 선정기준과 절차 등을 먼저 파악하고, 한국의 세계기록유산인 "훈민정음" "조선왕조실록" "승정원일기" "직지(백운화상초록불조직지심체요절(白雲和尙抄錄佛祖直指心體要節))"에 대하여 각각 그 가치와 의미를 분석하였다. 둘째, 제3장에서는 '한국의 세계기록유산 보존 관리 현황'에서는 세계기록유산을 보존하고 있는 <서울대학교 규장각> <국가기록원 부산기록정보센터> <간송미술관>의 기관별로 그 보존 관리 현황을 고찰하였다. 그 결과, 이 3기관 모두 세계기록유산 보존 관리 현황은 '매우 우수하다'고 평가할 수 있었다. 즉, 1)그 세부적인 보안대책이 완벽하다. 2)그 보존방법에 있어서도 항온 항습의 특별한 서고를 별도로 마련하고, 이 서고 내에서 다시 '오동나무 상자 서장(書欌)'을 설치한 후, 이들 상자와 서장 속에 세계기록유산을 납입하여 보존하고 있다. 3)방화장치와 서고조명 및 소독 등에도 철저를 기하고 있음 등을 파악하였다. 셋째, 제4장에서는 '한국의 기록유산 디지털화 과제'에 대하여 개괄적으로 고찰하였다. 그 결과, 한국 기록유산의 디지털작업 및 DB구축에서 '디지털화 표준'이 가장 중요한 문제이며, 이 문제의 해결을 위해서는 디지털화(Digitization)에 대한 총체적이고 표준적인 시스템의 개발이 시급함을 지적하였다. 그리고 국가기록관리시스템을 개발한 경험이 있는 <국가기록원>과 한국학 고기록물의 디지털화에 많은 관심을 가진 <문화재청>이 공동으로 노력하여, 한국학 관련 기록유산의 디지타이제이션(Digitization)에 대한 총체적이고 표준적인 시스템의 개발이 요구됨을 파악하였다. 넷째, 제5장 '세계기록유산 등록을 추후 희망하는 한국의 기록유산'에서는 한민족의 기록유산 중에서 차후 세계기록유산으로 등재되기를 희망하는 4종 즉, 1)<해인사 고려대장경 경판>, 2)"동의보감", 3)"삼국유사", 4)"무구정광대다라니경"의 기록물에 국한하여, 그 어떤 의미에서 세계적인 가치와 의의가 있는가를 고찰하였다.