• 제목/요약/키워드: 학습평가

검색결과 5,528건 처리시간 0.037초

광역대표도서관 법정업무의 웹서비스 분석 (An Analysis of Web Services in the Legal Works of the Metropolitan Representative Library)

  • 오선경
    • 한국문헌정보학회지
    • /
    • 제58권2호
    • /
    • pp.177-198
    • /
    • 2024
  • 2006년 12월에 전부 개정된 「도서관법」 제22조 제1항은 지역대표도서관을 법정기구로 규정하였고, 2021년 말에 재개정된 「도서관법」 제25조 제1항은 그 명칭을 광역대표도서관으로 개칭하고 수행해야 할 업무도 확장하였다. 시·도가 광역대표도서관을 지정 또는 설립 운영해야 하는 이유는 동법 제23조에 규정된 공중의 정보이용, 문화활동, 평생학습 등 공공도서관으로서의 역할에 더하여 제26조에 규정된 광역대표도서관의 법정업무를 주관하고 시·도 내 모든 공공도서관을 위한 정책도서관, 종합지식정보센터, 지원·협력 구심체, 조사연구, 공동보존서고 운영 등을 수행하여 도서관 및 지식문화 발전을 견인하는데 있다. 그렇다면 지난 15년간(2009-2023) 광역대표도서관은 법정 업무를 충실하게 수행하여 왔는가, 특히 디지털·모바일 시대에 부응하기 위해 법정업무의 계획 및 추진실적을 웹사이트에서 제대로 제공하고 있는지를 분석·진단할 필요가 있다. 이에 본 연구는 광역대표도서관의 현행 법정 업무를 기준으로 최근 2년간 수행실적을 조사·분석한 후 웹사이트를 통해 어느 정도로 제공하는지를 평가하여 웹서비스 강화를 위한 보완책을 제시하였다. 그 결과, 광역대표도서관이 수행해야 하는 법정업무에 대한 웹서비스는 상당히 부족하고 부실한 것으로 분석되어 홈페이지에서 법정업무를 위한 웹사이트 구축, 독립된 웹사이트 제공을 통한 접근 편의성 및 가시성 제고, 다양한 정책정보 및 웹서비스(포털검색, 상호대차와 원문제공, 공동DB 구축, 자료이관 및 보존 등) 방안, 지식정보 취약계층의 디지털 접근성 보장 등을 보완책으로 제시하였다.

비접촉 데이터 사회와 아카이브 재영토화 (Contactless Data Society and Reterritorialization of the Archive )

  • 조민지
    • 기록학연구
    • /
    • 제79호
    • /
    • pp.5-32
    • /
    • 2024
  • 한국 정부가 UN의 2022년 전자정부 발전 지수에서 UN가입 193개국 중 3위에 랭크됐다. 그동안 꾸준히 상위국으로 평가된 한국은 분명 세계 전자정부의 선도국이라 할 수 있다. 전자정부의 윤활유는 데이터다. 데이터는 그 자체로 정보가 아니고 기록도 아니지만 정보와 기록의 원천이며 지식의 자원이다. 전자적 시스템을 통한 행정 행위가 보편화된 이후 당연히 데이터에 기반한 기록의 생산과 기술이 확대되고 진화하고 있다. 기술은 가치중립적인 듯 보이지만 사실 그 자체로 특정 세계관을 반영하고 있다. 더구나 비물질적 유통을 기반으로 하는 디지털 세계, 온라인 네트워크의 또 다른 아이러니는 반드시 물리적 도구를 통해서만 접속하고 접촉할 수 있다는 점이다. 디지털 정보는 논리적 대상이지만 반드시 어떤 유형이든 그것을 중계할 장치 없이는 디지털 자원을 읽어 내거나 활용할 수 없다. 초연결, 초지능을 무기로 하는 새로운 기술의 디지털 질서는 전통적인 권력 구조에 깊은 영향력을 끼칠 뿐만 아니라 기존의 정보 및 지식 전달 매개체에도 마찬가지의 영향을 미치고 있다. 더구나 데이터에 기반한 생성형 인공지능을 비롯해 새로운 기술과 매개가 단연 화두다. 디지털 기술의 전방위적 성장과 확산이 인간 역능의 증강과 사유의 외주화 상황까지 왔다고 볼 수 있을 것이다. 여기에는 딥 페이크를 비롯한 가짜 이미지, 오토 프로파일링, 사실처럼 생성해 내는 AI 거짓말(hallucination), 기계 학습데이터의 저작권 침해에 이르기까지 다양한 문제점 또한 내포하고 있다. 더구나 급진적 연결 능력은 방대한 데이터의 즉각적 공유를 가능하게 하고 인지 없이 행위를 발생시키는 기술적 무의식에 의존하게 된다. 그런 점에서 지금의 기술 사회의 기계는 단순 보조의 수준을 넘어서고 있으며 기계의 인간 사회 진입은 고도의 기술 발전에 따른 자연적인 변화 양상이라고 하기에는 간단하지 않은 지점이 존재한다. 시간이 지나며 기계에 대한 관점이 변화하게 될 것이기 때문이다. 따라서 중요한 것은 기계를 통한 커뮤니케이션, 행위의 결과로서의 기록이 생산되고 사용되는 방식의 변화가 의미하는 사회문화적 함의에 있다. 아카이브 영역에서도 초지능, 초연결사회를 향한 기술의 변화로 인해 데이터 기반 아카이브 사회는 어떤 문제에 직면하게 될 것인지, 그리고 그 속에서 누가 어떻게 기록과 데이터의 지속적 활동성을 입증하고 매체 변화의 주요 동인이 될 것인가에 대한 연구가 필요한 시점이다. 본 연구는 아카이브가 행위의 결과인 기록뿐만 아니라 데이터를 전략적 자산으로 인식할 필요성에서 시작했다. 이를 통해 전통적 경계를 확장하고 데이터 중심 사회에서 어떻게 재영토화를 이룰 수 있을지를 알아보았다.

Support Vector Regression을 이용한 GARCH 모형의 추정과 투자전략의 성과분석 (Estimation of GARCH Models and Performance Analysis of Volatility Trading System using Support Vector Regression)

  • 김선웅;최흥식
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.107-122
    • /
    • 2017
  • 주식시장의 주가 수익률에 나타나는 변동성은 투자 위험의 척도로서 재무관리의 이론적 모형에서뿐만 아니라 포트폴리오 최적화, 증권의 가격 평가 및 위험관리 등 투자 실무 영역에서도 매우 중요한 역할을 하고 있다. 변동성은 주가 수익률이 평균을 중심으로 얼마나 큰 폭의 움직임을 보이는가를 판단하는 지표로서 보통 수익률의 표준편차로 측정한다. 관찰 가능한 표준편차는 과거의 주가 움직임에서 측정되는 역사적 변동성(historical volatility)이다. 역사적 변동성이 미래의 주가 수익률의 변동성을 예측하려면 변동성이 시간 불변적(time-invariant)이어야 한다. 그러나 대부분의 변동성 연구들은 변동성이 시간 가변적(time-variant)임을 보여주고 있다. 이에 따라 시간 가변적 변동성을 예측하기 위한 여러 계량 모형들이 제안되었다. Engle(1982)은 변동성의 시간 가변적 특성을 잘 반영하는 변동성 모형인 Autoregressive Conditional Heteroscedasticity(ARCH)를 제안하였으며, Bollerslev(1986) 등은 일반화된 ARCH(GARCH) 모형으로 발전시켰다. GARCH 모형의 실증 분석 연구들은 실제 증권 수익률에 나타나는 두터운 꼬리 분포 특성과 변동성의 군집현상(clustering)을 잘 설명하고 있다. 일반적으로 GARCH 모형의 모수는 가우스분포로부터 추출된 자료에서 최적의 성과를 보이는 로그우도함수에 대한 최우도추정법에 의하여 추정되고 있다. 그러나 1987년 소위 블랙먼데이 이후 주식 시장은 점점 더 복잡해지고 시장 변수들이 많은 잡음(noise)을 띠게 됨에 따라 변수의 분포에 대한 엄격한 가정을 요구하는 최우도추정법의 대안으로 인공지능모형에 대한 관심이 커지고 있다. 본 연구에서는 주식 시장의 주가 수익률에 나타나는 변동성의 예측 모형인 GARCH 모형의 모수추정방법으로 지능형 시스템인 Support Vector Regression 방법을 제안한다. SVR은 Vapnik에 의해 제안된 Support Vector Machines와 같은 원리를 회귀분석으로 확장한 모형으로서 Vapnik의 e-insensitive loss function을 이용하여 비선형 회귀식의 추정이 가능해졌다. SVM을 이용한 회귀식 SVR은 두터운 꼬리 분포를 보이는 주식시장의 변동성과 같은 관찰치에서도 우수한 추정 성능을 보인다. 2차 손실함수를 사용하는 기존의 최소자승법은 부최적해로서 추정 오차가 확대될 수 있다. Vapnik의 손실함수에서는 입실론 범위내의 예측 오차는 무시하고 큰 예측 오차만 손실로 처리하기 때문에 구조적 위험의 최소화를 추구하게 된다. 금융 시계열 자료를 분석한 많은 연구들은 SVR의 우수성을 보여주고 있다. 본 연구에서는 주가 변동성의 분석 대상으로서 KOSPI 200 주가지수를 사용한다. KOSPI 200 주가지수는 한국거래소에 상장된 우량주 중 거래가 활발하고 업종을 대표하는 200 종목으로 구성된 업종 대표주들의 포트폴리오이다. 분석 기간은 2010년부터 2015년까지의 6년 동안이며, 거래일의 일별 주가지수 종가 자료를 사용하였고 수익률 계산은 주가지수의 로그 차분값으로 정의하였다. KOSPI 200 주가지수의 일별 수익률 자료의 실증분석을 통해 기존의 Maximum Likelihood Estimation 방법과 본 논문이 제안하는 지능형 변동성 예측 모형의 예측성과를 비교하였다. 주가지수 수익률의 일별 자료 중 학습구간에서 대칭 GARCH 모형과 E-GARCH, GJR-GARCH와 같은 비대칭 GARCH 모형에 대하여 모수를 추정하고, 검증 구간 데이터에서 변동성 예측의 성과를 비교하였다. 전체 분석기간 1,487일 중 학습 기간은 1,187일, 검증 기간은 300일 이다. MLE 추정 방법의 실증분석 결과는 기존의 많은 연구들과 비슷한 결과를 보여주고 있다. 잔차의 분포는 정규분포보다는 Student t분포의 경우 더 우수한 모형 추정 성과를 보여주고 있어, 주가 수익률의 비정규성이 잘 반영되고 있다고 할 수 있다. MSE 기준으로, SVR 추정의 변동성 예측에서는 polynomial 커널함수를 제외하고 linear, radial 커널함수에서 MLE 보다 우수한 예측 성과를 보여주었다. DA 지표에서는 radial 커널함수를 사용한 SVR 기반의 지능형 GARCH 모형이 가장 우수한 변동성의 변화 방향에 대한 방향성 예측력을 보여주었다. 추정된 지능형 변동성 모형을 이용하여 예측된 주식 시장의 변동성 정보가 경제적 의미를 갖는지를 검토하기 위하여 지능형 변동성 거래 전략을 도출하였다. 지능형 변동성 거래 전략 IVTS의 진입규칙은 내일의 변동성이 증가할 것으로 예측되면 변동성을 매수하고 반대로 변동성의 감소가 예상되면 변동성을 매도하는 전략이다. 만약 변동성의 변화 방향이 전일과 동일하다면 기존의 변동성 매수/매도 포지션을 유지한다. 전체적으로 SVR 기반의 GARCH 모형의 투자 성과가 MLE 기반의 GARCH 모형의 투자 성과보다 높게 나타나고 있다. E-GARCH, GJR-GARCH 모형의 경우는 MLE 기반의 GARCH 모형을 이용한 IVTS 전략은 손실이 나지만 SVR 기반의 GARCH 모형을 이용한 IVTS 전략은 수익으로 나타나고 있다. SVR 커널함수에서는 선형 커널함수가 더 좋은 투자 성과를 보여주고 있다. 선형 커널함수의 경우 투자 수익률이 +526.4%를 기록하고 있다. SVR 기반의 GARCH 모형을 이용하는 IVTS 전략의 경우 승률도 51.88%부터 59.7% 사이로 높게 나타나고 있다. 옵션을 이용하는 변동성 매도전략은 방향성 거래전략과 달리 하락할 것으로 예측된 변동성의 예측 방향이 틀려 변동성이 소폭 상승하거나 변동성이 하락하지 않고 제자리에 있더라도 옵션의 시간가치 요인 때문에 전체적으로 수익이 실현될 수도 있다. 정확한 변동성의 예측은 자산의 가격 결정뿐만 아니라 실제 투자에서도 높은 수익률을 얻을 수 있기 때문에 다양한 형태의 인공신경망을 활용하여 더 나은 예측성과를 보이는 변동성 예측 모형을 개발한다면 주식시장의 투자자들에게 좋은 투자 정보를 제공하게 될 것이다.

충북지역 초등학교 영양교사의 식생활 교육과 영양상담 운영실태 및 인식 (Operation and Perception on Dietary Life Education and Nutrition Counseling of Elementary School in Chungbuk Province)

  • 김명실;김혜진;이영은
    • 한국식품영양과학회지
    • /
    • 제42권12호
    • /
    • pp.2049-2067
    • /
    • 2013
  • 본 연구는 영양교사의 직무로 제시된 올바른 식습관 형성을 위한 식생활 지도와 영양불균형을 시정하기 위한 영양상담의 운영 실태와 인식을 충청북도 초등학교에 재직 중인 영양교사를 대상으로 조사함으로써 보다 효과적인 영양교육 활성화 방안을 제시하고자 하였으며 본 연구결과를 요약하면 다음과 같다. 초등학교 학생들에게 실시하고 있는 식생활과 관련된 직접교육을 5개 항목으로 구분하여 실시여부를 조사한 결과 실시가 58.9%, 전혀 실시하지 않는 경우는 41.1%로 나타났다. 운영형태별 식생활 교육 조사결과를 보면 '전통식문화 계승사업 운영을 통한 식생활 교육'을 실시하는 경우가 89.5%로 실시율이 가장 높게 나타났다. 실시 중인 식생활 교육의 연간 수업시수에 대해 65.8%가 월 1~2회 이상 식생활 교육을 실시하고 있는 것으로 조사되었고, 실시중인 식생활 교육 시 이용하는 시간은 주로 관련교과시간과 재량활동시간으로 모두 48.7%로 가장 주로 이용하는 시간으로 나타났다. 실시 중인 식생활 교육에서 주로 이용하는 자료수집 방법으로는 동료 영양교사와의 정보교환이 59.2%, 인터넷 자료 이용이 40.8% 등으로 나타났으며, 실시 중인 식생활 교육의 교육 지도 방법을 조사한 결과 실험 실습위주의 교육이 90.7%로 가장 높았고 그 다음이 강의식 41.3%로 나타났다. 실시 중인 식생활 교육 시 주로 사용하는 교육매체는 인쇄매체가 42.1%로 가장 주로 사용하는 매체였으며, 실시 중인 식생활 교육을 위한 수업지도안 및 계획서 작성여부에 대하여 조사해본 결과 61.8%가 작성하고 있는 것으로 조사되었다. 실시 중인 식생활 교육 공개수업 경험여부에 대해 경험이 없는 경우가 85.5%로 나타났으며, 식생활 교육을 위한 별도의 특별실 설치 여부는 미설치가 96.1%로 나타났다. 식생활 교육에 대한 인식 조사 결과 5개 항목의 식생활교육 형태별 활성화 정도는 2.24점으로 낮았고 필요성은 4.54점으로 높게 나타나 식생활 교육의 필요하다고 인식하고 있었다. 식생활 교육 수행 시 어려운 점으로는 과다한 업무가 평균 4.43점으로 가장 높게 나타나 영양교사의 업무과중을 해결할 방안이 요구된다. 식생활 교육을 위해 바람직한 교육시기로 바람직한 식습관에 대한 식생활 교육과 생활습관을 배우는 과정의 예절교육은 저학년, 전통식문화 계승사업 운영을 통한 식생활 교육, 특별활동을 이용한 식생활 교육은 고학년부터 실시하는 것이 바람직하다고 나타났다(P<0.001). 식생활 교육 운영형태별 바람직한 이용시간에 대해서 유의한 차이가 나타났으며(P<0.001), 급식유형별로 식생활 교육 운영형태별 식생활 교육 수행 시 어려운 정도는 전통식문화 계승사업 운영을 통한 식생활 교육에서 유의한 차이를 보였다(P<0.05). 식생활 교육 운영형태별 식생활 교육의 수행에 바람직한 교육시기, 운영시간, 이용시간, 지도방법, 교육매체 간 유의한 차이가 나타났으며(P<0.001), 식생활 운영형태별 식생활 교육의 수행에 바람직한 교육지도 방법은 '관련교과와 연계한 식생활 교육'만이 강의식 60.5%, 토의식 17.8%로 나타났으며 다른 식생활 교육 형태는 모두 실험 실습을 통한 교육지도방법이 가장 바람직하다고 인식하고 있었고 유의한 차이가 나타났다(P<0.001). 교수활동 능력향상 방안은 수업 연구개발이 38.8%로 높게 나타났고 교수활동 수행을 위한 연수내용으로 교수-학습방법 및 평가가 4.35점으로 가장 높았으며, 급식업무 과중 해결 방안으로는 1인 1개교 영양교사 배치를 36.4%가 응답하여 가장 높았고, 급식유형별로 유의적인 차이가 있었다(P<0.05). 정기적인 교육운영시간 확보방안은 독립교과 설치가 44.2%로 나타났으며, 요구되는 교육기자재는 표준화된 지침서 및 지도서가 80.6%로 가장 높게 응답하였다. 식생활 교육 전담시설에 대해서는 평균 4.35로 '필요하다'라고 응답하였으며, 학교 관리자 및 학부모의 식생활 교육 홍보방안은 '식생활 수업공개 및 급식공개의 날을 적극 운영'이 63.6%로 가장 높았다. 영양상담 운영 실태는 실시가 62.8%였고 학생대상은 모두 실시하고 있었다. 실시장소는 급식 관리실 이용이 77.8%로 가장 많았으며, 영양상담 방법은 개별상담이 84.0%로 나타났다. 영양상담 1회 소요 시간은 10~20분 미만이 77.5%, 실시횟수는 월 2~3회 실시한다가 56.8%로 가장 많았고, 평균실시횟수는 월 1회가 30.9%로 가장 많았다. 자료 수집방법은 대한영양사협회 교육자료가 43.2%로 가장 많이 이용하는 자료 수집 방법이었으며, 상담도구로는 식사 기록지와 식사일기가 56.8%로 많았다. 실시 중인 영양상담 내용으로는 비만 개선이 77.8%로 가장 많은 내용을 차지하고 있었다. 상담관련 연수 경험에 대해 44.4%가 연수경험이 없는 것으로 나타났으며, 연수경험이 있는 54.6%를 대상으로 연수시간에 대해 조사해 본 결과 30시간 미만의 연수경험이 51.1%로 조사되었다. 초등학교 영양교사의 영양상담에 대한 인식과 의견조사 결과 영양상담의 활성화 정도에 대한 인식도는 평균 2.12점으로 '활성화 되어 있지 않다'고 인식하고 있었으나, 필요성은 평균 4.05점으로 나타나 필요한 것으로 인식하고 있었으며 학교급식유형별로 유의적인 차이가 있었다(P<0.01). 영양상담이 요구되는 이유에 대해 '잘못된 식습관 및 식생활 개선'을 위해서가 40.6%로 가장 많이 응답하였다. 영양상담 형태에 따른 영양불균형 및 질병 예방 효과에 대하여 개별대상 영양상담이 평균 3.99점이었고 식이지도 특별프로그램은 평균 3.98점, 집단대상 영양상담은 평균 3.18점이었으나, 학교홈페이지 영양상담은 평균 2.56점으로 효과적이지 않은 것으로 나타났다. 영양상담 수행 시 어려운 점으로 과다한 업무가 평균 4.30점으로 가장 어려운 점으로 나타났으며, 급식유형별 영양상담 수행시 어려운 점은 상담 프로그램 부족에서 유의한 차이를 나타났다(P<0.01). 영양상담 시 중요하게 다루어야 할 주요내용으로 식습관 관련 내용이 70.5%, 비만관련 내용이 27.9%로 나타났으며 영양상담 형태에 따른 적절한 영양상담시기에 대한 의견 조사 결과 영양상담 적절시기는 영양상담 형태별로 유의한 차이를 보였다(P<0.01).

경영분석지표와 의사결정나무기법을 이용한 유상증자 예측모형 개발 (Development of Predictive Models for Rights Issues Using Financial Analysis Indices and Decision Tree Technique)

  • 김명균;조윤호
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.59-77
    • /
    • 2012
  • 기업의 성장성, 수익성, 안정성, 활동성, 생산성 등에 대한 다양한 분석이 은행, 신용평가기관, 투자자 등 많은 이해관계자에 의해 실시되고 있고, 이에 대한 다양한 경영분석 지표들 또한 정기적으로 발표되고 있다. 본 연구에서는 이러한 경영분석 지표를 이용하여 어떤 기업이 가까운 미래에 유상증자를 실시하는지를 데이터마이닝을 통해 예측하고자 한다. 본 연구를 통해 어떠한 지표가 유상증자 여부를 예측하는데 도움이 되는가를 살펴 볼 것이며, 그 지표들을 이용하여 예측할 경우 그 예측의 정확도가 어느 정도인지를 분석하고자 한다. 특히 1997년 IMF 금융위기 전후로 유상증자를 결정하는 변수들이 변화하는지, 그리고 예측의 정확성에 분명한 차이가 존재하는지 분석한다. 또한 유상증자 실시 시기를 경영분석 지표 발표 후 1년 내, 1~2년 내, 2~3년 내로 나누어 예측 시기에 따라 예측의 정확성과 결정 변수들의 차이가 존재하는지도 분석한다. 658개의 유가증권상장법인의 경영분석 데이터를 이용하여 실증 분석한 결과, IMF 이후의 유상증자 예측모형이 IMF 이전의 예측모형에 비해 예측 정확도가 높았고, 학습용 데이터의 예측 정확도와 검증용 데이터의 예측 정확도 차이도 IMF 이후가 낮게 나타났다. 이러한 결과는 IMF 이후 재무자료의 정확도가 높아졌고, 기업에게 유상증자의 목적이 더욱 명확해졌다고 해석될 수 있다. 또한 예측기간이 단기인 경우 경영분석 지표 중 안전성에 관련된 지표들의 중요성이 부각되었고, 장기인 경우에는 수익성과 안전성뿐만 아니라 활동성과 생산성 관련지표도 유상증자를 예측하는 데 중요한 것으로 파악되었다. 그리고 모든 예측모형에서 산업코드가 유상증자를 예측하는 중요변수로 포함되었는데 이는 산업별로 서로 다른 유상증자 유형이 존재한다는 점을 시사한다. 본 연구는 투자자나 재무담당자가 유상증자 여부를 장단기 시점에서 예측하고자 할 때 어떠한 경영분석지표를 고려하여 분석하는 것이 바람직한지에 대한 지침을 제공하는데 그 의의가 있다.

Ensemble of Nested Dichotomies 기법을 이용한 스마트폰 가속도 센서 데이터 기반의 동작 인지 (Ensemble of Nested Dichotomies for Activity Recognition Using Accelerometer Data on Smartphone)

  • 하으뜸;김정민;류광렬
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.123-132
    • /
    • 2013
  • 최근 스마트 폰에 다양한 센서를 내장할 수 있게 되었고 스마트폰에 내장된 센서를 이용항 동작 인지에 관한 연구가 활발히 진행되고 있다. 스마트폰을 이용한 동작 인지는 노인 복지 지원이나 운동량 측정. 생활 패턴 분석, 운동 패턴 분석 등 다양한 분야에 활용될 수 있다. 하지만 스마트 폰에 내장된 센서를 이용하여 동작 인지를 하는 방법은 사용되는 센서의 수에 따라 단일 센서를 이용한 동작인지와 다중 센서를 이용한 동작인지로 나눌 수 있다. 단일 센서를 이용하는 경우 대부분 가속도 센서를 이용하기 때문에 배터리 부담은 줄지만 다양한 동작을 인지할 때에 특징(feature) 추출의 어려움과 동작 인지 정확도가 낮다는 문제점이 있다. 그리고 다중 센서를 이용하는 경우 대부분 가속도 센서와 중력센서를 사용하고 필요에 따라 다른 센서를 추가하여 동작인지를 수행하며 다양한 동작을 보다 높은 정확도로 인지할 수 있지만 다수의 센서를 사용하기 때문에 배터리 부담이 증가한다는 문제점이 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 스마트 폰에 내장된 가속도 센서를 이용하여 다양한 동작을 높은 정확도로 인지하는 방법을 제안한다. 서로 다른 10가지의 동작을 높을 정확도로 인지하기 위해 원시 데이터로부터 17가지 특징을 추출하고 각 동작을 분류하기 위해 Ensemble of Nested Dichotomies 분류기를 사용하였다. Ensemble of Nested Dichotomies 분류기는 다중 클래스 문제를 다수의 이진 분류 문제로 변형하여 다중 클래스 문제를 해결하는 방법으로 서로 다른 Nested Dichotomy 분류기의 분류 결과를 통해 다중 클래스 문제를 해결하는 기법이다. Nested Dichotomy 분류기 학습에는 Random Forest 분류기를 사용하였다. 성능 평가를 위해 Decision Tree, k-Nearest Neighbors, Support Vector Machine과 비교 실험을 한 결과 Ensemble of Nested Dichotomies 분류기를 사용하여 동작 인지를 수행하는 것이 가장 높은 정확도를 보였다.

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.

지식베이스 확장을 위한 멀티소스 비정형 문서에서의 정보 추출 시스템의 개발 (Development of Information Extraction System from Multi Source Unstructured Documents for Knowledge Base Expansion)

  • 최현승;김민태;김우주;신동욱;이용훈
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.111-136
    • /
    • 2018
  • 지식베이스를 구축하는 작업은 도메인 전문가가 온톨로지 스키마를 이해한 뒤, 직접 지식을 정제하는 수작업이 요구되는 만큼 비용이 많이 드는 활동이다. 이에, 도메인 전문가 없이 다양한 웹 환경으로부터 질의에 대한 답변 정보를 추출하기 위한 자동화된 시스템의 연구개발의 필요성이 제기되고 있다. 기존의 정보 추출 관련 연구들은 웹에 존재하는 다양한 형태의 문서 중 학습데이터와 상이한 형태의 문서에서는 정보를 효과적으로 추출하기 어렵다는 한계점이 존재한다. 또한, 기계 독해와 관련된 연구들은 문서에 정답이 있는 경우를 가정하고 질의에 대한 답변정보를 추출하는 경우로서, 문서의 정답포함 여부를 보장할 수 없는 실제 웹의 비정형 문서로부터의 정보추출에서는 낮은 성능을 보인다는 한계점이 존재한다. 본 연구에서는 지식베이스 확장을 위하여 웹에 존재하는 멀티소스 비정형 문서로부터 질의에 대한 정보를 추출하기 위한 시스템의 개발 방법론을 제안하고자 한다. 본 연구에서 제안한 방법론은 "주어(Subject)-서술어(Predicate)"로 구분된 질의에 대하여 위키피디아, 네이버 백과사전, 네이버 뉴스 3개 웹 소스로부터 수집된 비정형 문서로부터 관련 정보를 추출하며, 제안된 방법론을 적용한 시스템의 성능평가를 위하여, Wu and Weld(2007)의 모델을 베이스라인 모델로 선정하여 성능을 비교분석 하였다. 연구결과 제안된 모델이 베이스라인 모델에 비해, 위키피디아, 네이버 백과사전, 네이버 뉴스 등 다양한 형태의 문서에서 정보를 효과적으로 추출하는 강건한 모델임을 입증하였다. 본 연구의 결과는 현업 지식베이스 관리자에게 지식베이스 확장을 위한 웹에서 질의에 대한 답변정보를 추출하기 위한 시스템 개발의 지침서로서 실무적인 시사점을 제공함과 동시에, 추후 다양한 형태의 질의응답 시스템 및 정보추출 연구로의 확장에 기여할 수 있을 것으로 기대한다.