• 제목/요약/키워드: 문서유사도

검색결과 701건 처리시간 0.03초

기록관리전문가의 양성교육에 관한 사례연구 -이탈리아의 기록관리학 전통과 교육과정을 중심으로- (A study on the case of education to train an archivist - Focus on archival training courses and the tradition of archival science in Italiy -)

  • 김정하
    • 한국기록관리학회지
    • /
    • 제1권1호
    • /
    • pp.201-230
    • /
    • 2001
  • 기록들은 이전 사회의 모든 분야의 삶에 대한 기록된 흔적이자 증언이다. 기록문화유산을 보존하는 것은 물론 우리 모두의 사명이지만, 특히 관리 및 보존의 임무는 기록물관리에 대한 전문지식을 갖고 있는 기록관리전문가들의 몫이다. 기록관리전문가는 단지 오래된 기록물만을 보존하는 것이 아니라 과거의 문서를 오늘날의 역사기록물로 정의하기, 위한 미래적 안목의 평가와 선별작업을 수행하여야 한다. 일반적으로 기록관리학의 범위는 기록물의 생산에서 영구보존에 이르기까지 방대하며, 내용적으로는 크게 업무 및 행정기록물관리와 역사기록물관리의 두영역으로 이루어져 있다. 이탈리아의 경우 18세기말과 19세기초 구지도의 종말과 복원의 시대를 배경으로 원래의 질서를 상실한 채 방치된 수많은 문서들에 대한 정리작업의 필요성을 계기로 성립된 '역사기록물관리'가 기록관리학의 전통영역으로 대변된다. 이 당시의 오늘날의 십진법적 분류와 유사한 '주제별 정리방식'이 실험적으로 이루어졌다. 또한 기록물정리방식과 그 이론적 배경, 대규모 기록보존소의 설립, 그리고 기록물의 법칙, 문화적 가치 및 활용 등의 개념들이 기록관리전문가의 포괄적이고 전문적인 활동내용으로 규정되었다. 특히 이 시대에는 기록관리학이 중세문서들의 형태와 내용, 그리고 문서들의 다양한 서체와 기록배경에 대한 학문적 해석을 통해서 기록물을 역사연구에 활용하려는 고문서학 및 고서체학적 전통의 보조수단으로 인식되기도 하였다. 근현대의 기록관리는 고문서관리라는 전통영역이외에도 업무 및 행정기록물의 생산에서 등록, 분류, 편철, 활용, 선별 그리고 이관 등에 관한 종합적인 관리를 포함하게 되었다. 따라서 오늘날 기록관리전문가의 활동영역은 기록물의 행정적 가치에서 역사, 문화적 가치에 이르는 전과정의 흐름을 제도적으로 보장하는 것으로 정의되고 있다. 기록관리학에 대한 기본교육의 핵심은 역사와 법으로 구성된다. 기록관리전문가에게 법연구가 필요한 것은 기록보존소가 법적 행정적인 활동으로 생산된 문서들을 대상으로 과학적 관리활동을 수행하는 연구기관이기 때문이다. 비록 기록관리전문가들이 어떤 분야의 전문지식과 학위를 취득해야만 하는가에 대해서는 이견이 많지만 기능성 차원에서 역사관련 학문분야를 선호하며, 기록관리전문가 자신의 신념이나 이념의 보편적인 테두리를 갖기 위해 법학연구도 강조되고 있다. 20세기 접어들면서 기록보존소가 문화기관에 예속되는 경향이 우세해져 행정기관들이 기록보존소를 관리하던 과거의 전통에 대한 반발이 커지기도 하였지만 이러한 현상은 큰 영향을 불러일으키지는 못하였다. 이탈리아의 기록관리 교육은 토리노, 밀라노, 베네치아, 베노바, 볼로냐, 파르마, 로마, 나폴리, 팔레르모 등 대략 9곳의 국립기록보존소를 중심으로 이루어졌다. 이 시기의 교육과정은 대부분 고서체학과 고문서학 강의가 대부분이었으며, 여전히 기록관리학에 대한 교육은 실시되지 않았다. 1884년에 바티간의 비밀기록보존소는 '고서체학 교육과정'을 설치하였으며, 이 과정은 40년 후인 1923년에야 1년 단위의 기록관리학 과정으로 재편성되면서 명실상부한 <<고서체학, 고문서학, 그리고 기록관리학>>의 교육과정으로 발전하였다. 19세기말 20세기에 접어들면 국립기록보존소들의 교육과정에서 가장 기본적인 과목은 고서체학과 고문서학이 아니라 오히려 기록관리학임이 재차 강조되었다. 특히 고서체학과 고문서학에 대한 기록관리학은 우월을 강조하는 카사노바의 소신은 시사하는 바가 크다. 그는 고서체학, 고문서학, 그리고 기록관리학이 모두 필수적이며, 문장학, 가계학, 그리고 인장학에 대한 교육과 더불어 완성된다고 보았다. 그러나 기록보존소의 모든 기록들의 고서체학자와 고문서학자 등의 개입을 필요로 하지는 않는다. 반면에 모든 문서들은 기록관리전문가의 도움을 필요로 한다. 기록관리학의 목적은 기록 보존소에 기록물을 이관한 제도와 기관들을 연구하고, 관리들이 어려움없이 모든 것을 쉽게 이해하고 각 기관들의 고유한 업무절차와 업무분단에 대한 무지속에서 헤메지 않고 자신들의 할 일을 분명하게 알게하도록 하려는 것이다. 이처럼 문서를 생산한 기관과제도들의 역사에 대한 연구는 이미 몇십년부터 기록관리학의 한분야로 자리잡았다. 기록관리학이 많은 사람들의 공감대를 형성하지 못하고 학문으로서의 길고 어려운 여정을 겪는 동안 이탈리아뿐만 아니라 여러 국가의 기록보존소들은 역사를 비롯한 타학문가의 전문가들을 포함한 기록관리학의 버전문가들에 의해 운영됨으로써 많은 폐단을 겪게 되었다. 많은 기록물들이 도서관 사서들의 방식과 스타일에 따라 혹은 역사가들이 주장하는 주제별 분류방식에 따라 정리되었기 때문에 자국의 경험에 기초하여 마련된 기록물의 본래의 구조 즉 원 질서가 완전히 파괴되었다. 20세기 미국의 경우에도 도서관에 관련된 학문에 있어서는 다른 나라들에 비해 상당히 앞서 있었지만, 기록관리학에 있어서는 후진성을 면치 못하고 있었다. 이탈리아의 기록관리전문사 양성을 위한 전문교육과정은 1925년 로마 국립대학교의 사회과학대학원을 배경으로 성립되었다. 대학의 기록관리교육은 역사, 법, 경제에 대한 열정으로 여러 국립기록보존서들에 기록관리교육이 정식 전문교육과정으로 정착되었다. 볼로냐 국립기록보존소의 '기록관리학, 고서체학 그리고 고문서학의 전문교육과정'은 이탈리아의 17개 국립기록보존소들에서 실시하고 잇는 교육과정들 중의 하나이다. 본 교육과정은 무료이며, 2년동안 8개의 과목(기록관리학, 고서체학, 고문서학, 기록보존소의 역사, 공증인제도와 사문서, 중세의 제도사, 근대의 제도사, 현대의 제도사 등) 중에 7개의 과목을 이수하는 것으로 구성된다. 2년의 학위과정은 2회의 필기시험관 1회의 구두시럽으로 마감된다. 최종시험성적이 문화환경부에 의해 종합되면 볼로냐 국립기록보존서의 소장은 시험을 통과한 수강생들에게 '기록관리학, 고서체학 그리고 고문서학 학위'를 수여한다. 이 학위증은 도, 지방 그리고 지방의 행정수도에 위치한 기록보존소와 특별히 중요하다고 판단되는 자치도시의 조합기록보존소 및 다른 기관들의 기록 보존소에 근무할 수 있는 필수적인 자격조건을 구성한다. 바티칸의 기록보존소에서 교수되는 내용은 다른 교육과정들과 비교하여 근본적인 차이는 없다. 그러나 과거의 역사에서 독립된 영토단위와 영적, 세속적 권력을 행사하였던 관계로 과목게 있어서 보다 전문적이고 세밀한 교육내용을 추구하고 있다. 필수과목으로는 기록관리학, 필사본학, 일반 고문서학, 교황청 고문서학 그리고 라틴 고서체학이 있다. 이외에도 강독실습과 구두를 통한 이론연습이 있으며, 문장학, 인장학, 상식문자의 역사, 교황청의 역사 등 인접분야 혹은 보조학문에 대한 교육도 선택적으로 실시된다. 이탈리아의 기록관리전문가를 위한 전문교육은 현장실습을 통해 과거의 문화유산에 대한 직접적인 접촉을 유도하고, 기록물 전체에 대한 관심에 앞서 각 문서에 대한 쵠화력을 가오하하려는 의도는 반영하고 잇다. 또한 기록관리 현장에서 기록관리전문가의 양성을 위한 교육을 실시한다는 발상은 역사적으로 해당지역의 독특한 발전과정을 증언하는 국립기록보존소들의 고유한 특성과 연계하여 지역문화유상을 보존하려는 보다 적극적인 문화정책의 일환으로 평가된다. 이탈리아 기록관리전문가를 위한 교육과정이 우리에게 시사하는 바를 정리하면 다음과 같다. 첫째, 이탈리아의 교육과정 대부분이 역사기록물에 대한 관리를 중심으로 계획된 반면에 업무 및 행정기록물에 대한 프로그램은 상당히 미미하다. 그러나 기록물 생산에서 영구보존에 이르기까지 역사기록물의 정리방식으로 원 질서 즉 생산당시에 부여된 최초의 질서를 존중하는 원칙이 채택되고 있으므로 업무 및 행정기록물에 대한 관리 역시 역사기록물의 관리체계와 일관성을 가지고 있다. 둘째, 17개의 국립기록보존시를 배경으로 기록관리전문가를 위한 전문교육과정이 운영되고 있다. 비록 대학의 기록관리교육이 활성화되지 못한 것이 자격과 능력을 겸비한 전문가의 부족때문이기도 하였지만, 이탈리아 국립기록보존소들이 교육과 이론보다는 기록관리의 일선에서 활동할 인력을 양성하는데 치중한 결과이다. 셋째, 역사문서들에 대한 연구를 위한 고문서학과 고서체학이 기록관리학을 지원하고 있다는 사실이다. 넷째, 이탈리아의 과거사 연구가 기록보존소를 중심으로 기록관리전문가와 역사가의 상호보완적 관계를 통해 진행되고 잇다는 것이다. 이러한 기록보존소의 역사기록물을 공통문모로 하는 역사연구의 방법론은 거시사연구보다는 각 지역이나 소단위 연구주제의 독특한 역사발전상황을 존중하는 미시사적 연구방법론이 정착되는데 기여하였다는 것이다. 이제 우리의 과제는 기록물을 관리할 주체에 관한 논쟁이 아니라 기록물의 다양한 그리고 그 가치를 훼손시키지 않는 방식으로 문서들을 책임질 능력과 통찰력 그리고 탄력적인 사고를 가진 기록관리전문가를 정하는 것이다. 그리고 궁극적으로는 이러한 전문가들을 양성하기 위한 교육과정을 준비하고 이들이 기록관리의 현장에서 신념을 갖고 종사할 수 있는 터전을 마련하는 것이다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

항공안전규제와 새로운 이슈에 대한 ICAO의 대응 (Aviation Safety Regulation and ICAO's Response to Emerging Issues)

  • 신동춘
    • 항공우주정책ㆍ법학회지
    • /
    • 제30권1호
    • /
    • pp.207-244
    • /
    • 2015
  • 항공안전은 계속적인 위험성의 확인과 관리를 통하여 개인에의 위해나 재산손실의 위험이 수용 가능한 수준으로 감소되거나 그 이하로 유지되는 상태를 의미하며, 항공 안전을 증진하기 위한 다양한 방법이 모색되고 있다. 최근 10여 년 간 국제민간항공은 비교적 높은 수준의 안전을 유지하여 왔으나 2014년부터 여러 가지 사고가 발생하면서 국제민간항공계가 다시 긴장하고 있고 ICAO를 중심으로 다각적인 대응방안을 모색하고 있다. 항공안전은 국제민간항공을 지탱하는 가장 중요한 요소이다. 국제민간항공협약(시카고협약)은 서문에서 안전과 질서가 중요함을 강조하였고, 협약의 다수 조문이 안전에 관계되어 있다. 부속서(1-19)는 몇 개를 빼고는 모두 안전에 관한 국제표준과 권고를 규정하고 있다. 특히 부속서 19는 안전관리체제에 대하여 기존의 부속서에 산재되어 있는 규정을 통합했고 도한 새로운 규정을 신설하였다. 또한 ICAO는 안전 문제를 증진하기 위한 의사결정과 입법 기능을 가지고 있으며 항행위원회, 법률위원회, 항공운송위원회 등과 이사회의 심의를 기초로 하여 총회가 최종 결정 권한을 가지고 있다. 보조 기구로서 전문가 그룹, 태스크포스 등을 수시로 설치, 운영하고 있고, 사무국은 이러한 제반 기구의 사무를 보조하고 있다. 또한 ICAO는 USAOP과 USAP 프로그램을 통하여 체약국의 안전 및 보안 수준을 점검하고 있고, 미국, EU, IATA 등이 별도의 안전점검제도를 운영하고 있다. 2014년에 발생한 MH370기 실종 사건은 회원국, 관제기관, 항행시설, 항공기 등이 제공한 정보를 토대로 전세계추적시스템(Global Tracking System)의 구축을 통하여 항공기의 위치를 실시간 추적 가능토록 하여 문제를 해결하려고 하고 있다. 또한 우크라이나 상공에서 격추된 MH17 사건 이후 ICAO는 회원국이 제공한 정보 및 NOTAM, AIP 등 운항정보를 기반으로 정보를 공유하는 웹사이트를 운영함으로써 분쟁지역에서의 위험관리를 통하여 유사한 사고를 방지하려고 하고 있다. 에볼라가 서아프리카에서 발생한 이래 보건당국과 항공당국간의 긴밀한 협조를 통하여 항공기에 의한 전염병의 확산을 막도록 다각적인 조치를 강구하고 있다. 또한 QZ8501 사건은 악기상하에서 제대로 대처하지 못한 운항의 결과로서 이 또한 ICAO를 중심으로 추가적인 보완 조치를 강구하고 있다. 이밖에도 2015년 3월에 발생한 저먼윙즈의 부기장에 의한 항공기 추락사고와 관련 후속 조치의 강구가 요구되고 있다. 국제항공계는 이러한 사고를 예방하고 안전 수준을 더욱 제고하기 위해서는 안전 관련 데이터 및 정보의 보호와 공유가 필수적임을 인식하여 현재 있는 정보 보호 및 공유에 관한 조항 이외에 추가적인 규정을 제의하고 있으며 회원국에 의한 검토를 거쳐 부속서나 ICAO 안내 문서에 반영될 예정으로 있다. ICAO의 문제해결 방식은 네 가지 차원에서 접근되고 있다. 시간적으로 과거의 경험과 정보를 분석하는 토대위에서 단기, 중기, 장기의 대책을 마련하고, 공간적으로는 각 회원국, 지역, 전 세계에 적용될 수 있는 대책을 수립하고 있고, 항공사, 공항, 지역 사회, 소비자, 제조자, 항행서비스 공급자, 관제기관, 산업계, 보험업계 등을 망라하는 이해관계자를 고려하여야 하고, 규제적인 개선을 위하여 최선의 관행, ICAO 안내문서, 표준 및 권고 관행에 반영될 방안을 심의하고 결정하는 구조를 가지고 있다.

IEEE-1394 버스에서의 파일 전송 기법에 연구 (A Study on File Transfer Methods on IEEE-1394 Serial Bus)

  • 편기현;강성일;이흥규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.261-263
    • /
    • 1998
  • IEEE-1394 버스(이하 13394 버스)는 가정용 가전기기와 컴퓨터를 서로연결 할 수 있는 버스로 100Mbps, 200Mbps, 400Mbps의 광대역폭을 제공하고 데이터를 전달하는 방법으로 비동기 (asynchromous)전송뿐만 아니라 등시성(isochronous)전송도 제공한다. 비동기 전송은 시간의 제약이 없고 정확한 전달이 필요한 데이터에 적합한 반면 등시성 전송은 실시간을 요구하고정확한 전잘이 필요없는 데이터에 적합한 특성을 가진다. 1394 버스는 멀티미디어 데이터를 생성하고 편집하는 장치들을 서로 연결시키고 기존의 LAN이 갖는 대역폭의 부족과 프로토콜살의 실시간 전송 방법의 부재 때문에 진정한 의미의 실시간 구현이 어려웠던 화상 전화기, 화상회의 시스템, 비디오편집 시스템을 가능하게 한다. 이러한 멀티미디어 응용 시스템은1)대용향의 멀티미디어 파일 전송을 필요로 하고 화상전화기 혹은 화상회의 시스템은 2) 고속의 파일 전송을 요구하게 된다. 또 두사람이 화상 전화기를 통해 통신을 하면서 여러 가지 문서를 교환하는 경우 최대한 빠르게 파일 전송이 완료될 필요가 있다. 현재 1394버스에서 IP가 올리는 일이 진행중이므로 기존의 FTP는 사용할 수 없다. 게다가 1394 버스에 IP가 올라가더라도 1394 버스 내에서 대용량의 파일을 더 빠르고 정확하게 전달하기 위해서는 IP오버헤드가 없고 1394 버스의 특성을 직접 이용한 새로운 파일 전송 기법이 필요하다. 1394 버스내에서 대용량의 파일을 빠르고 정확하게 전송하는 기법을 찾기 위해서는 비동기 전송과 등기성 전송의 특성을 잘 이해해야하고 각 전송 방법으로 파일을 전송 할 때 생기는 장단점들을 파악해야한다. 본 논문에서는 비동기 전송과 등기성 전송을 이용한 팔일 전송 기법을 각각 제시하고 실험을 통해 이들의 특성을 비교분석하였다.미에서 uronic acid 함량이 두 배 이상으로 나타났다. 흑미의 uronic acid 함량이 가장 많이 용출된 분획은 sodium hydroxide 부분으로서 hemicellulose구조가 polyuronic acid의 형태인 것으로 사료된다. 추출획분의 구성단당은 여러 곡물연구의 보고와 유사하게 glucose, arabinose, xylose 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의 임신 기간에, 출산시체중(出産時體重) $3.50{\sim}3.99kg$사이의 아이에서 그 주산기사망률(周産基死亡率)이 각각 가장 낮았다. 2. 사산(死産)과 초생아사망(初生兒死亡)을 구분(區分)하여 고려해 볼때 사산(死産)은 모성(母性)의 임신력(姙娠歷)과 매우 밀접한 관련이 있는 것으로 사료(思料)되었고 초생아사망(初生兒死亡)은 미숙아(未熟兒)와 이에 관련된 병발이 거의 결정

  • PDF

풍력자원 조사를 위한 제주 북동부 연안역의 멱지수 분석 (Power Law Exponent in Coastal Area of Northeastern Jeju Island for the Investigation of Wind Resource)

  • 문서정;고정우;이병걸
    • 대한공간정보학회지
    • /
    • 제21권4호
    • /
    • pp.65-71
    • /
    • 2013
  • 고도에 따른 풍속변화를 의미하는 Wind shear는 풍력발전기의 에너지 생산량에 직접적으로 영향을 미치는 중요한 요소이다. 풍속을 보정하는 방법으로는 멱법칙(Power Law)이 사용되는데, 일반적으로 쓰이는 0.143(1/7)의 멱지수(Power Law exponent) 값을 이용한 보정식을 1/7th 멱법칙이라 한다. 하지만 멱지수는 해당 지역의 대기 안정도, 지표면의 상태 등에 의해 많은 영향을 받으므로, 실제 정확한 풍력에너지 예측을 위해서는 관심지역의 멱지수의 정확한 계산이 필요하다. 본 연구에서는 제주도 북동부 연안지역 3곳에 Met-mast를 설치하여 풍력자원을 측정하였고, 이를 바탕으로 제주도 북동부 지역에 적합한 멱지수를 계산하여 제안하였다. 제주도 북동부 연안지역의 멱지수를 계산한 결과, 한동 0.141, 평대 0.138, 우도 0.1254의 값을 얻었다. 0.143(1/7)의 멱지수 값, 제안한 멱지수 값을 적용하여 계산한 연간에너지생산량과 실제 측정된 풍황자료를 이용하여 계산한 연간에너지생산량을 비교한 결과, 세 지역 모두 제안한 멱지수 값을 적용하여 계산한 연간에너지생산량이 실제 측정된 풍황자료를 이용하여 계산한 연간에너지생산량과 유사한 결과를 보였고, 따라서 제안한 멱지수 값의 적용이 가능하다고 판단된다.

다국어 소셜미디어에 대한 감성분석 방법 개발: 한국어-중국어를 중심으로 (A Method of Analyzing Sentiment Polarity of Multilingual Social Media: A Case of Korean-Chinese Languages)

  • 최미나;진윤선;권오병
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.91-111
    • /
    • 2016
  • 소비자들이 소셜미디어 상에 기록한 글을 통해 기업은 제품 또는 기업 이미지에 대한 감성분석을 수행하는데 이는 소셜미디어 기반 마케팅에서 중요한 활동 중에 하나다. 특히 글로벌 소셜미디어의 경우 국적을 불문하고 다양한 고객이 늘어남에 따라 여러 언어권의 소비자들이 각자의 언어로 다양한 의견을 표명하고 있다. 이처럼 다양한 언어로 작성된 텍스트를 감성분석하기 위해서는 기존 방법과 달리 동일한 언어로 통일시켜야 하는 번역 작업이 필요하다. 하지만 번역을 하게 될 경우, 언어와 관련된 배경이나 문화, 용어사용의 차이 등으로 본래 문서에 있는 모든 단어나 문법을 정확히 표현할 수 없는 문제점이 있다. 따라서 본 연구에서는 다중 언어로 수집되는 텍스트를 번역하지 않고 해당 언어별로 텍스트를 분리한 다음 감성분석을 진행하여 각각의 극성치를 종합하는 방법을 제안하고자 한다. 본 연구에서 제안한 다국어 감성분석 알고리즘을 검증하기 위해 다중언어 문장을 한국어, 중국어로 번역한 감성분석의 극성치 편차인 RMSE 값을 비교하였다. 그 결과, 번역을 통한 다중언어의 감성분석보다 언어별로 분리한 감성값이 실제 감성값에 가장 근접하는 것으로 나타나 본 연구에서 제안한 방법론의 우수성을 입증하였다. 본 연구는 다수의 유사한 연구에서 사용했던 알고리즘을 사용하지 않고 원문 그대로 다중언어 감성분석을 시도했다는 점에서 의의가 있다.

디지털교과서 내용 구성에 관한 사용자 선호도 분석 (Analysis of User Preferences on the Structure of Digital Textbook Contents)

  • 김미혜
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.900-911
    • /
    • 2009
  • 본 논문에서는 고등교육에서 활용되는 PDF, HTML 문서 형식에 기반을 둔 디지털교과서 기본 내용 구성에 관한 사용자 선호도를 분석하고자 한다. 이는 현재 웹상에서 사용되고 있는 PDF와 HTML 기반의 대표적인 내용 구성 양식을 바탕으로 사용자 선호도에 관한 온라인 설문조사를 실시하여 분석한 후 이루어졌다. 설문조사 결과, PDF 기반인 경우 화면 왼쪽에 목차 링크를, 오른쪽에 교과서 내용을 제시한 디지털교과서 내용 구성이 82%의 응답자에 의해 가장 선호되는 구성으로 나타났으며, 보기 기능으로는 단면 보기에 서책의 한 페이지를 컴퓨터 화면 폭에 맞추어 제시한 것이었다. HTML 기반인 경우에도 PDF 경우와 유사하게 두-프레임을 이용하여 왼쪽 프레임에는 목차 링크를, 오른쪽 프레임에는 교과서 내용을 제시한 내용 구성이 84%의 응답자에 의해 가장 선호되는 형식으로 드러났다. 그러나 현재 대부분의 웹사이트에서 사용되고 있는 PDF, HTML 기반의 디지털교과서 내용 구성은 사용자 선호도를 반영하고 있지 못한 것으로 드러났다. 따라서 향후 디지털교과서 개발 시에는 학생들이 교과서 내용을 보다 쉽고 편리하게 읽을 수 있도록 사용자 선호도를 고려하여 교과서 내용을 구성해야 할 것으로 보인다.

웹마이닝을 활용한 사이클웨어 소비자 인식 분석 (Analysis of Consumer Awareness of Cycling Wear Using Web Mining)

  • 김춘정;이은주
    • 한국산학기술학회논문지
    • /
    • 제19권5호
    • /
    • pp.640-649
    • /
    • 2018
  • 본 연구는 빅데이터 분석방법 중 하나인 웹마이닝을 이용하여 사이클웨어의 요구성능 및 착용 현황 및 소비자 감성을 분석하였다. 이를 위해 네이버 카페인 '자전거로 출퇴근하는 사람들'을 대상으로 2006년~2017년 기간 동안 사이클웨어와 관련 있는 게시글과 댓글을 R 패키지를 사용하여 크롤링하였다. 수집된 데이터는 데이터 전처리 과정을 거쳐 선별된 15,321건의 문서를 데이터를 분석에 사용하였다. 추출된 데이터에서 텍스트는 한국어형태소분석기(KoNLP)를 사용하여 키워드를 추출한 후 TDM(Term Document Matrix)과 co-occurrence matrix로 변환하여 키워드별 출현 빈도수와 키워드 간 관계를 계산하였다. 사이클웨어에서 가장 출현빈도수가 높았던 키워드는 '타이츠'로 전문적인 사이클웨어에 대한 높은 관심을 나타내었으나 몸에 달라붙어 착용 시 민망하다는 의견이 많았다. 사이클웨어 '구매'와 관련하여 '가격', '사이즈', '브랜드' 등과 관련이 많았으며 '가격'과 관련하여 '저가'와 '가성비'에 대한 출현빈도수가 높았다. 이것은 최근 고가의 브랜드보다는 가격대비 성능을 만족시키는 실용적인 제품들이 선호되는 경향을 나타내주었다. 사이클웨어에서 소재의 흡한속건성이나 패드의 기능성, 불편함 등에 대한 소재나 디자인 등에 대한 개선이 요구되었다. 이처럼 웹마이닝을 이용하여 사이클웨어에 대한 소비자의 의견을 분석할 수 있었으며 기존의 설문조사와도 유사한 결과를 보여주었다. 그러므로 웹마이닝을 이용하여 소비자의 의견이나 요구사항을 실시간으로 분석하여 제품개발에 반영할 수 있는 객관적 지표로 사용할 수 있을 것으로 기대된다.

국가기록원 웹사이트 유입경로와 이용자 검색어 분석 (Analysis of Users' Inflow Route and Search Terms of the Korea National Archives' Web Site)

  • 진주영;이해영
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 이용자 정보이용환경이 웹으로 변화하면서, 기록관리기관들도 종전보다 더 많은 서비스를 웹을 통해 제공하고 있다. 이 연구는 국가기록원 웹사이트를 이용하는 이용자의 최근 유입경로와 10년 반 동안 매달 상위 100개의 검색어 데이터를 분석하고 그에 맞는 기록정보서비스방안을 제시한다. 분석 결과 유입경로는 크게 포털 사이트별 접속, 국가별 접속, 유사기관 별 접속 및 모바일 접속으로 분류할 수 있었다. 이용자들의 검색어를 분석한 결과 이용자들이 10년 반 동안 가장 많이 검색한 검색어는 '토지조사부'였으며, 꾸준한 관심을 갖고 검색한 검색어 또한 '토지조사부'였다. 그 외에 정부 기관에서 생산한 문서 또는 관보에 대한 관심도 높음을 확인하였다. 그리고 이용자들이 가장 많이 검색한 검색어와 꾸준히 등장한 검색어를 파악한 결과, 검색어들을 크게 토지, 일제강점기, 6.25 전쟁과 남북관계, 기록관리 및 이용으로 묶어볼 수 있었다. 분석결과를 토대로 포털 사이트 및 모바일 등을 활용한 국가기록원 웹사이트의 연계성 강화와 검색 서비스의 고도화 방안을 제안하였다. 이 연구는 이렇게 웹로그나 이용자 검색어 등을 분석하면 기록관리기관 이용자들에게 제공하는 서비스를 고도화할 수 있는 의미 있는 결과를 얻을 수 있음을 확인하였다.

다중신호레벨튜닝 기법을 사용한 Mode S 확장스퀴터 수신기의 복조부 설계 및 구현 (The Design and Implementation of Mode S Extended Squitter Demodulator with Multi-signal Level Tuning Method)

  • 신희성;윤준철;서종덕;최상방
    • 한국정보통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.697-707
    • /
    • 2015
  • 본 논문은 CNS/ATM의 감시 기술 중 하나인 ADS-B 1090ES 시스템의 수신기 복조부 설계 및 구현에 대한 연구를 하였다. 연구된 복조부는 국제 기술문서 RTCA DO-260B와 EUROCAE ED-129에서 요구하는 모든 성능을 만족하며, 수신감도, 다이내믹 레인지 등의 성능 향상을 위하여 기존에 다중 진폭 샘플 복조 방식 중 베이스라인 다중 샘플 기술을 적용한 단일신호처리 기법을 제안하였다. 또한, 다중신호레벨튜닝 기법을 제안하여 단일신호처리 기법의 단점을 보완하고 송신출력 편차 및 수신기 하드웨어 제작 공정에 따른 균일하지 못한 수신 감도 레벨 차이에 대한 수신율 저하 문제를 최소화 하였다. 측정 결과 제안된 기법을 적용한 수신기는 다이내믹 레인지 0~-87dBm의 성능과 MTL -90dBm이 측정되었다. 이 결과는 ADS-B 1090ES 지상수신 장비의 국제 기술기준에서 요구하는 기준보다 -3dBm 낮은 우수한 성능을 나타냈으며, 이와 유사한 변조방법을 사용하는 시스템에 널리 응용이 가능할 것으로 사료된다.