• 제목/요약/키워드: 문서구조

검색결과 1,614건 처리시간 0.031초

딥러닝 기반 분류 모델의 성능 분석을 통한 건설 재해사례 텍스트 데이터의 효율적 관리방향 제안 (A Suggestion of the Direction of Construction Disaster Document Management through Text Data Classification Model based on Deep Learning)

  • 김하영;장예은;강현빈;손정욱;이준성
    • 한국건설관리학회논문집
    • /
    • 제22권5호
    • /
    • pp.73-85
    • /
    • 2021
  • 본 연구는 딥러닝 기반의 텍스트 데이터 분류 모델의 성능 고찰을 통해 한국어 건설 재해사례의 효율적 관리방향을 제안한다. 이를 위해 비정형 텍스트 문서인 건설 재해 보고서를 활용해 건설 사고의 대표적 유형인 추락, 감전, 낙하, 붕괴, 협착의 5개 범주로 분류하는 딥러닝 모델을 구현하였다. 초기 모델 테스트 결과, 추락 재해의 분류 정확도가 상대적으로 높게 도출되며 타 유형을 추락 재해로 분류하는 경우가 많이 발생한다는 특징이 나타났다. 원인 분석 결과, 1) 구체적인 사고 유발 행동, 2) 유사한 문장 구조, 3) 여러 유형에 해당되는 복합사고가 위의 특징에 영향을 미치는 것으로 분석되었으며, 이 중 추가 실험을 통해 검증이 가능한 복합사고에 대한 두 가지 정확도 개선 실험을 진행하였다: 1) 재분류, 2) 제외. 실험 결과, 복합사고 제외 시 분류 성능이 185.7% 향상되었으며, 이를 통해 여러 사고 유형에 대한 내용을 동시에 포함하는 복합사고의 다중공선성(multicollinearity)이 해소되었음을 알 수 있다. 결론적으로 본 연구에서는 향후 사고에 대한 상황을 상세히 서술하는 체계를 마련함과 동시에 복합사고를 독립적으로 관리할 필요성을 시사한다.

기업콘텐츠관리시스템의 지속적 이용의도 향상에 대한 연구: 기술수용모델을 중심으로 (A Study on the Improvement of the Intention of Continuous Use of Enterprise Content Management System: Focusing on the Technology Acceptance Model)

  • 황인호
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.229-243
    • /
    • 2021
  • 체계적인 정보 보호 및 관리가 조직의 핵심 가치로 인식되면서, 조직들은 개인 중심의 정보 관리 방식에서 조직 중심의 정보 관리 방식으로의 전환을 추진하고 있다. 기업콘텐츠관리시스템은 내부자의 문서 보안과 정보 공유를 지원하는 시스템으로서, 최근 기술의 발전으로 많은 조직이 도입하고 있다. 본 연구는 사용자 관점에서 기업콘텐츠관리시스템의 지속적 활용을 통한 성과 향상의 방안을 제시하는 것을 목적으로 하며, 기술수용모델의 확장을 통해 지속적 이용의도 향상 방안을 제시한다. 연구는 기업콘텐츠관리시스템을 도입한 기업의 근로자들을 대상으로 설문하였으며, 구조방정식 모델링을 통해 선행연구로부터 도출한 연구가설을 검증하였다. 분석 결과, 기업콘텐츠관리시스템의 지속적 이용의도에 유용성과 이용 용이성이 영향을 미쳤으며, 지식공유 문화 환경과 기업콘텐츠관리시스템 품질 요인 기술수용모델 선행요인에 영향을 미쳤다. 본 연구의 결과는 사용자 관점에서 기업콘텐츠관리시스템 활용성 증대방안을 제시하였다는 측면에서 학술적, 실무적 시사점을 가진다.

검정제에 의해 최초 개발된 초등과학교과서들의 자석 단원에 대한 내외적 체제 비교 (Comparison of Internal and External Frameworks for Units on Magnets in Elementary Science Textbooks First Developed by the Authorization System)

  • 전성수
    • 한국과학교육학회지
    • /
    • 제42권5호
    • /
    • pp.525-542
    • /
    • 2022
  • 이 연구는 초등과학 교과용도서의 발행체제가 국정제에서 검정제로 변환됨에 따라 최초 출현한 초등과학 검정교과서의 내외적 체제를 비교 분석하는데 그 목적이 있다. 다양하고 창의적인 교과서 개발과 교육과정의 다양성을 지원하기 위한 검정제의 취지를 2015개정 과학과 교육과정의 '자석의 이용' 단원을 바탕으로 개발된 7종의 검정교과서와 이전 국정교과서의 체제를 비교하여 확인하고자 하였다. 이 연구에서는 초등과학 교과서 자석 관련 단원을 대상으로 교과서의 체제를 크게 외적 체제와 내적 체제로 구분하고 세부 분류 항목에 따라 양적 분석과 질적 분석을 병행하여 실시하였다. 연구 결과에 따르면, 교과서 단원의 외적 체제에서는 모든 교과서가 단원 도입, 과학 탐구, 창의 융합, 단원 정리, 과학 읽기자료로 구분되는 동일한 구조를 가지고 있었다. 7종의 검정교과서의 '자석의 이용' 단원 체제의 경우에는 교과서 개발진의 교육과정에 대한 해석에 따른 일부의 차이점과 국정교과서에서의 체제를 그대로 유지한 다수의 공통점이 발견되었다. 또한 단원 도입 활동과 과학 읽기 자료와 같은 교육과정 문서에 명시되지 않은 영역에서 각 교과서별 특성이 분명하게 드러났으며, 기존의 국정교과서에서의 탐구활동의 획일적 운영에 대응하여 탐구활동의 수준을 구분하여 제시한 의미 있는 변화도 발견되었다.

마을벽화로 본 지역문화정책 비판적 고찰 (A Critical Study of Local Cultural Policy by Village Mural)

  • 정윤수
    • 지역과문화
    • /
    • 제7권3호
    • /
    • pp.81-108
    • /
    • 2020
  • 본 연구는 마을벽화를 통하여 정부와 지자체의 지역문화정책을 비판적으로 고찰하고자 한다. 1990년대 말부터 그려지기 시작한 마을벽화는 지난 십수 년 동안 전국적인 문화현상이 되어왔다. 특히 정부와 지자체가 시행하는 다양한 지역문화 정책의 중요 요소로 꾸준히 활용되었다. 정부와 지자체는 '주거환경 개선'과 '관광 활성화'라는 두 개의 목적으로 이 사업을 전개하여 왔으나 대체로 '관광 활성화'에 치중되었다. 본 연구는 사례연구 방법의 하나인 현장조사를 통하여 전국의 주요 마을벽화의 구체적인 실태를 파악하였다. 또한 공문서 분석을 통하여 마을벽화 사업에 작동하는 정부와 지자체의 정책적 근거와 행정적 관리 방안을 분석하였다. 현장조사 결과 전국 대부분의 마을벽화는 획일화된 소재, 낮은 수준의 재현, 부실한 사후관리 등의 문제를 갖고 있었다. 이는 부분적으로 마을벽화 사업에 참여한 단체나 예술가의 경험이나 능력에 따른 것이지만 근본적으로는 장기적인 주거환경 개선보다는 단기적인 시각적 관광물에 치중한 정부와 지자체의 사업에 기인한 것이라고 하겠다. 정부와 지자체의 사업은 수직계열화에 의하여 전개되었으며 실제 작업에 있어서 구체적인 주제와 소재, 도안과 색채 등을 요구하는 등의 문제가 있음을 확인하였다. 이로 인하여 마을벽화는 해당 주민을 '대상화'하고 해당 지역을 '낭만화'하였으며 그 결과 획일화된 시각 재현물이 전면화되었다. 이에 본 연구는 행정과 회계는 엄격히 관리하되 실제 작업에서는 각종 문서와 절차의 간소화하여 수직계열화 구조를 완화하고 아울러 대상지에 대한 풍부한 문화적 이해, 다양한 주제의 선택, 독창적인 소재와 표현 등이 필요하다고 제언하고자 한다.

키워드 출현 빈도 분석과 CONCOR 기법을 이용한 ICT 교육 동향 분석 (Analysis of ICT Education Trends using Keyword Occurrence Frequency Analysis and CONCOR Technique)

  • 이영석
    • 산업융합연구
    • /
    • 제21권1호
    • /
    • pp.187-192
    • /
    • 2023
  • 본 연구는 기계학습의 키워드 출현 빈도 분석과 CONCOR(CONvergence of iteration CORrealtion) 기법을 통한 ICT 교육에 대한 흐름을 탐색한다. 2018년부터 현재까지의 등재지 이상의 논문을 'ICT 교육'의 키워드로 구글 스칼라에서 304개 검색하였고, 체계적 문헌 리뷰 절차에 따라 ICT 교육과 관련이 높은 60편의 논문을 선정하면서, 논문의 제목과 요약을 중심으로 키워드를 추출하였다. 단어 빈도 및 지표 데이터는 자연어 처리의 TF-IDF를 통한 빈도 분석, 동시 출현 빈도의 단어를 분석하여 출현 빈도가 높은 49개의 중심어를 추출하였다. 관계의 정도는 단어 간의 연결 구조와 연결 정도 중심성을 분석하여 검증하였고, CONCOR 분석을 통해 유사성을 가진 단어들로 구성된 군집을 도출하였다. 분석 결과 첫째, '교육', '연구', '결과', '활용', '분석'이 주요 키워드로 분석되었다. 둘째, 교육을 키워드로 N-GRAM 네트워크 그래프를 진행한 결과 '교육과정', '활용'이 가장 높은 단어의 관계로 나타났다. 셋째, 교육을 키워드로 군집분석을 한 결과, '교육과정', '프로그래밍', '학생', '향상', '정보'의 5개 군이 형성되었다. 이러한 연구 결과를 바탕으로 ICT 교육 동향의 분석 및 트렌드 파악을 토대로 ICT 교육에 필요한 실질적인 연구를 수행할 수 있을 것이다.

정보통신기술 기반 지식정보관리 프레임워크를 통한 한국 정부 조직 혁신에 관한 탐구: 외교부를 중심으로 (Organizational Innovation in the Korean Government via an ICT-based IKM Framework: A focus on the MOFA)

  • 이진경
    • 정보관리학회지
    • /
    • 제40권2호
    • /
    • pp.211-241
    • /
    • 2023
  • 급속히 발전하고 있는 정보통신기술은 기업과 조직의 운영시스템에도 영향을 미치고 있으며, 다수의 산업 분야에서 혁신적인 정보 및 지식관리 전략을 수립하기 위해 많은 연구가 진행되고 있다. 외교부는 지난 20년간 지식정보관리 관련 시스템의 많은 부분에 디지털 기술을 적용하고 있으나, 그에 맞는 전략을 분석하기 위한 기존 연구는 미흡한 실정이다. 본 연구는 인터뷰 및 외교부 내부 혁신 보고서 분석을 통해 현재 한국 외교부의 지식정보관리의 개념과 제약 사항을 진단하고, 외교부가 조직의 양면성 역량과 수용능력을 강화하여, 조직 혁신을 촉진하는 지식정보 관리체계를 제공하는 방법을 평가하는 목적으로 수행되었다. 외교부의 지식정보관리는 디지털 기술 변화에 적응할 수 있는 동적인 역량을 갖추고 있으나, 본질적인 내부의 한계(기밀 문서 처리구조, 지식정보관리 관련 협업체계 부재)와 외부의 한계(국내 정치 상황, 정부 조직의 위계질서)에 직면하고 있다. 이러한 내부적 한계와 외부적 요인으로 인한 영향을 최소화하는 방안을 마련하는 조직의 양면성 역량과 수용능력 증진을 통해 외교부가 조직 혁신을 위한 지식정보관리 체계를 개발해야 하는 것으로 관찰된다. 이를 위해 실질적으로 활용 가능한 IKM 시스템 개발을 위한 이후의 세부 연구에는 변화하는 환경에 대비한 직군 간 대화와 직원 역량 강화 방안이 포함되어야 할 것이다.

프라이버시 보호를 위한 오프사이트 튜닝 기반 언어모델 미세 조정 방법론 (Privacy-Preserving Language Model Fine-Tuning Using Offsite Tuning)

  • 정진명;김남규
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.165-184
    • /
    • 2023
  • 최근 구글의 BERT, OpenAI의 GPT 등, 언어모델(Language Model)을 사용한 비정형 텍스트 데이터에 대한 딥러닝(Deep Learning) 분석이 다양한 응용에서 괄목할 성과를 나타내고 있다. 대부분의 언어모델은 사전학습 데이터로부터 범용적인 언어정보를 학습하고, 이후 미세 조정(Fine-Tuning) 과정을 통해 다운스트림 태스크(Downstream Task)에 맞추어 갱신되는 방식으로 사용되고 있다. 하지만 최근 이러한 언어모델을 사용하는 과정에서 프라이버시가 침해될 수 있다는 우려가 제기되고 있다. 즉 데이터 소유자가 언어모델의 미세 조정을 수행하기 위해 다량의 데이터를 모델 소유자에게 제공하는 과정에서 데이터의 프라이버시가 침해될 수 있으며, 반대로 모델 소유자가 모델 전체를 데이터 소유자에게 공개하면 모델의 구조 및 가중치가 공개되어 모델의 프라이버시가 침해될 수 있다는 것이다. 이러한 상황에서 프라이버시를 보호하며 언어모델의 미세 조정을 수행하기 위해 최근 오프사이트 튜닝(Offsite Tuning)의 개념이 제안되었으나, 해당 연구는 제안 방법론을 텍스트 분류 모델에 적용하는 구체적인 방안을 제시하지 못했다는 한계를 갖는다. 이에 본 연구에서는 한글 문서에 대한 다중 분류 미세 조정 수행 시, 모델과 데이터의 프라이버시를 보호하기 위해 분류기를 추가한 오프사이트 튜닝을 적용하는 구체적인 방법을 제시한다. 제안 방법론의 성능을 평가하기 위해 AIHub에서 제공하는 ICT, 전기, 전자, 기계, 그리고 의학 총 5개의 대분야로 구성된 약 20만건의 한글 데이터에 대해 실험을 수행한 결과, 제안하는 플러그인 모델이 제로 샷 모델 및 오프사이트 모델에 비해 분류 정확도 측면에서 우수한 성능을 나타냄을 확인하였다.

한국과 미국의 가정과 교육과정과 성취기준 비교 분석 연구 (A Comparative Analysis of South Korean and the U.S. Home Economics Curricula and Achievement Standards)

  • 권유진;김은정;이윤정
    • 한국가정과교육학회지
    • /
    • 제25권4호
    • /
    • pp.29-46
    • /
    • 2013
  • 2009년 개정 교육과정에 따른 교과 교육과정은 국가 문서로는 처음으로 교과별 핵심 역량과 성취기준을 포함시켰는데, 핵심역량과 성취기준의 도입의 목적은 교과의 특성과 성격을 반영하고 수업평가의 효율성을 제고하기 위해서였다. 특히 성취기준의 경우 교사와 학생들에게 내용과 더불어 가장 직접적인 평가와 연관되어 있다는 이유로 교육과정 개발 이후 관심의 대상이 되어왔다. 본 연구의 목적은 미국의 성취기준과의 국제 비교를 통해 교과가 학생들에게 길러주고 싶어 하는 역량과의 위계성이라는 구조적 측면과 세부적 내용 부분에 대한 시사점을 도출하여 향후 교육과정 및 성취기준 방향을 설정하는 데 기여하고자 하였다. 내용적 측면의 성취기준을 상세히 비교하기 위해 '가족' 내용을 중심으로 비교 분석하였다. 본 연구를 통해 분석된 결과로는 구조적 측면에서 한국의 성취기준 체계는 핵심역량이 목표 진술에 포함되어 있으며, 하위체계로서 학년군별, 영역별, 그리고 내용별 성취기준으로 구성되어 있는 것에 비해, 미국의 성취기준은 통합기준, 내용기준, 그리고 가장 하위 체계로서 역량을 제시하고 있음을 알 수 있었다. 이는 역량을 무엇으로 정의하느냐에 대한 관점의 차이에서 기인한 것으로 볼 수 있다. 내용적 측면에서 분석될 결과에 의하면, 한국의 성취기준에는 '일 가정 양립'이라는 개념을 강조하고 있는데 반해 미국의 성취기준은 개인의 다양한 역할로서 가정의 일에 대한 접근을 하고 있음을 알 수 있었다. 또한 가정생활을 통해 가족이 추구하는 가치를 표현하는 용어로써, 한국의 성취기준은 '행복, 복지'라는 용어를 사용하고 있으나, 미국의 성취기준에서는 'well-being'이라는 용어를 사용하고 있었다. 이러한 용어의 사용이나 관점들에서도 문화적 인식의 차이가 있음을 알 수 있었다.

  • PDF

한국 기록관리행정의 변천과 전망 (Records Management and Archives in Korea : Its Development and Prospects)

  • 남효채
    • 한국기록관리학회지
    • /
    • 제1권1호
    • /
    • pp.19-35
    • /
    • 2001
  • 조선왕조의 기록관리 전통의 맥이 끊어진지 거의 한세기가 지난 1999년도에 한국은 "공공기관의 기록물관리에 관한 법률"을 제정 시행함으로써 기록관리의 새로운 시대를 맞이했다. 조선왕조실록에는 국사 전반에 걸쳐 오백년 간의 중요한 역사적 사실들이 기록되었다. 이것은 인류역사상 주요한 업적이며 전세계적으로 귀한 사례이다. 이것이 가능했던 것은 실록이 누대(累代)의 사관들이 저술하고 편찬한 일차자료인 기록물을 수집, 선정한 것이기 때문이다. 근대적 기록보존소에서는 중요한 공공기록물이 원형대로 보존될 필요가 있기 때문에 기록보존을 위해 중요한 국가 기록물을 평가 선별하는 근대적 기록보존제도를 확립해야 했다. 그러나 일제에 의한 식민지화로 그 기회를 빼앗겼고 우리의 훌륭한 기록보전 전통은 계승되지 못했다. 중앙화된 기록보존제도는 1969년 총무처에 정부기록보존소를 설립함으로써 발전하기 시작했다. 정부기록보존소는 조선왕조의 사고 전통을 계승해서 1984년 부산에 현대적 사고시설을 건축했다. 1998년 정부기록보존소는 대전정부종합청사로 본부를 이전하고 첨단 시청각기록물 서고를 갖추었다. 1996년부터 정부기록보존소는 마이크로필름 보존을 보완하고 수작업 등록시스템을 개선하기 위하여 기록물 관리시스템 전산화를 도입했다. 소장 기록물의 디지털화는 이용자에게 디지털 이미지를 제공하기 위한 주요한 사업이었다. 이를 위해 정부기록보존소는 새로 컴퓨터/서버 시스템을 구입하고 응용 소프트웨어를 개발했다. 이와 병행하여 정부기록보존소는 역사학 및 문헌정보학 배경을 가진 아키비스트들을 증원하여 고도의 전문화를 이루는 방향으로 인력구조를 크게 혁신하였다. 보존연구직과 전산직 역시 채용되었다. 새로운 기록물관리법은 2000년 1월 1일부터 시행되고 있다. 이 법은 한국의 기록물관리에 있어 다음과 같은 변화를 가져왔다. 첫째, 이 법은 입법 사법 행정부, 헌법기관, 육해공군, 국가정보원 등 모든 공공기관의 기록물을 규정한다. 범국가적으로 통일된 기록물관리체계가 갖추어지게 되었다. 둘째, 각 기관의 수준별로 공공기록물 관리 기관을 두게 되었다. 중앙기록물관리기관, 국회 및 사법부에 특수기록물관리기관, 대도시 및 도에 지방기록물 관리기관, 공공기관에 자료관 또는 특수자료관, 각 과단위에서는 기록물관리책임자가 기록관리를 책임지게 되었다. 셋째, 공공기관의 기록물은 생산시에 컴퓨터에 등록된다. 따라서 인터넷이나 컴퓨터망을 통해 기록물을 쉽게 추적, 검색할 수 있게 될 것이다. 넷째, 기록관리학 분야에서 전문적 훈련을 받은 기록물관리 전문요원 배치를 의무화함으로써 기록물의 전문적 관리를 보장하게 된다. 다섯째, 공공기록물의 불법적 처리는 처벌을 받을 수 있는 범죄를 구성한다. 앞으로 공공기록물관리는 한국정부의 '전자정부 추진정책'과 함께 발전할 것이다. 다음과 같은 변화가 예상된다. 첫째 공공기관에서는 전자결재 문서 외에 종이문서, 시청각기록물, 간행물 등도 모두 디지털화하여 행정의 효율화 및 생산성을 제고할게 될 것이다. 둘째, 국회는 이미 특수기록관을 설립하였다. 법원과 국가정보원도 뒤를 따를 것이다. 시도 차원에서 더 많은 기록관들이 설립될 것이다. 셋째, 우리 사회가 지식정보사회화 될수록 기록관리기능은 더욱 중요한 국가기능이 될 것이다. 더 많은 대학교, 학회, 시민단체들이 기록보존에 고한 인식제고에 참여하고, 기록보존운동이 범국민적 차원으로 심화될수록 한국의 기록물관리는 현재보다 눈에 띄게 발전할 것이다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.