• 제목/요약/키워드: 디지털텍스트

검색결과 490건 처리시간 0.036초

웹 이용자를 위한 통계 메타데이터: 통계정보 제공사이트의 메타데이터 제공 수준 평가 사례 연구 (Statistical Metadata for Users: A Case Study on the Level of Metadata Provision on Statistical Agency Websites)

  • 오정선
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.161-179
    • /
    • 2007
  • 디지털 도서관을 통해 제공되는 정보 자원의 형태와 종류가 다양화됨에 따라 자료의 유형별로 적정 수준의 메타데이터를 정의하고 제공하는 것이 또 다른 과제로 대두되고 있다. 일반 텍스트 자료와 달리 수치로 표현된 데이터에 대한 해석을 필요로 하는 통계 자료의 특성상, 통계 도메인에서 메타데이터는 통계 자료의 검색뿐 아니라 검색된 자료의 정확한 이해와 활용을 위한 필수적인 도구로 인식되고 있다. 하지만 기존의 통계 메타데이터 연구는 통계 작성 기관이나 분석 기관의 전문적인 요구에 중점을 두고 있어, 인터넷을 통해 통계 자료에 접근하는 일반 이용자들의 관점에서의 논의는 상대적으로 부족한 실정이다. 일반 이용자를 위한 통계 메타데이터에 대한 논의의 단초로서, 본 연구는 미국의 연방 통계 기관인 the Bureau of Labor Statistics (BLS, http://www.bls.gov/) 및 the Energy Information Administration (EIA, http://eia.doe.gov/)의 웹사이트에 대한 내용 분석을 통해, 현재 인터넷을 통해 통계 자료에 접근하는 이용자들에게 제공되고 있는 메타데이터의 현황을 평가하였다. 본 사례 연구의 결과는 이들 웹사이트를 통해 제공되는 방대한 양의 자료에도 불구하고 메타데이터의 제공 수준은 국제 기구에 의해 정의된 최소 수준에 미치지 못함을 나타내고 있어, 이용자 중심의 메타데이터 설계의 필요성을 재확인 하고 있다.

내용기반의 인쇄체 영문 문서 영상 검색을 위한 특징 기반 단어 검색 (A Feature -Based Word Spotting for Content-Based Retrieval of Machine-Printed English Document Images)

  • 정규식;권희웅
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1204-1218
    • /
    • 1999
  • 문서영상 검색을 위한 디지털도서관의 대부분은 논문제목과/또는 논문요약으로부터 만들어진 색인에 근거한 제한적인 검색기능을 제공하고 있다. 본 논문에서는 영문 문서영상전체에 대한 검색을 위한 단어 영상 형태 특징기반의 단어검색시스템을 제안한다. 본 논문에서는 검색의 효율성과 정확도를 높이기 위해 1) 기존의 단어검색시스템에서 사용된 특징들을 조합하여 사용하며, 2) 특징의 개수 및 위치뿐만 아니라 특징들의 순서를 포함하여 매칭하는 방법을 사용하며, 3) 특징비교에 의해 검색결과를 얻은 후에 여과목적으로 문자인식을 부분적으로 적용하는 2단계의 검색방법을 사용한다. 제안된 시스템의 동작은 다음과 같다. 문서 영상이 주어지면, 문서 영상 구조가 분석되고 단어 영역들의 조합으로 분할된다. 단어 영상의 특징들이 추출되어 저장된다. 사용자의 텍스트 질의가 주어지면 이에 대응되는 단어 영상이 만들어지며 이로부터 영상특징이 추출된다. 이 참조 특징과 저장된 특징들과 비교하여 유사한 단어를 검색하게 된다. 제안된 시스템은 IBM-PC를 이용한 웹 환경에서 구축되었으며, 영문 문서영상을 이용하여 실험이 수행되었다. 실험결과는 본 논문에서 제안하는 방법들의 유효성을 보여주고 있다. Abstract Most existing digital libraries for document image retrieval provide a limited retrieval service due to their indexing from document titles and/or the content of document abstracts. This paper proposes a word spotting system for full English document image retrieval based on word image shape features. In order to improve not only the efficiency but also the precision of a retrieval system, we develop the system by 1) using a combination of the holistic features which have been used in the existing word spotting systems, 2) performing image matching by comparing the order of features in a word in addition to the number of features and their positions, and 3) adopting 2 stage retrieval strategies by obtaining retrieval results by image feature matching and applying OCR(Optical Charater Recognition) partly to the results for filtering purpose. The proposed system operates as follows: given a document image, its structure is analyzed and is segmented into a set of word regions. Then, word shape features are extracted and stored. Given a user's query with text, features are extracted after its corresponding word image is generated. This reference model is compared with the stored features to find out similar words. The proposed system is implemented with IBM-PC in a web environment and its experiments are performed with English document images. Experimental results show the effectiveness of the proposed methods.

디지털도서관 구축과정에서 TREC 텍스트 문서의 시각적 표현에 관한 연구 (A Study on the Visual Representation of TREC Text Documents in the Construction of Digital Library)

  • 정기태;박일종
    • 정보관리학회지
    • /
    • 제21권3호
    • /
    • pp.1-14
    • /
    • 2004
  • 이용자들은 유사문서를 검색할 때, 각 가지 문서의 시각적표현을 통하여 도움을 얻게 되며, 모든 정보검색에 관한 연구는 이용자들의 다양한 요구를 충족시키기 위한 여러 가지의 해결책을 제시하고 있다. 제안되어진 해결책은 알파벳 순서로 만들어 진 파피루스 문서로부터 카드목록, 마이크로 필름을 이용한 저장, 컴퓨터 디스크를 이용한 파일 보관 등에 이르기까지 다양한 방법들을 들 수 있을 것이다. 또한 대부분의 정보검색 시스템들은 Document SUITogate( 문헌을 대체할 수 있는 것들 ), 즉 요약문, 목차, 초록, 리뷰한 내용, 기계가독형목록 (MARC) 기록물 등과 같은 서지자료들을 전체논문을 대체하여 이용하게 된다. 본 논문에서는 또 다른 형태의 Document Surrogate 로서 용어 리스트의 집단화 방법을 이용해서 찾아보았다. 이 Document Surrogate 들은 Multidimensional Scaling (MDS) 을 이용해서 2 차원 그래프 위에 좌표로써 표현되어지고 있다. 사용된 2차원의 그래프 위에서 좌표간의 거리는 문헌들의 유사성을 나타낸다고 해석할 수 있으며 거리가 가까우면 가까울수록 두 문서는 더욱 유사한내용을 포함하고 있다고 해석할 수 있는 것으로 밝혀졌다.

웹툰으로 상상하기: 중학교 웹툰 중심의 융합교육 프로젝트 (Imagining through webtoon: Webtoon-focused convergence education project in middle school)

  • 박유신;임세희;정현선
    • 만화애니메이션 연구
    • /
    • 통권45호
    • /
    • pp.451-477
    • /
    • 2016
  • 21세기의 학교교육담론에서 융합적인 교육과정과 미디어 리터러시는 교육개혁의 중심에 자리잡고 있다. 미디어의 변화에 따른 지식의 형성 및 전달 방식의 변화가 지식의 구조를 변화시키고 있으며, 이는 전통적인 교과중심의 교육을 점차 융합 교육의 형태로 변화시키고 있다. 특히 디지털 미디어에 기반한 콘텐츠를 중심으로 한 초학문적 교육과정들이 학교교육의 현장에서 자생적으로 확산되는 현상은 주목할 만한 점이라고 할 수 있다. 이 연구는 중학교 교사가 진행한 일련의 융합교육 프로젝트에 대한 사례를 연구 대상으로 하여, 웹툰을 중심으로 한 융합교육 프로젝트가 창의적 체험 활동(동아리)을 중심으로 한 교과 교육과정의 융합, 학교와 학교 밖 공간을 넘나드는 학습 공간의 융합, 대중문화, 예술, 현실의 경계를 가로지르는 상상적 세계의 융합을 (어떻게) 이루어 내는지 그 과정을 탐색하였으며, 연구자들은 학교 방문을 통한 주요 행사의 참여 관찰, 교사 인터뷰, 수업 자료 분석 등을 실시한 결과를 바탕으로 수업 사례를 내러티브 형식으로 제시하였다. 연구 결과, 수업 주제(텍스트)로서의 웹툰은 자연스럽게 초학문적 교육과정을 이끌어내며, 학교 안과 학교 밖의 공간을 넘나드는 학생 참여 중심의 학습 공간을 형성하였고, 학생의 삶과 문화예술을 연결하는 교육을 만들어내었음을 알 수 있었다. 학생 독자의 목소리를 매개하고 중재하여 교육과정으로 구성하는 교사(의) 역할의 중요성을 재발견한 것 또한 본 연구의 중요한 결과이다.

오픈소스를 이용한 부산항 사진 아카이브의 구축 방안 (Digital Image Archiving Methodology on the Port of Busan: A Case Study Using an Open-Source Archiving Software)

  • 송정숙;허정숙;이예린
    • 한국기록관리학회지
    • /
    • 제14권3호
    • /
    • pp.127-151
    • /
    • 2014
  • 이 연구에서는 '항구도시 부산'이라는 이미지를 형성하는 데 큰 역할을 한 부산항은 부산의 대표적인 로컬리티 공간이므로 부산항과 인근지역의 경관에 관한 사진, 엽서 등 이미지 기록을 중심으로 <부산항 사진 아카이브>를 구축하는 과정과 방법을 구체적으로 기술함으로써 로컬리티의 재현방법론을 확산하고 공유하고자 한다. 사진, 엽서 등 이미지 기록, 즉 사진기록의 특성을 문자 위주의 텍스트 기록과 비교하여 그 특성을 살펴보고, 이미지 기록의 대중 친화적인 특성에 주목하여 부산항에 관한 사진, 엽서 등의 이미지 기록을 수집하여 오픈소스 기록관리 소프트웨어 가운데 사진의 전시에 적합한 오메카(Omeka)를 이용하여 사진 아카이브를 실험적으로 구축해 보았다. 그 과정과 방법을 보면, 먼저 아카이브 구축 목적에 따른 개발 원칙을 세우고, 기록 수집을 위한 기초조사를 실시하였다. 부산항 관련 기록 소장기관과 개인소장가 등의 저작권 동의를 얻어서 원본 또는 파일을 수집하였다. 이후 수집한 기록은 더블린코어에 따라 기술하였으며, 시기에 따른 컬렉션을 구성하고 기록을 정리하였다. 부산항의 공간적 성격을 교통공간, 역사공간, 산업공간, 생활공간으로 구분하고, 11개 전시주제를 구상하였다. 전시의 보기로 교통공간의 부관연락선을 제시하였다.

키워드 네트워크의 클릭 분석을 이용한 특허 데이터 분석 (Patent data analysis using clique analysis in a keyword network)

  • 김현;김동건;조진남
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1273-1284
    • /
    • 2016
  • 본 연구에서는 기계 학습 분야의 특허를 수집하여 키워드 네트워크를 구축하고 클릭 분석을 실시하였다. 먼저 텍스트 마이닝 기법을 적용하여 핵심 키워드들을 선정한 다음, 이 키워드를 기반으로 키워드 네트워크를 구축하였다. 다음으로 네트워크 구조 분석, 중요 키워드 분석 및 클릭 분석을 시행하여 2005년도와 2015년도에 출원된 기계 학습 특허의 동향을 파악하였을 뿐만 아니라 양해년도의 분석 결과를 통해 특허 경향을 파악하였다. 분석 결과 기계 학습 특허의 키워드 네트워크는 밀도와 군집 계수가 낮은 것으로 드러났으며 기계 학습 기법 자체에 대한 특허보다는 다양한 응용 영역에서 기계학습을 적용한 특허들이 다수이기 때문으로 판단된다. 클릭 분석 결과 2005년도 클릭 분석에 의해 발견된 주제는 뉴스메이커 검증, 상품 소비 예측, 바이러스 공격 예방, 바이오마커, 그리고 워크플로우 관리였으며, 2015년도 기계 학습 특허 주제는 디지털 이미지 편집, 직불카드, 수신자 인라이닝 시스템, 유방 촬영 시스템, 재고 관리 시스템, 이미지 편집 시스템, 비행기 티켓 가격 예측, 그리고 문제 예측 시스템으로 나타났다. 2005년도에 비하여 2015년도의 근접 중앙성은 낮아지고 매개 중심성은 높아진 것으로 보아 최근의 특허 경향은 보다 다양한 분야에서 출원되고 있으며 이들 간의 연결이 활발해지고 있음을 알 수 있다. 클릭 분석은 클릭을 형성하는 키워드 집합을 해석하여 주제를 파악하는데 활용될 수 있을 뿐만 아니라 추출된 공유 멤버쉽 키워드 집합은 특허 검색 시스템과 같이 키워드 검색 기반의 시스템에서 검색 키워드로 활용될 수 있을 것으로 기대된다.

미디어 아카이브 구축을 위한 등장인물, 사물 메타데이터 생성 시스템 구현 (Implementation of Character and Object Metadata Generation System for Media Archive Construction)

  • 조성만;이승주;이재현;박구만
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.1076-1084
    • /
    • 2019
  • 본 논문에서는 딥러닝을 적용하여 미디어 내의 등장인물 및 사물을 인식, 메타데이터를 추출하고 이를 통해 아카이브를 구축하는 시스템을 개발하였다. 방송 분야에서 비디오, 오디오, 이미지, 텍스트 등의 멀티미디어 자료들을 디지털 컨텐츠로 전환하기 시작한지는 오래 되었지만, 아직 구축해야 할 자료들은 방대하게 남아있다. 따라서 딥러닝 기반의 메타데이터 생성 시스템을 구현하여 미디어 아카이브 구축에 소모되는 시간과 비용을 절약 할 수 있도록 하였다. 전체 시스템은 학습용 데이터 생성 모듈, 사물 인식 모듈, 등장인물 인식 모듈, API 서버의 네 가지 요소로 구성되어 있다. 미디어 내에서 등장인물 및 사물을 인식하여 메타데이터로 추출할 수 있도록 딥러닝 기술로 사물 인식 모듈, 얼굴 인식 모듈을 구현하였다. 딥러닝 신경망을 학습시키기 위한 데이터를 구축하기 용이하도록 학습용 데이터 생성 모듈을 별도로 설계하였으며 얼굴 인식, 사물 인식의 기능은 API 서버 형태로 구성하였다. 1500명의 인물, 80종의 사물 데이터를 사용하여 신경망을 학습시켰으며 등장인물 테스트 데이터에서 98%, 사물 데이터에서 42%의 정확도를 확인하였다.

교도소 컨텍스트속에서 서비스 디자인 방법을 통한 지속가능 서비스 혁신에 관한 연구 - "Yu Fu Bao" 금융 서비스를 중심으로 (A service design approach to sustainable service innovation in prison contexts - Taking the Service Design of "Yu Fu Bao" as an Example)

  • 진섭;반영환
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.131-144
    • /
    • 2021
  • 중국은 최근 몇 년 사이 디지털기술을 활용하여 정부의 통치체계와 통치능력을 현대화하겠다는 결정을 내렸다. 스마트 감옥은 국가의 형벌 기관으로서 기술개혁은 스마트 감옥의 지속가능한 발전을 위한 관건이다. 기술에 의존한다고 해서 반드시 더 나은 서비스 경험을 가져다 줄 수는 없다. 서비스 디자인적 사고는 기술과 사회의 지속가능한 발전을 위하여 조율 역할을 하면서 스마트 감옥 건설의 기술융합에 새로운 서비스 디자인 사고를 적용하고 교도소 콘텍스트속의 서비스의 디자인 수요에 대응해야 한다. 그리하여 본문은 스마트 감옥의 12개 서브시스템 중 옥부보 금융서비스 시스템 개발을 중심으로 스마트 감옥의 지속가능한 서비스 구현을 위한 서비스 디자인 방법의 특징과 부족함을 탐구하고 이에 따라 감옥의 특수한 상황적 요구에 부합하는 경험에 기초하여 시너지를 유도하는 설계이념(EBLCD)을 제시했다. 이를 바탕으로 장래 스마트 감옥의 혁신 문화, 창의력 및 혁신 방법에 대한 심도 있는 연구를 통해 궁극적으로 스마트 감옥 건설의 프레임을 마련했다.

EBS 캐릭터 '펭수'의 놀이세계 구조 (The Play World Structure of EBS Character "Pengsu")

  • 김정섭
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권3호
    • /
    • pp.267-275
    • /
    • 2020
  • 평범하게 보이는 놀이에도 심장한 의미가 있을 수 있다. 유진 핑크(Fink, 1960)는 이런 가정을 전제로 놀이의 외피인 오락성을 넘어 놀이의 속살인 참된 의미를 발견하기 위해 '놀이세계'의 근원적 구조를 통찰해 놀이를 재미(delight), 의미(meaning), 공동체(community), 규칙(rules), 도구(equipment)라는 5개 요소로 해부하는 연구모형을 확립했다. 본 연구에서는 이 분석모델을 적용하여 2019년 스타로 떠오른 공영 방송 EBS의 신생 캐릭터 '펭수'의 놀이 구조를 출연 영상물, 퍼포먼스, 기사 등 모든 텍스트를 연구대상으로 선정해 내용분석을 하였다. 분석결과 펭수의 놀이세계는 놀이 원형의 5가지 요소를 짜임새 있게 갖춰 놀이로서의 체계성과 완결성이 두드러졌다. 수용자들을 놀이의 장으로 잘 흡인하여 성공한 캐릭터가 된 것이다. 구성요소 중 재미는 우스꽝스런 외양과 돌발성·파격성이 돋보는 행동, 의미는 권위주의 타파와 자존감·활력의 제고, 공동체는 오프·온 라인과 아날로그·디지털을 넘나드는 멀티 플랫폼 이용자들, 규칙은 펭수의 콘셉트를 자아를 지닌 어린 이방인으로 설정해 신분 비공개하기, 도구는 펭수 캐릭터 그 자체와 그가 시시각각 선보인 언술(言術)로 각각 나타났다. 펭수는 '자아인형'으로서 그간 이런 놀이요소를 정교하게 결합시킨 다소 과장되고 자극적인 퍼포먼스를 통해 불확실성과 불안감으로 인해 어려움을 겪고 있는 청년층 등 모든 사회 구성원들에게 격려와 위로, 조언과 안내, 배려와 용서, 성찰과 해탈이란 긍정적인 의미를 적잖이 전파하는 사회적 순기능을 한 것으로 분석되었다.

6G의 기술경쟁력 및 네트워크 분석: GaN 집적회로 특허 데이터 중심 (6G Technology Competitiveness and Network Analysis: Focusing on GaN Integrated Circuit Patent Data)

  • 최우석;김진용;이정환;최상현
    • 산업융합연구
    • /
    • 제21권3호
    • /
    • pp.1-15
    • /
    • 2023
  • 무선통신 기술은 통신서비스 자체에만 활용되는 단계를 넘어 21세기 디지털 전환이라는 패러다임과 맞물려 다양한 산업의 혁신을 촉진하는 기반 기술로써 기대가 높아지고 있다. 본 연구에서는 우리나라와 주요 선도국가의 6G 기술경쟁력을 비교하기 위해 GaN(갈륨나이트라이드) 특허 정보를 기반으로 시장확보 지수(PFS), 피인용도 지수(CPP) 그리고 네트워크 분석을 통해 6G 기술경쟁력을 분석하였다. 우리나라의 6G 기술경쟁력은 PFS가 0.62로, CPP가 3.93으로 나타났으며, 각각 선도국가 대비 32.8%, 19.9% 수준인 것으로 확인되었다. 그다음 네트워크 분석 결과, 6G 분야의 특허 협업 비율은 7.2%로 대부분 국가에서 모두 협업 생태계가 미흡한 것으로 분석되었다. 다만, 우리나라는 선도국가와 달리 산업계와 학계가 연계한 소규모 협업 관계가 구축되어 있음을 확인할 수 있었다. 따라서, 소규모 협업 생태계를 기반으로 통신 기술 고도화를 할 수 있는 국가 차원의 6G 통합 R&D 전략을 마련할 필요가 있겠다.