• 제목/요약/키워드: visual-audio

검색결과 424건 처리시간 0.02초

국내 지자체 사진 기록물의 효율적 관리를 위한 메타데이터 설계 및 기계학습 기반 자동 인덱싱 방법 연구 (Metadata Design and Machine Learning-Based Automatic Indexing for Efficient Data Management of Image Archives of Local Governments in South Korea)

  • 김인아;강영선;이규철
    • 한국기록관리학회지
    • /
    • 제20권2호
    • /
    • pp.67-83
    • /
    • 2020
  • 국내의 많은 지방자치단체에서는 지역에서 발생하는 사건들에 대한 시청각 기록물을 사람들이 쉽게 열람할 수 있도록 온라인 서비스를 제공하고 있다. 그러나 지자체들의 현재 사진 기록물 관리 방식은 표준적인 메타데이터가 부재하고 사진의 정보를 활용하지 않기 때문에 지자체 간 호환성과 검색 편의성이 낮은 문제점을 가진다. 이와 같은 문제점을 개선하기 위해, 본 논문에서는 국내 지자체 사진 기록물의 효율적 관리를 위한 메타데이터 설계와 기계학습 기반 자동 인덱싱 기술을 제안한다. 먼저, 본 논문에서는 국내 지자체 사진 기록물에 특화된 메타데이터를 설계하여 지자체 간 사진 기록물의 호환성을 높이고, 사진의 기본 정보와 특성을 나타낼 수 있는 요소들을 메타데이터 항목에 포함함으로써 사진 기록물의 효율적인 관리를 가능하게 한다. 또한, 기계학습 기술을 기반으로 사진의 사건과 카테고리를 반영하는 정보인 사진 속 텍스트와 객체를 자동 인덱싱하여, 사진 기록물 검색 시 사용자 검색의 편의성을 높인다. 마지막으로, 본 논문에서는 제안한 방법을 사용하여 국내 지자체 사진 기록물에서 텍스트와 객체를 자동으로 추출하고, 추출한 내용과 기본 정보를 본 논문에서 설계한 사진 기록물 메타데이터 항목에 저장하는 프로그램을 개발하였다.

PRECEDE 모형을 이용한 일부 초등학교 안전교육의 진단적 연구 (A Diagnostic Study of safety education in elementary schools based on PRECEDE Model)

  • 백경원;이명선
    • 보건교육건강증진학회지
    • /
    • 제18권1호
    • /
    • pp.35-47
    • /
    • 2001
  • As the complexity of the our environment is further complicated by advancements in industry and increase in vehicle traffic flow, the incidents of injury causing accidents are on the rise. Consequently, there is increasing emphasis on the importance of systematic and continual safety education for injury preventive behaviors. This study investigates safety related problems of elementary school students based on the PRECEDE model, proposed by Green et al.(1980 Green), to comprehensively identify the requirements of school safety education. The identified requirements were used to diagnose the current state of elementary school safety education through the analysis of multidimensional factors. A questionnaire survey was conducted on 594 sixth grade students from randomly selected 4 schools in Seoul to examine their injury preventive behaviors and to determine the educational diagnosis variables that affect it. The duration of the survey was 3 weeks starting from April 12, 1999 to May 8, 1999. A summary of the survey results are presented below; 1. Situations in which accidents have occurred were, in their order of frequency, ‘during play or sports activities within the school grounds’ was most frequent at 59.6%, ‘during play on local streets’ at 49.5%, and ‘traffic accidents’ at 41.6%. 2. Categorization of the injury preventive behavior showed that ‘not playing at high traffic flow locations such as streets and construction sites’ had the higher level of observance, while ‘wearing of helmets and joint protection devices during playing’ was least observed. 3. Considering injury preventive behaviors in relation to educational diagnosis variables indicated, for predisposing factors, lower ‘perception to injury accidents’ (p〈0.001) combined with higher ‘concerns for injury accidents’(p〈0.001), ‘practice of preventive behavior’(p〈0.001), and ‘the level of safety knowledge’(p〈0.001) resulted in significantly higher observance of injury preventive behaviors. For enabling factors, higher ‘perceived level of the school safety education’ (p〈0.001) and ‘availability of safety education resources’(p〈0.01) indicated significantly higher observance of injury preventive behaviors. For the reinforcing factor, frequent exposure to ‘safety education brochure’ (p〈0.01) and ‘audio-visual material for safety education’(p〈0.01) combined with more ‘regional safety education’ (p〈0.01), ‘home safety education’ (p〈0.01), ‘school safety education’(p〈0.001), and, ‘parents’ observance of preventive behaviors' (p〈0.001) showed significantly higher observance of injury preventive behaviors. 4. An analysis of the factors that affect injury preventive behaviors showed that the enabling factor ‘awareness of school safety education’ had the highest correlation with injury preventive behaviors followed by factors, in their order of significance, ‘practice of preventive behavior’, ‘perception to injury accidents’, ‘level of safety knowledge’, ‘parents’ observances of preventive behaviors', and ‘concerns for injury accidents.’

  • PDF

멀티미디어 네트워킹을 위한 압축 신호상에서 동영상 처리 : 압축 동영상 비트율 변환 (Manipulation of the Compressed Video for Multimedia Networking : A Bit rate Shaping of the Compressed Video)

  • 황대환;조규섭;황수용
    • 한국통신학회논문지
    • /
    • 제26권11A호
    • /
    • pp.1908-1924
    • /
    • 2001
  • 유무선 통신망, 지상파, 위성 등을 포함한 다양한 이종 네트워크 환경하에서의 멀티미디어 서비스는 급속한 인터넷 보급과 병행하여, 이전과는 전혀 다른 새로운 통합 멀티미디어 네트워킹 인프라를 요구하고 있다. 네트워크와 멀티미디어 유형에 관계 없이 사용자에게 이음새 없는 투명한 멀티미디어 통신서비스를 제공하자는 기술적 요구는 국내외에서 GII를 축으로 연구가 진행되고 있으나, 아직 뚜렷한 형상이 완성되지 않은 실정이다. 이 GII의 배경에는 이종 네트워크, 이종 미디어 그리고 다양한 이종 프로토콜이 포함되는 응용 서비스가 상호 투명하게 연결되어야 하는 복잡한 기술적 측면이 있으며, 멀티미디어의 네트워킹은 가장 핵심적인 연구항목이 되고 있다. 본 논문에서는 통신 대역폭의 QoS를 보장할 수 없는 인터넷 그리고 유무선을 통한 디지털 TV 방송에 직접 적용할 수 있는 압축 통영상 비트율 변환 알고리즘을 제안한다. 통영상 비트율 변환은 상기의 네트워크 환경하에서 동영상 스트리밍 서비스를 위해 필요한 기술이다. 기존의 비트율 변환은 해당되는 압축 통영상 디코더와 인코더를 쌍으로 연결하여, 선형 PCM 신호로 변환하고, 목적하는 비트율로 맞추어 주는 방법이 일반적이나, 그 구현의 복잡성, 수반되는 처리지연 등으로 실시간 멀티미디어 네트워킹에 단점을 갖고 있다. 본 논문에서 제안한 알고리즘은 화질과 구현의 복잡도를 고려하여 비트율 변환을 압축영역에서 행하며, 특히 실시간 처리에 주안점을 두었다. 제안한 알고리즘은 IS0/1EC의 MPEG-2 동영상을 대상으로 소프트웨어로 구현하였으며, 화소영역의 처리방법을 포함하는 기존의 비트율 변환방법에 비해 구현의 복잡도, 처리시간에 장점을 갖는다.

  • PDF

독서장애인용 모바일 전자책뷰어 인터페이스 설계 (A Design of Mobile e-Book Viewer interface for the Reading Disabled People)

  • 이경희;김태은;이종우;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제16권1호
    • /
    • pp.100-107
    • /
    • 2013
  • 최근 전자책 시장이 활성화됨에 따라 전자책 단말기에서부터 스마트 기기의 소프트웨어 리더까지 각종 전자책뷰어가 등장하고 있다. 하지만 시각장애인, 난독증, 학습장애인과 같은 독서장애인을 위한 모바일 전자책 인터페이스에 대한 개발과 연구는 부족한 실정이다. 비장애인을 대상으로 만들어진 전자책뷰어는 독서장애인에게 그대로 적용할 수 없기 때문에 독서장애 사용자의 특성에 따라 차별화된 인터페이스가 요구된다. 이에 본 논문에서는 독서장애인용 전자책 표준 형식을 지원하는 모바일 전자책 뷰어 인터페이스 모델을 제안한다. 제시 모델은 전맹인, 저시력인, 학습장애인 등 사용자의 특성 및 상황(context)에 따라 차별화된 인터페이스를 제공한다. 아울러 독서장애인용 어노테이션 시스템을 지원함으로써 기존의 독서장애인용 오디오북과는 다른 사용자-전자책 간의 상호작용을 지원한다. 또한 본 모델을 이용하여 스마트폰 플랫폼인 안드로이드 환경에서의 독서장애인용 전자책뷰어 프로토타입을 구현하고 그 활용 가능성을 제시한다. 본 연구의 결과는 국내 인구 10%에 해당하는 독서장애인의 효율적인 독서활동을 지원할 수 있다.

실생활 음향 데이터 기반 이중 CNN 구조를 특징으로 하는 음향 이벤트 인식 알고리즘 (Dual CNN Structured Sound Event Detection Algorithm Based on Real Life Acoustic Dataset)

  • 서상원;임우택;정영호;이태진;김휘용
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.855-865
    • /
    • 2018
  • 음향 이벤트 인식은 다수의 음향 이벤트가 발생하는 환경에서 이를 인식하고 각각의 발생과 소멸 시점을 판단하는 기술로써 인간의 청각적 인지 특성을 모델화하는 연구다. 음향 장면 및 이벤트 인식 연구 그룹인 DCASE는 연구자들의 참여 유도와 더불어 음향 인식 연구의 활성화를 위해 챌린지를 진행하고 있다. 그러나 DCASE 챌린지에서 제공하는 데이터 세트는 이미지 인식 분야의 대표적인 데이터 세트인 이미지넷에 비해 상대적으로 작은 규모이며, 이 외에 공개된 음향 데이터 세트는 많지 않아 알고리즘 개발에 어려움이 있다. 본 연구에서는 음향 이벤트 인식 기술 개발을 위해 실내외에서 발생할 수 있는 이벤트를 정의하고 수집을 진행하였으며, 보다 큰 규모의 데이터 세트를 확보하였다. 또한, 인식 성능 개선을 위해 음향 이벤트 존재 여부를 판단하는 보조 신경망을 추가한 이중 CNN 구조의 알고리즘을 개발하였고, 2016년과 2017년의 DCASE 챌린지 기준 시스템과 성능 비교 실험을 진행하였다.

영화 기록의 기술에 관한 연구 (A Study on Description about Archival Materials in Film Archives)

  • 김진성
    • 기록학연구
    • /
    • 제30호
    • /
    • pp.89-123
    • /
    • 2011
  • 영화 기록은 인간의 문화 활동에서 만들어지고 그에 관련된 정보를 장기적으로 제공할 수 있다는 점에서 인류의 기억이며 기록이다. 다만, 영화 기록의 주된 생성목적이 공공 업무활동의 사실적인 내용을 증거하는데 있다기 보다는 민간의 문화적인 창작 내용을 재현하는데 있다는 점에서 일반적인 공공분야의 시청각기록과는 차이가 존재한다. 그렇기에 영화 기록 특유의 물리적 지적 특성을 반영하여 기술 원칙과 규정을 제정해야 한다. 기술 업무를 통제하기 위해서는 특정한 목적과 규칙에 기반한 문서화된 규칙이 필요하므로 더블린 코어, ISAD(G), FIAF Rules라는 관련 국제 기술 규칙들을 분석하였다. 그 결과, 영화 아카이브의 기록들을 보다 효과적으로 설명하기 위해서는 그 영역과 요소의 구성에 중대한 변화를 줄 필요가 있었다. 본 연구의 핵심적인 주장은 다음과 같다. 첫째, 영화 기록을 작품과 개별 자료라는 관념적인 존재와 실제적인 존재로 구분 하는 것이다. 둘째, 영화 기록의 내용, 맥락, 구조를 이해하고 반영하는 것이다. 셋째, 영화 기록의 특성을 반영할 수 있는 영역과 요소를 설정하는 것이다. 최종적으로 제안된 영역 및 요소는 2개 부분에서 각각 6개 및 8개 영역, 22개 및 25개 요소이다. 이 영역 및 요소(안)은 특정 영화 아카이브의 현황이나 정책을 참고하여 작성된 것이 아닌 일반형이기에 해당 영화 아카이브별로 특정한 요소나 하위 요소를 설정할 수 있다.

다중 감각 단서가 촉각적 심상과 제품에 대한 태도-구매 의사에 미치는 영향 (Effect of Multimodal cues on Tactile Mental Imagery and Attitude-Purchase Intention Towards the Product)

  • 이예진;한광희
    • 감성과학
    • /
    • 제24권3호
    • /
    • pp.41-60
    • /
    • 2021
  • 본 연구는 제품과 물리적 접촉이 불가능한 온라인 환경에서 다중 감각 단서가 소비자의 촉각적 심상과 제품에 대한 태도 및 구매 의사에 미치는 영향을 알아보고자 하였다. 실험 1에서는 참가자들을 음향 없이 사진만 제시한 조건, 음향 없이 영상만 제시한 조건, 일치하는 음향과 영상을 제시한 조건, 불일치하는 음향과 영상을 제시한 조건으로 나누어 제품을 탐색하게 하였고 그 후 촉각적 심상선명도, 제품 사용의 상상용이성, 제품에 대한 태도-구매 의사를 측정하였다. 그 결과, 모든 변수에서 불일치하는 음향과 영상이 주어진 조건이 가장 낮은 평균 점수를 보였다. 실험 2는 참가자 내 디자인으로 설계되어, 참가자들에게 동일한 제품을 실험 1과 같은 네 개의 조건에서 탐색하게 하였다. 탐색 후, 촉각적 심상선명도, 제품 사용의 상상용이성, 제품에 대한 태도-구매 의사, 접촉 욕구 등을 측정하였다. 접촉 욕구를 공변인으로 하는 반복측정 공분산분석 결과, 일치하는 음향과 영상을 제시한 조건은 다른 조건과 비교했을 때 유의미하게 심상선명도, 제품에 대한 태도, 제품 구매 의사가 높았다. 이중 매개 분석 결과, 다중 감각 단서 조건은 심상선명도와 제품 사용의 상상용이성을 순차적으로 매개하여 제품에 대한 태도-구매 의사를 유의미하게 예측했다. 결론적으로, 음향 및 영상 단서로 유발된 선명한 촉각적 심상은 소비자가 제품을 사용하는 상황의 상상을 쉽게 만들어 태도-구매 의사와 같은 의사 결정에 긍정적 영향을 미칠 수 있다.

야외지질답사 및 모델링 기반 순환 학습에서 학생들이 그린 그림의 목적과 기능에 대한 이해 (Understanding Purposes and Functions of Students' Drawing while on Geological Field Trips and during Modeling-Based Learning Cycle)

  • 최윤성
    • 한국지구과학회지
    • /
    • 제42권1호
    • /
    • pp.88-101
    • /
    • 2021
  • 이 연구의 목적은 학생들이 그린 그림이 야외지질답사와 모델링 기반 순환 학습에서 어떤 의미를 갖는지 질적으로 탐색하는 것이다. 서울의 한 대학 부설 영재교육원에 재학 중인 10명의 학생이 참여하였다. 한탄강 형성과정이라는 것을 주제로 야외지질답사와 3차시 모델링 3차시 수업을 진행하였다. 각 차시별 학생들이 작성했던 모든 기록장(글, 그림), 연구자 필드노트, 학생들이 참여한 모든 영상 자료 및 음성 녹음, 전사한 인터뷰 자료 등을 연구진과 공유하였다. Hatisaru (2020) 그림 표상화를 야외지질학습의 맥락에 맞게 수정하여 그림의 유형을 분류하였다. 학생들의 글(text, memo)을 포함한 그림의 특징을 분석하기 위해 연연적 내용 분석(deductive content analysis)을 사용하였다. 또한, 그림이 모델링 기반 순환 과정(자료 수집 관찰, 모델 생성, 모델 발달, 자연현상의 구체화) 속에서 어떤 역할을 하는지 분석하였다. 그 결과 학생들의 그림 유형은 지질학적인 개념을 포함한 상징적 이미지, 지형학적으로 외형을 묘사한 외형적 이미지, 학생들의 심리적인 영역을 표현한 정의적 이미지가 있었다. 특징은 설명, 생산화, 정교화, 증거, 일치, 심상(心狀)으로 분류하였다. 그림의 유형과 특징은 모델링 기반 순환 학습 과정에서 연속적으로 나타나며 학생들의 모델 발달 과정 속에서 학생들의 인지적인 영역에 관한 특성과 학업에 대한 긍정적인 태도와 감정을 반영하였다. 학생들이 그린 그림은 야외지질답사와 모델링 과정 모두에 있어서 학생들의 사고와 의사표현을 반영할 수 있는 도구로써 의미를 있음을 밝힘으로써 과학교육 관계자들에게 학생들의 그림 그리기 활동의 중요성을 역설하였다.

전자기록 관점에서 본 대체 불가능한 토큰(NFT) 특성 및 활용 방안 이전 및 거래 가능한 기록을 중심으로 (A Study on the Characteristics of Non-Fungible Token(NFT) and Application Plans from the Digital Records Perspective : Focused on Transferable Records)

  • 원주혜;소현기;오효정
    • 기록학연구
    • /
    • 제73호
    • /
    • pp.47-79
    • /
    • 2022
  • NFT(Non-Fungible Token)는 문자 그대로 '대체 불가능한 토큰'으로, 특정한 가상 자산을 블록체인에 기록한 디지털 파일이다. 토큰의 거래를 거치며 해당 자산의 소유권, 거래 내역 등의 이벤트가 블록체인에 기록되므로 위조와 변조가 불가능하다는 특징이 있다. 따라서 NFT는 특정한 가상 자산을 고유하게 표현할 수 있는 도구로 사용되며 이는 전자기록의 기본 속성과 깊게 관련된 측면이 있다. 본 논문은 기록관리에 NFT 기술 활용 가능성을 타진하는데 목적을 두고 디지털 저작물로서 자산의 성격을 가지며 이전 및 거래가 가능한 전자기록물에 초점을 맞추어 연구를 진행하였다. 이를 위해 먼저 NFT의 개념과 디지털 자산의 소유권 및 저작권 등 제도적 이슈, 자산으로서의 가치 증명 원리를 살펴본다. 특히, 예술, 패션, 스포츠 등 NFT가 실제로 활용되고 있는 분야에서 NFT의 특성이 어떻게 활용하고 있는지 살펴보았다. 나아가 전자기록의 특성과 NFT의 특성을 비교하여 전자기록에 적용 가능한 요소를 규명함으로써 NFT의 적용이 효과적일 것으로 예상되는 전자기록물의 유형을 파악하고, 그에 따른 활용 가능성과 기록관리 내 도입을 위한 논의점을 제시하였다.

한국형 감정 음성 데이터베이스 구축을 위한 타당도 연구 (Development and validation of a Korean Affective Voice Database)

  • 김예지;송혜선;전예솔;오유림;이영미
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.77-86
    • /
    • 2022
  • 본 연구는 운율을 기반으로 감정을 인식하는 능력을 측정할 때 이용할 수 있는 한국형 감정 음성 데이터베이스(Korean Affective Voice Database, 이하 KAV DB)를 개발하고, 해당 DB가 의사소통장애 관련 임상과 연구에서 활용될 수 있는지를 점검하기 위하여 신뢰도, 민감도, 특이도를 산출하여 그 타당성을 살펴보았다. 본 연구에서는 배우 2명(남 1명, 여 1명)이 의미적으로 중립적인 문장 10개를 행복, 분노, 공포, 슬픔, 놀람, 중립의 6개 정서로 표현하도록 하여 음성을 녹음하였다. 녹음된 음성 중에서 목표 정서가 잘 표현된 문장을 선별하여 타당도 점검을 위한 음성파일 세트를 구성하였으며, 청자 31명(남 14명, 여 17명)이 시각적 아날로그 평정법을 이용하여 각 음성에서 6개의 정서가 얼마나 반영되었는지 평정하도록 하였다. 그 결과, KAV DB에 대한 청자의 내적 일관성 신뢰도는 .872, 전체 민감도 82.8%, 전체 특이도 83.8%였다. 이를 통하여, 타당도가 확보된 KAV DB는 감정 음성 인식 및 산출과 관련된 연구와 임상 콘텐츠 제작 등에 활용될 수 있을 것으로 기대된다.