• Title/Summary/Keyword: 데이터 어노테이션

Search Result 40, Processing Time 0.027 seconds

A Development of Tag/User Classification System Based on WordNet Hierarchies (WordNet어휘계층구조 기반의 태그/사용자 분류체계 구축지원도구의 개발)

  • Hwang, Suk-Hyung;Choi, Sung-Hee;Kim, Han-Soo;Kim, Jeong-Rae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.1023-1026
    • /
    • 2013
  • 오늘날 인터넷의 발달과 더불어 스마트기기의 보급이 급성장하면서, 다양한 웹사이트에서 데이터가 기하급수적으로 발생되고 있고, 수 많은 다종다양한 데이터를 효율적으로 저장/관리/분석하기 위한 유용한 어노테이션(Anotation) 기법으로서, 리소스에 대한 사용자의 태깅(Tagging)기능이 널리 활용되고 있다. 본 연구에서는, 사용자들의 공통 태그 데이터를 수집하여, WordNet을 기반으로 다양한 수준의 태그/사용자 분류체계를 구축하기 위한 지원도구개발에 관한 연구결과를 보고한다.

Video Summarization System Based on Multi-Camera (멀티카메라 기반 동영상 요약 시스템)

  • Im, Seung-Bin;Park, Han-Saem;Min, Jun-Ki;Hwang, Keum-Sung;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.44-48
    • /
    • 2006
  • 디지털 카메라 기술의 발전과 보급으로 공공건물의 보안 카메라부터 개인 휴대 단말기의 카메라까지 동영상 데이터를 수집할 수 있는 수단이 크게 늘었으며, 그 활용 또한 매우 일반화되었다. 동영상 데이터는 문서나 음성 등의 다른 데이터보다 훨씬 구체적이고 사실적인 정보를 포함하므로 과거의 기억을 정리하고 복원하기 위한 유용한 방법이 될 수 있다. 동영상 데이터의 증가와 함께 동영상 요약에 대한 연구가 최근에 활발히 진행되고 있는데, 이들 연구의 대부분은 하나의 동영상을 요약하고 분석하기 위한 것이다. 본 논문에서는 사무실에 여러 대의 카메라를 설치하여 데이터를 저장하며, 이렇게 수집된 동영상 데이터를 효과적으로 요약하고 검색하는 시스템을 구축한다. 동일한 이벤트를 여러 방향에서 바라보고, 그 상황을 가장 잘 설명한 카메라를 선택 할 수 있다는 점에서 멀티 카메라의 사용은 장점을 갖는다. 사전에 정의된 이벤트에 따라 전문가가 어노테이션을 부여하도록 하였으며, 전문가가 설정한 유틸리티에 따라 카메라 선택 및 요약이 이루어진다. 다양한 옵션에 따라 요약된 결과로 사용자 평가를 수행하였다.

  • PDF

A Summarization of Multi-Camera Office Event Using User Log Analysis (사용자 로그분석을 이용한 멀티 카메라 사무실 이벤트 요약)

  • Park, Han-Saem;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06b
    • /
    • pp.186-190
    • /
    • 2008
  • 최근 카메라를 비롯한 다양한 센서 기술 및 디지털 저장장치의 발달로 사용자의 일상생활의 기록인 라이프 로그를 수집하고 분석하는 연구가 활발히 이루어지고 있다. 라이프 로그는 모바일 디바이스에 포함된 다양한 센서를 통해 실외에서 수집되는 경우와 실내에 카메라를 중심으로 한 센서를 설치하여 수집되는 경우로 나누어 볼 수 있으며, 수집된 로그는 다양한 방법을 통해 분석하여 사용자에게 요약이나 검색과 같은 서비스 제공에 활용될 수 있다. 본 논문은 오피스 환경에 다수의 카메라를 설치하여 수집한 실내 비디오 로그 데이터를 대상으로 하며, 사용자의 어플리케이션 로그를 분석하여 요약을 위해 활용한다. 다수의 카메라는 오피스의 가운데 부분을 비추도록 하여, 발생한 하나의 이벤트에 대한 다양한 시점의 영상을 얻을 수 있도록 하였다. 전체 요약 과정은 크게 데이터 어노테이션, 사용자 로그분석을 이용한 이벤트 시퀀스 요약, 도메인 지식을 이용한 카메라 뷰의 선택으로 나뉘어 수행된다. 최종적으로 실험을 통해 제안하는 요약 방법이 좋은 결과를 보임을 확인하였다.

  • PDF

Frame-semantics and Argument Disambiguation of Korean FrameNet using Bi-directional LSTM (중첩 분할된 양방향 LSTM 기반의 한국어 프레임넷의 프레임 분류 및 논항의 의미역 분류)

  • Hahm, Younggyun;Shin, Giyeon;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.352-357
    • /
    • 2018
  • 본 논문에서는 한국어 프레임넷 분석기를 구축하기 위하여 한국어 프레임넷 데이터를 가공하여 공개하고, 한국어 프레임 분류 및 논항의 의미역 분류 문제를 해결하기 위한 방법을 제안한다. 프레임넷은 단어 단위가 아닌 단어들의 범위로 구성된 범위에 대해 어노테이션된 코퍼스라는 점에 착안하여, 어휘 및 논항의 내부 의미 정보와 외부 의미 정보, 그리고 프레임과 각 의미역들의 임베딩을 학습한 중첩 분할된 양방향 LSTM 모델을 사용하였다. 이를 통해 한국어 프레임 분류에서 72.48%, 논항의 의미역 분류에서 84.08%의 성능을 보였다. 또한 본 연구를 통해 한국어 프레임넷 데이터의 개선 방안을 논의한다.

  • PDF

Development of Robust Semantic Segmentation Modeling on Various Wall Cracks (다양한 외벽에 강인한 균열 구획화 모델 개발)

  • Lee, Soo Min;Kim, Gyeong-Yeong;Kim, Dong-Ju
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.49-52
    • /
    • 2022
  • 건물 외벽에 발생하는 균열은 시설물 구조 안전에 영향을 미치며 그 크기에 따라 위험도가 달라진다. 이에 따라 전문검사관의 현장 점검을 통해 발생 균열 두께를 정밀하게 측정할 필요가 있고 최근에는 이러한 현장 안전점검에 인공지능을 도입하려는 추세다. 그러나 기존의 균열 데이터셋은 주로 콘크리트에만 한정되어 다양한 외벽에 강인한 모델을 구축하기 어렵고 균열 두께를 측정하기 위해 정확한 마스크(Mask) 정보가 필요하나 이를 만족하는 데이터셋이 부재하다. 본 논문에서는 다양한 외벽에 강인한 균열 구획화 모델을 목적으로 2,744장의 이미지를 촬영하고 매직 완드 기법으로 라벨링을 진행해 데이터셋을 구축 후, 이를 바탕으로 딥러닝 기반 균열 구획화 모델을 개발했다. UNet-ResNet50을 최종모델로 선정 및 개발 결과, 테스트 데이터셋에 대해 81.22%의 class IoU 성능을 보였다. 본 연구의 기술을 바탕으로 균열 두께를 측정하여 건축물 안전점검에 활용될 수 있기를 기대한다.

  • PDF

A Study on Analysis of Flickr Note and Its Applications for Social Media Search (소셜 미디어 검색을 위한 Flickr Note의 분석 및 응용에 관한 연구)

  • Jeong, Jin-Woo;Hong, Hyun-Ki;Lee, Dong-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.49-52
    • /
    • 2011
  • 본 연구에서는 Flickr에서 제공하는 어노테이션 기법 중 Note 서비스에 대한 다양한 분석 결과를 제공하고, 이를 기반으로 소셜 미디어 검색을 위한 Flickr Note의 응용 방안을 제안한다. Flickr Note는 기존의 태그 기반 검색에서 활용되는 태그와는 달리 이미지의 특정 영역 위에 직접적으로 할당되는 텍스트들의 집합이다. Flickr Note는 보다 지능적인 소셜 이미지 공유 및 검색 서비스를 위하여 다양한 정보들을 제공할 수 있는 중요한 데이터지만, 이를, 이미지 검색에 효과적으로 활용하기 위한 연구는 미미한 수준이다. 따라서 본 연구에서는 Flickr Note에 대한 다양한 분석을 통하여 소설 이미지 검색에서 Note의 역할 및 활용 기능성을 제공하고자 하며, 이를 바탕으로 Flickr Note 기반의 이미지 분석 및 검색을 위한 다양한 연구들이 시도되기를 기대한다.

A Study on Semantic Annotation System for Multimedia File (멀티미디어 파일에 대한 시맨틱 어노테이션에 관한 연구)

  • Hwang, In-Moon;Yoo, Nam-Hyun;Song, Gil-Jong;Kim, Won-Jung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06d
    • /
    • pp.301-305
    • /
    • 2007
  • 기존의 멀티미디어 자료들을 직접 분석하여 메타데이터를 부여하던 기존 연구들은 멀티미디어 파일에 부여된 키워드에 해당하는 온톨로지가 존재하지 않는 경우 해당 멀티미디어 파일에 대한 직접 검색을 실시하지 않거나, 잘못된 의미가 부여된 키워드에 의하여 검색 결과의 정확성과 재현율이 떨어지는 문제점을 가지고 있었다. 본 논문에서 제안한 SASM은 키워드에 부여된 다의성과 동의성의 개념을 이용하여 WordNet을 이용하여 확장한 후, 확장된 키워드들을 이용하여 온톨로지가 구축되어 있지 않더라도 해당 이미지에 대한 직접 분석을 실시할 수 있으며, 키워드에 대한 동의성과 다의성을 이용한 확장된 키워드들을 이용함으로써 검색 결과의 재현율과 정확성의 성능을 향상시켰다.

  • PDF

Development of an ontology-based knowledge search system: The case of KT call center (온톨로지 기반 지식 검색 시스템 개발: KT 콜센터 사례)

  • Ahn, Seyeol;Choi, Hyunsik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.576-579
    • /
    • 2010
  • 콜센터의 고객문의는 복잡하여 기존 검색 시스템으로는 고객의 문제점을 신속하게 찾아 상담에 적용하는데 문제가 많았다. 온톨로지를 구축하고 시맨틱 검색을 제공할 경우 보다 보다 좋은 검색 기능을 제공할 것으로 기대되나 콜센터의 상담지식은 내용이 매우 복잡하여 그 텍스트의 내용을 완벽하게 온톨로지로 표현하는 것은 쉽지 않았다. 본 논문에서는 온톨로지 기반으로 구축된 지식베이스의 데이터 검색과 함께 그와 가장 관련성이 높은 문서를 출력하기 위해 문서를 온톨로지와 링크하여 어노테이션하는 방법을 제안한다. 본 시스템을 적용한 상담에서 상담원들의 생산성이 향상되고 고객 만족도를 높이는 결과를 확인했다.

A Study on the Construction of Korean Hate Speech Corpus: Based on the Attributes of Online Toxic Comments (한국어 혐오 표현 코퍼스 구축 방법론 연구: 온라인 악성 댓글에 나타나는 특성을 중심으로)

  • Cho, Won Ik;Moon, Jihyung
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.298-303
    • /
    • 2020
  • 온라인 공간에서 특정인, 혹은 특정 집단의 사람들을 대상으로 한 혐오 표현은 당사자에게 정신적 고통을 미칠 뿐 아니라 이를 보는 이에게도 간접적인 불쾌함을 유발한다. 이에 관한 문제의식은 사회적으로 공감대가 형성된 바 있지만, 아직 한국어에서는 많은 연구들이 혐오 표현 자체의 논의에 집중하고 있으며, 이는 실제로 관찰되는 혐오 표현들의 자동 탐지 및 예방에는 효과적인 정보를 제공하지 못하는 것이 사실이다. 이에 우리는 실제 온라인 댓글들을 탐구하여 혐오, 모욕 및 사회적 편견을 탐지할 수 있는 모델 학습에 필요한 코퍼스 구축 가이드라인을 제작하였다. 구체적인 사례를 동반한 가이드라인과 크라우드소싱을 바탕으로 약 9천 3백 문장 가량의 코퍼스를 구축하였으며, 해당 데이터에 관한 개요와 함께 우리의 접근 방식이 어떤 점에서 기존의 담론과 연관되어 있는지에 대한 분석을 제시한다.

  • PDF

A method for contents management using extended metadata in CDN (CDN에서 확장된 메타데이터를 이용한 콘텐츠 관리 방법)

  • Lim, Jung-Eun;Choi, O-Hoon;Na, Hong-Seok;Baik, Doo-Kwon
    • Journal of Digital Contents Society
    • /
    • v.9 no.4
    • /
    • pp.725-733
    • /
    • 2008
  • CDN(Content Delivery Network) has been used as contents transmission network for transmitting high capacity contents fastly and stably. Main goals of CDN are efficient distribution and management high capacity contents. Current CDN distributes contents by managing contents based on basic metadata created by contents provider. However, existing CDN management system doesn't provide a method for applying additional metadata in content itself that is necessary for efficient contents management and distribution. Since the existing system can not annotate additional information in metadata about contents itself, and can not search contents that user wants. This paper proposes a method for applying additional metadata in existing CDN and implemented it as contents metadata management system(CMMS). A user can search needed contents effectively via CMMS. Also, the searched result can help selecting and managing contents to distribute in CDN.

  • PDF