• 제목/요약/키워드: Information Structured Space

검색결과 78건 처리시간 0.022초

복합 문서의 의미적 분해를 통한 다중 벡터 문서 임베딩 방법론 (Multi-Vector Document Embedding Using Semantic Decomposition of Complex Documents)

  • 박종인;김남규
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.19-41
    • /
    • 2019
  • 텍스트 데이터에 대한 다양한 분석을 위해 최근 비정형 텍스트 데이터를 구조화하는 방안에 대한 연구가 활발하게 이루어지고 있다. doc2Vec으로 대표되는 기존 문서 임베딩 방법은 문서가 포함한 모든 단어를 사용하여 벡터를 만들기 때문에, 문서 벡터가 핵심 단어뿐 아니라 주변 단어의 영향도 함께 받는다는 한계가 있다. 또한 기존 문서 임베딩 방법은 하나의 문서가 하나의 벡터로 표현되기 때문에, 다양한 주제를 복합적으로 갖는 복합 문서를 정확하게 사상하기 어렵다는 한계를 갖는다. 본 논문에서는 기존의 문서 임베딩이 갖는 이러한 두 가지 한계를 극복하기 위해 다중 벡터 문서 임베딩 방법론을 새롭게 제안한다. 구체적으로 제안 방법론은 전체 단어가 아닌 핵심 단어만 이용하여 문서를 벡터화하고, 문서가 포함하는 다양한 주제를 분해하여 하나의 문서를 여러 벡터의 집합으로 표현한다. KISS에서 수집한 총 3,147개의 논문에 대한 실험을 통해 복합 문서를 단일 벡터로 표현하는 경우의 벡터 왜곡 현상을 확인하였으며, 복합 문서를 의미적으로 분해하여 다중 벡터로 나타내는 제안 방법론에 의해 이러한 왜곡 현상을 보정하고 각 문서를 더욱 정확하게 임베딩할 수 있음을 확인하였다.

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.

머신비전 기반 보행신호등 검출 기능을 갖는 보행등 구현 (Implementation of a walking-aid light with machine vision-based pedestrian signal detection)

  • 구지훈;이주성;조홍래;안호명
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.31-37
    • /
    • 2024
  • 본 연구에서는 컴퓨팅 자원이 제한된 환경에서도 효율적으로 동작 가능한 머신비전 기반의 보행자 신호 검출 알고리즘을 제안하였다. 이 알고리즘은 제한된 자원에서도 높은 효율성을 발휘하며, 주변 조명 등의 영향을 최소화하기 위해 HSV 색공간 기반의 영상처리, 이진화, 모폴로지 연산, 라벨링 등의 단계를 순차적으로 적용하여 빛 번짐과 같은 현상에 대응할 수 있도록 설계되었다. 특히, 이 알고리즘은 비교적 단순한 형태로 구성되어 임베디드 시스템 환경에서 부담 없이 동작할 수 있도록 고려되었다. 이를 통해 낮은 컴퓨팅 자원을 보유한 환경에서도 안정적으로 작동할 수 있는 구조를 갖췄다. 또한, 제안된 보행등은 보행신호 검출 기능뿐만 아니라 IoT 기능을 탑재하여 무선으로 웹서버와 연동되는 기능을 갖췄다. 이에 따라 보행등 설치자 및 제어권자들은 웹 서버를 통해 신호등의 상태를 모니터링하고 제어할 수 있는 편의성을 제공받을 수 있다. 더불어, 50W급 LED 보행등을 효과적으로 제어할 수 있는 구현이 완료되었다. 이러한 제안된 시스템은 자원 제한 환경에서의 신속하고 효율적인 보행자 신호 검출 및 제어 시스템으로, 실제 도로 환경에서의 적용 가능성을 고려하고 있다. 이를 통해 보다 안전하고 지능적인 도로 교통 시스템의 구축에 기여할 것으로 기대된다.

대규모 인터뷰 작업이 생성하는 집단적 관계성의 의미 - 미디어전시예술 <70mK>를 중심으로 (The Meaning of Collective Relationships Becoming by Large-scale Interview Project - Focused on the media exhibition art <70mk> -)

  • 오세현
    • 트랜스-
    • /
    • 제7권
    • /
    • pp.19-48
    • /
    • 2019
  • 본 연구는 대규모 인터뷰 작업을 통해 한민족이 가진 집단적 의식의 지형도를 담아내고자 하는 미디어전시작업 <70mK>의 의미를 고찰하기 위해 기술되었다. <70mK>는 개별 존재자들의 인터뷰 영상들을 마치 모자이크와 같은 배치와 형태로 편집, 구성된 영상전시물을 만들고 전시회를 개최하고 있다. 분할된 프레임 속의 개체들은 저마다의 생각과 개성을 드러내는 차이의 연속성을 보여준다. 이것은 개체들의 내재성이 동시다발적이고 총체적인 이미지로 구현된 공시적이고 의식적인 집단적 타자의 형상이다. 인터뷰 영상들은 실제 존재자로서의 자신의 형태를 드러내고 자신이 가진 특유의 내재성을 구술적인 정보로서 발산한다. <70mK>는 특정 집단이라는 동일선의 연장에서 이런 생명적 개체들의 형태와 정보를 미학적으로 구조화하여 새로운 개체화를 이루어낸다. 프레임 속의 존재자들, 각 개체들은 서로가 대화를 나누거나 소통하는 것이 아니라 카메라를 향한 전면 응시, 즉 작품을 관람하는 사람들을 향해 그들이 가진 전개체적 실재로서의 관계성과 개성을 전달한다. 그것은 각 개체들이 보여주는 이질성과 차이의 반복적 배치와 구성인 동시에 그 이면에 집단적 동일성을 내포한 연쇄 작용이다. <70mK>는 개성을 드러내는 인터뷰이들의 직접적인 이미지와 소리를 구조화하여 전시영상작품이라는 새로운 정보전달 방식의 형태를 이루어낸다. 이러한 점은 정신적이고 집단적인 개체화의 의미와 관개체적인 관계성의 의미와 과정을 은유하게 하고 지각하게 한다. 이것은 개체화라는 생성의 과정과 관계의 의미를 현대 기술과 함께 사유한 질베르 시몽동의 개체화론으로 설명하기 적합한 사례이다. <70mK>가 구축한 전시공간은 특정 집단의 개체들 사이를 관통하여 연결되는 정신적이고 집단적인 의미와 그 관계성을 미학적인 방법론으로 함의하고 있다. 시몽동은 개체화라는 과정에 대한 사유와 생성의 의미를 고찰하며 현대의 기술이 가진 가능성과 잠재력을 긍정한 철학자이다. <70mK>는 현대의 기술 매커니즘과 네트워크적 행위들이 매개되어 구조화되고 생성된 윤리적 실재성으로서의 새로운 개체이다. 그것은 기술이 협업 된 개체화 과정에 인터뷰가 어떻게 '변환' 작용으로 기능하는지에 대한 미학적이고 실천적인 방법론을 보여주는 사례이다. <70mK>가 보여주는 직접적인 이미지와 소리는 생명적 개체의 정보들이 운반, 증폭, 축적되며 발산하는 정보의 체계이자 정신적이고 집단적인 풍경으로서의 새로운 개체이다. 그것은 복수의 개체화를 통해 새롭게 생성된 전시예술작품에 내포된 개체초월적인 의미작용과 과정에 대한 하나의 표상이기도 하다. 개체화된 준안정적 상태로서의 미디어전시예술은 작품을 관람하는 이들이 동일한 전개체적 실재를 인지하고 정념적 감정을 느끼는 새로운 관계 맺기를 이끌어낸다. <70mK>의 전시공간은 의미작용의 표상을 넘어 관개체적 집단의 실질적인 가능성을 예비하는 무대가 된다.

  • PDF

Daum 웹툰 <바리공주>를 통해 본 고전 기반 웹툰 콘텐츠의 다층적 대화 양상 -서사구조와 댓글 분석을 중심으로 (About the Multi-layered Communication of Princess Pari on the Webtoon Platform of Daum -Focusing on Analysis of Narrative Structure and Comments)

  • 최기숙
    • 대중서사연구
    • /
    • 제25권3호
    • /
    • pp.303-345
    • /
    • 2019
  • 이 논문은 포탈사이트 Daum에 연재되고 있는 김나임 작가(글/그림)의 웹툰 <바리공주>를 대상으로, 콘텐츠의 서사 구조와 댓글 분석을 질적/양적 방법론을 병행해 수행함으로써, 바리공주 서사무가라는 고전을 기반으로 한 웹툰 콘텐츠의 창작과 수용에 매개된 다층적 대화 양상을 해명했다. 웹툰 <바리공주>는 단위 서사가 독립적, 다선적, 중층적으로 연결되는 옴니버스 구성을 취하되, 바리의 성장담과 로맨스를 통해 개별서사를 통합하는 서사적 장치를 활용했다. 이때 작가는 예고편을 통해 고전원작(서사무가)을 웹툰의 프리퀄에 해당하는 전사(前史)로 활용했고, 원작이 지닌 젠더 비대칭성과 가부장제의 문제에 서사적으로 응답하는 서사적 재구성을 시도했다. 이에 대해 수용자는 비평적/성찰적 차원의 댓글로 토의하는 대화적 공론장을 형성했다. 표집을 통한 통계 분석에 따르면, 댓글의 양상은 〔콘텐츠에 대한 감상과 비평 ≫ 감정 반응 ≫ 직관적 총평 ≫ 지식과 성찰 ≫ 댓글평〕의 순으로 나타났다. 웹툰 <바리공주>의 창작과 수용에는 고전과 현대, 콘텐츠와 수용자, 수용과 창작 차원의 다층적 대화 양상이 작동했다. 창작의 차원에서 작가는 신화적 상징의 간극을 메우는 장치를 활용했으며, 수용자의 차원에서는 댓글을 통해 전통/민속/문화에 대한 정보와 지식, 성찰을 공유하는 문화를 형성했다. 이는 웹툰을 매개로 한 고전과 현대의 대화에 해당한다. 수용자는 웹툰의 향유를 통해, 정보를 보완하고 공감대를 형성하며, 해석학적 조율을 시도하고, 논쟁을 통해 시각을 조율하는 과정을 보였다. 또한 댓글을 다는 태도, 시각, 입장에 대해 논평함으로써, 문학에서의 메타비평에 해당하는 행위 양태를 보였다. 수용자의 댓글은 웹툰의 창작에 피드백 정보로 작용함으로써, 창작과 수용 자체가 웹툰 콘텐츠 제작에 영향을 미치는 실천적 역량으로 작동했다. 이 글은 고전을 기반으로 한 웹툰 <바리공주>가 고전과 현대, 작가와 수용자, 연구자간의 다양한 대화성을 형성함으로써, 감각, 사유, 비평, 성찰에 이르는 '움직이며 역동하는' 콘텐츠로 재구성된다는 것을 구체적으로 해명하는 케이스 스터디로 수행되었다.

추론한 데이타 타입을 이용한 질의 가능 XML 압축 (A Queriable XML Compression using Inferred Data Types)

  • 박명제;민준기;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.441-451
    • /
    • 2005
  • HTML은 데이타베이스와 같은 특수한 형태의 저장소 대신, 전형적인 파일 시스템에 저장되는 경우가 대부분이다. 이와 마찬가지로, 최근 인터넷 상에서의 데이타 교환 및 표현의 표준으로 부각되는 XML 역시 파일 시스템을 통하여 저장되는 경우가 현저하다. 하지만, XML 문서가 지니는 비정규적인 구조와 장황성 때문에, 디스크 공간이나 네트워크 상의 대역폭의 사용이 정규적인 구조를 지니는 데이터에 비해 크다. 이러한 XML 문서의 비효율성을 해결하고자, XML 문서의 압축에 관한 연구가 진행되었다. 최근에 연구된 XML 압축 기법들을 살펴보면, 압축된 XML 문서에 대한 질의를 전혀 지원하지 않거나, 질의를 지원하더라도 XML 문서 내의 데이타 값들의 특성을 고려하지 않고 단순히 기존의 압축 방법들을 적용하기 때문에 영역 질의를 지원하기 위해서는 압축의 일부를 복원해야 한다. 그 결과, 압축된 XML 문서에 대한 질의 성능이 저하되었다. 따라서, 본 연구에서는 압축된 XML 문서에 직접적이고 효율적인 질의를 지원하는 XML 압축 기법을 제안하고자 한다. XML 문서의 각 태그를 사전 압축 방법을 사용하여 압축하고자 하며, 태그 별로 데이타들의 타입을 추론하여 추론된 타입에 적절한 압축 방법을 사용하여 데이타 값들을 압축하고자 한다. 또한, 제안하는 압축 기법의 구현 및 성능 평가를 통하여, 구현한 XML 압축기가 실생활에 사용되는 XML 문서들을 효율적으로 압축하며 압축된 XML 문서에 대해 향상된 질의 성능을 제공하는 것을 보인다.

개방형 과제를 활용한 수학 영재아 수업 사례 분석 (A Case Study on Instruction for Mathematically Gifted Children through The Application of Open-ended Problem Solving Tasks)

  • 박화영;김수환
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제20권1호
    • /
    • pp.117-145
    • /
    • 2006
  • 수학 영재들은 타고난 수학적 소질과 적성, 지적인 능력과 창의성을 바탕으로 참신한 과제에 대한 도전적이고 창조적인 호기심을 가지고 있다. 영재아들의 창의적인 사고력을 길러주기 위해서는 다양한 방법으로 문제 해결에 접근하게 하고 전략적 시도를 할 수 있도록 만들어주어야 한다. 이런 관점에서 볼 때 개방적이고 비정형적인 문제를 영재 교육프로그램의 과제로 선정하는 것은 바람직하다 할 수 있다. 본 논문에서는 다양한 유형의 개방형 문제를 구안하고, 이를 토대로 영재 학급에서 학습 활동을 전개한 후, 문제해결 과정에서 영재아들의 수학적 사고 능력의 특성과 문제 해결 전략 사례를 분석하여, 개방형 과제를 활용한 초등학교 영재 수업에 관한 시사점을 얻고자 하였다.

  • PDF

광산 현장의 스마트 마이닝 기술 수준 진단평가 모델 개발 (Development of Smart Mining Technology Level Diagnostics and Assessment Model for Mining Sites)

  • 박세범;최요순
    • 터널과지하공간
    • /
    • 제32권1호
    • /
    • pp.78-92
    • /
    • 2022
  • 본 연구에서는 스마트 마이닝 기술의 수준을 체계적이고 구조화된 방법으로 평가할 수 있는 스마트 마이닝 기술 수준 진단평가 모델을 제안하였다. 이를 위해 스마트 마이닝의 성숙도를 정의하였으며, 제조업에서 활용되는 스마트 공장 진단평가 모델(KS X 9001-3)을 참조하여 스마트 마이닝 기술 수준 진단평가 모델의 세부평가항목 도출하였다. 기존의 체계를 유지하면서 기존 46개의 세부평가항목을 광업에 적합하도록 수정하였으며 추진전략, 프로세스, 정보시스템과 자동화, 성과 부문에서 총 29개의 세부 평가 항목을 도출하였다. 이를 토대로 스마트 마이닝 기술 수준 진단평가 설문지를 설계하였고, 국내의 철광산을 연구지역으로 설정한 다음 스마트 마이닝 기술 수준을 평가하였다. 연구지역의 스마트화 수준은 레벨 2로 나타났으며, 일반 제조업의 평균 스마트 수준과 비교했을 때 40% 정도 낮은 수준에 있음을 유추할 수 있었다. 또한, 개발된 모델을 이용하여 스마트 마이닝의 도입, 운영, 고도화의 단계별로 광산의 취약한 부분을 인지하고 투자 및 개선 방향을 제시할 수 있었다.