• 제목/요약/키워드: Information processing knowledge

검색결과 1,093건 처리시간 0.023초

트위터 상의 이미지 이용에 관한 분석 (An Analysis of Image Use in Twitter Message)

  • 정은경;윤정원
    • 한국비블리아학회지
    • /
    • 제24권4호
    • /
    • pp.75-90
    • /
    • 2013
  • 이용자들은 최근 소셜 미디어를 활발하게 이용하고 있으며, 소셜 미디어는 이미지와 같은 멀티미디어 정보의 배태가 주요한 특징이다. 본 연구는 트위터 상에서 이미지 이용 행태를 규명하고자 하였다. 이를 위하여 2013년 4월에 발생한 "보스턴 마라톤 대회 테러" 사건과 관련된 1,589건의 이미지 포함 트윗 메시지를 수집하여 이 중에서 영향력 있는 트윗 메시지 200건과 선호하는(favorite) 트윗 메시지 200건, 무작위로 선택된 일반 트윗 메시지 200건을 각각 선정하여 데이터 분석을 실시하였다. 데이터 분석은 두 단계의 분석과정과 세 그룹의 데이터 셋을 대상으로 수행하였다. 첫 번째 단계에서는 기존 선행연구를 바탕으로 개발된 코딩 체계를 활용하여 세 그룹의 데이터에 대해서 트윗 메시지, 이미지 이용, 이용자에 관하여 각각 수행되었다. 두 번째 단계는 세 그룹의 데이터 셋(일반 트윗, 영향력 있는 트윗, 선호하는 트윗)의 코딩 결과를 비교 분석하였다. 이러한 분석과정을 통해서, 의견을 표현하는 트윗이 가장 선호되었으며, 정보를 공유하는 트윗이 가장 영향력이 있는 것으로 나타났다. 이미지 이용 관점에서는 정보배포, 일러스트레이션, 감정적/설득적, 정보처리 이용목적이 가장 두드러지게 나타났다. 이러한 이미지 이용은 기존의 이미지 이용 패턴과 달리 이미지를 데이터로서 이용하는 목적이 객체 중심으로 이용하는 목적보다 높은 것으로 나타났다. 이용자 분석에서는 정부기관, 유명인, 이미지 사이트가 가장 선호되고 영향력 있는 것으로 나타났다. 이러한 연구결과는 이용 맥락 관점의 차세대 이미지 정보 검색 패러다임을 위한 이용자 관점의 이해 증진에 기여할 수 있을 것으로 기대한다.

생성형 대규모 언어 모델과 프롬프트 엔지니어링을 통한 한국어 텍스트 기반 정보 추출 데이터셋 구축 방법 (A Study on Dataset Generation Method for Korean Language Information Extraction from Generative Large Language Model and Prompt Engineering)

  • 정영상;지승현;권다롱새
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.481-492
    • /
    • 2023
  • 본 연구는 생성형 대규모 언어 모델을 활용하여 텍스트에서 정보를 추출하기 위한 한글 데이터셋 구축 방법을 탐구한다. 현대 사회에서는 혼합된 정보가 빠르게 유포되며, 이를 효과적으로 분류하고 추출하는 것은 의사결정 과정에 중요하다. 그러나 이에 대한 학습용 한국어 데이터셋은 아직 부족하다. 이를 극복하기 위해, 본 연구는 생성형 대규모 언어 모델을 사용하여 텍스트 기반 제로샷 학습(zero-shot learning)을 이용한 정보 추출을 시도하며, 이를 통해 목적에 맞는 한국어 데이터셋을 구축한다. 본 연구에서는 시스템-지침-소스입력-출력형식의 프롬프트 엔지니어링을 통해 언어 모델이 원하는 결과를 출력하도록 지시하며, 입력 문장을 통해 언어 모델의 In-Context Learning 특성을 활용하여 데이터셋을 구축한다. 생성된 데이터셋을 기존 데이터셋과 비교하여 본 연구 방법론을 검증하며, 관계 정보 추출 작업의 경우 KLUE-RoBERTa-large 모델 대비 25.47% 더 높은 성능을 달성했다. 이 연구 결과는 한국어 텍스트에서 지식 요소를 추출하는 가능성을 제시함으로써 인공지능 연구에 도움을 줄 것으로 기대된다. 더욱이, 이 방법론은 다양한 분야나 목적에 맞게 활용될 수 있어, 다양한 한국어 데이터셋 구축에 잠재력을 가진다고 볼 수 있다.

대칭성 분석과 레벨셋을 이용한 자기공명 뇌영상의 자동 종양 영역 분할 방법 (Automatic Tumor Segmentation Method using Symmetry Analysis and Level Set Algorithm in MR Brain Image)

  • 김보람;박근혜;김욱현
    • 융합신호처리학회논문지
    • /
    • 제12권4호
    • /
    • pp.267-273
    • /
    • 2011
  • 본 논문은 자기공명 뇌영상을 대상으로 뇌종양 영역을 자동으로 분할하기 위한 방법을 제안한다. 정상적인 뇌영상은 좌우로 대칭인 특징을 지니는 반면에 종양이 존재하는 뇌영상은 종양세포와 부종 및 괴사로 인해 비대칭적인 특징을 가진다. 본 논문에서는 이러한 대칭성을 뇌영상내에 종양영역의 존재 유무를 판별할 수 있는 기준으로 이용한다. 대칭성 분석을 위해서 뇌영역의 윤곽선 정보를 이용해 중심축을 생성하였으며 이는 사전정보를 이용하지 않고 영상의 자체 정보만을 해석해서 중심축을 추출할 수 있다는 점에서 기존의 영상 정합을 통해 해부학적 위치 정보를 추출하고 이를 이용하여 중심축을 찾는 방법과 구별된다. 자기공명 영상에서 정상뇌의 조직은 크게 3가지 클러스터로 분할되며 각 클러스터가 포함하는 영역은 백질과 회백질영역을 포함하는 뇌 실질영역, 뇌척수액(csf)영역, 두개골, 지방 및 뇌막 영역 등으로 나뉜다. 종양이 포함된 영상은 종양과 부종 및 괴사 영역이 추가적으로 존재하며 이는 클러스터링을 이용한 분할을 통해서 구분될 수 있다. 분할된 종양 영역의 중심점은 다음 슬라이스의 종양 영역의 경계를 검출하기 위한 레벨셋 알고리즘에 적용되어 전체 볼륨의 종양 영역의 경계선을 추출하기 위한 초기 시드로 이용된다. 본 논문에서는 3차원 볼륨의 영상(슬라이스)중에서 종양 영역이 존재하는 슬라이스의 종양 영역을 분할하여 이후의 슬라이스에서는 분할작업을 수행하지 않고 영역의 경계선만 추출한다. 자카드 지수와 처리 시간의 비교 분석을 통해 기존의 방법과 비슷한 성능과 빠른 속도로 종양 영역을 분할할 수 있다는 것을 보인다.

사물인터넷 환경에서 대용량 스트리밍 센서데이터의 실시간·병렬 시맨틱 변환 기법 (Real-time and Parallel Semantic Translation Technique for Large-Scale Streaming Sensor Data in an IoT Environment)

  • 권순현;박동환;방효찬;박영택
    • 정보과학회 논문지
    • /
    • 제42권1호
    • /
    • pp.54-67
    • /
    • 2015
  • 최근 사물인터넷 환경에서는 발생하는 센서데이터의 가치와 데이터의 상호운용성을 증진시키기 위해 시맨틱웹 기술과의 접목에 대한 연구가 활발히 진행되고 있다. 이를 위해서는 센서데이터와 서비스 도메인 지식의 융합을 위한 센서데이터의 시맨틱화는 필수적이다. 하지만 기존의 시맨틱 변환기술은 정적인 메타데이터를 시맨틱 데이터(RDF)로 변환하는 기술이며, 이는 사물인터넷 환경의 실시간성, 대용량성의 특징을 제대로 처리할 수 없는 실정이다. 따라서 본 논문에서는 사물인터넷 환경에서 발생하는 대용량 스트리밍 센서데이터의 실시간 병렬처리를 통해 시맨틱 데이터로 변환하는 기법을 제시한다. 본 기법에서는 시맨틱 변환을 위한 변환규칙을 정의하고, 정의된 변환규칙과 온톨로지 기반 센서 모델을 통해 실시간 병렬로 센서데이터를 시맨틱 변환하여 시맨틱 레파지토리에 저장한다. 성능향상을 위해 빅데이터 실시간 분석 프레임워크인 아파치 스톰을 이용하여, 각 변환작업을 병렬로 처리한다. 이를 위한 시스템을 구현하고, 대용량 스트리밍 센서데이터인 기상청 AWS 관측데이터를 이용하여 제시된 기법에 대한 성능평가를 진행하여, 본 논문에서 제시된 기법을 입증한다.

국어사전을 이용한 한국어 명사에 대한 상위어 자동 추출 및 WordNet의 프로토타입 개발 (The Automatic Extraction of Hypernyms and the Development of WordNet Prototype for Korean Nouns using Korean MRD (Machine Readable Dictionary))

  • 김민수;김태연;노봉남
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.847-856
    • /
    • 1995
  • 인간은 문장 안에 있는 명사를 인식할 때 그 명사의 상위 개념을 머리에 떠올린다. 컴퓨터에게 인간의 단어 인식작용을 시뮬레이션하기 위해서는 단어의 상위 개념(상위어) 을 지식 베이스(WordNet)로 구축해야만 한다. 현재 한국에서는 많은 인력과 시간이 소요되기 때문에 WordNet의 작업을 시작하지 못하였으나 컴퓨터의 성능이 급격히 향상 되고 상용화된 MRD(Machine Readable Dictionary)가 이용하능하게 됨에 따라 자동으로 WordNet 구축의 가능성을 보이고 있다. 본 논문에서는 한국어 MRD(Machine Readable Dictionary)의 명사의 정의 (description)를 이용하여 자동으로 한국어 명사 WordNet 을 구축하는 방법을 제안한다. 한국어 문장의 구조적인 특징을 분석하여 상위 개념 (상위어)를 추출하는 규칙을 제안한다. 그것은 중심적인 말이 보통 뒤에 나타난다는 것과 명사의 정의는 특수한 구조를 갖는다는 것을 반영하였다. 또한, 이러한 규칙에 의해 만들어진 상위어들을 결합한 한국어 명사의 WordNet프로토타입을 개발 하였다. 약 250개 표본 단어의 상위어를 추출한 결과 약 92여 퍼센트가 상위어가 옳게 추출 되었다.

  • PDF

인터넷상의 동영상 메일을 재생하기 위한 실시간 연출 기법 연구 (A Study on a Real Time Presentation Method for Playing of a Multimedia mail on Internet)

  • 임영환;이선혜
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.877-890
    • /
    • 1999
  • 본 논문은 기존이 텍스트 위주였던 인터넷 한 단계 넘어 동영상, 음향, 그래픽 등 다양한 멀티미디어 데이터를 이용한 프리젠테이션 메일을 제안한다. 이를 개발함에 있어 가장 큰 문제점은 프리젠테이션 메일을 구성하는 요소가 일반적으로 거대한 용량을 가지는 멀티미디어데이터라는 것이다. 거대한 용량의 멀티미디어 데이터는 전송 및 저장에 있어서 많은 문제점을 갖게 되는데, 이를 극복하기 위해 실제 데이터 부분과 제어 데이터를 분리시켜 제어 프로그램만을 전달하고 실제 데이터는 보낸 사람의 컴퓨터에 있거나 고속 접속이 가능한 원격지 서버에 저장되어 실제 연출할 때에 서버로부터 전송하는 방식을 취한다. 이러한 상황에서 젱 프로그램에 포함된 하이퍼프리젠테이션을 인터넷상에서 실시간으로 재생하기 위한 버퍼관리 및 쓰레드 스케줄링 기법을 제안하였다. 그리고 또 다른 문제는 멀티미디어 연출을 제어하는 방법은 일반 사람들이 사용할 수 있을 정도로 쉬워야 한다는 점이다. 본 논문은 제어 프로그램을 제작하는 도구로써 VIP(Visual Interface player)를 이용하였으며 그것을 LAN기반엣 구현하고 실험한 결과를 제시하였다.

  • PDF

아두이노와 RFID 실드를 사용한 프로그램 개발 (Using Arduino and RFID shield program development)

  • 이경무;이성진;최철길;김진일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.961-964
    • /
    • 2013
  • 아두이노는 오픈 소스 기반 전자 프로토타이핑 플랫폼으로서, 예술가, 디자이너, 취미 활동가 등 인터랙티브 객체 또는 환경 구축에 관심이 있는 모든 이들을 위해 제작되었다. 아두이노의 강점은 하드웨어에 대한 깊은 지식이 없어도 손쉽게 하드웨어 어플리케이션을 제작할 수 있다. 아두이노의 구성은 AVR 마이크로컨트롤러 ATmega 168을 사용하며 아두이노를 동작시키기 위한 소프트웨어로는 아두이노 프로그램, MATLAB, Processing을 주로 사용하고 있다. 아두이노는 오픈 소스 기반이며 하드웨어를 직접 제작할 수 있거나 실드를 이용하여 추가적으로 아두이노를 결합할 수도 있다. 아두이노는 하드웨어의 결합을 통해 계속해서 확장이 가능한데 이를 실드라고 통칭하고 있다. 실드는 기본 보드로 주어지는 아두이노 Uno 보드를 다양한 방면으로 확장시켜 더 많은 기능을 탑재할 수 있게 도와준다. 실드의 종류로는 이더넷 실드, 모터 실드, RFID 실드 등이 있으며 이 실드는 다시 실드 위에 결합할 수 있어 단순한 확장성을 넘어선 하드웨어를 구성할 수 있다. 본 논문에서는 소프트웨어 부분은 아두이노 프로그램을 사용하였고 하드웨어 부분은 아두이노 Uno 보드를 사용하였으며 추가적인 실드는 RFID를 사용하였으며 이를 호환할 태그는 SM130 13.56Mhz 태그를 결합하여 하드웨어를 구성하였다.

  • PDF

규칙기반 한글 자동 프로그램을 위한 프로그램 변형기법 (A Program Transformational Approach for Rule-Based Hangul Automatic Programming)

  • 홍성수;이상락;심재홍
    • 한국정보처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.114-128
    • /
    • 1994
  • 초고급 언어에 의한 자동 프로그래밍은 프로그램의 자료구조 이외에 많은 부분을 시스템이 관장함으로써 프로그램 명세의 표현이 추상적이지만 프로그램 의미소가 술 어논리, 집합, 사상, 혹은 제안된 자연언어를 사용하기 때문에 초고급 구조에 익숙하 지 않은 프로그래머들이 이를 이용하여 프로그램을 작성하는 경우 상당한 어려움이 따 르고, 이들 초고급언어 구조에 익숙하기까지 많은 시간이 요하게 된다. 왜냐하면 초 고급언어는 프로그램 명세의 표현이 추상적이지만 프로그램 의미소가 술어 논리, 집합, 사상, 혹은 제한된 자연언어를 사용하기 때문이다. 본 논문에서는 기존의 자동 프로 그램의 어려움을 줄이기 위해서 한글로 구성된 선언적구문, 절차적 구문, aggregate 구문으로 광역언어를 설계하고 구현한다. 본 논문에서는 제안하는 한글 자동 프로그래 밍 시스템(Hangul Automatic Programming)은 입력으로 순수한 한글로 구성되어 있으며 추상 알고리즘(Abstract Algorithm)과 자료형(Data Type)혹은 절차적 구문을 받아서 출력으로는 C 언어 프로그램을 만들어 낸다. 자동 프로그래밍 접근 방식은 프로그램 변형기법과 규칙기반에 바탕을 두고 문제영역은 일반적인 프로그램으로 한정 하였다. 시스템 제어구조는 한글 프로그램을 입력으로 받아서 지식베이스로부터 적절한 규칙 을 선택해서 이것을 변형한 다음 전체 데이타 베이스에 넣는데 이과정을 프로그램이 완성 될 때 까지 반복한다.

  • PDF

확장적 블록 정합 방법과 영역 보상법을 이용한 비디오 문자 영역 복원 방법 (A Method for Recovering Text Regions in Video using Extended Block Matching and Region Compensation)

  • 전병태;배영래
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권11호
    • /
    • pp.767-774
    • /
    • 2002
  • 기존의 원영상 복원 기술은 주로 신호 처리 분야에서 영상의 형성(formation), 저장 및 통신상에서 발생되는 왜곡 현상을 복원하는 연구가 많이 이루어 졌다. 원 영상 복원과 관련된 기존의 연구는 블록 정합(block matching algorithm)을 이용한 원영상 복원 방법이 있다. 이 방법은 오 정합(incorrect matching)이 발생하기 쉽고, 오 정합 시 에러가 전파되는 문제점이 있다. 그리고 장면 전환이 2회 이상 발생될 경우 장면 전환 지점과 지점 사이의 복원이 불가능하다는 문제점이 있다. 본 논문에서는 기존의 문제점들을 해결하기 위하여 확장적 블록 정합 방법(EBMA: Extended Block Matching Algorithm)과 영역 보상법(Region compensation method)을 이용한 원영상 복원 방법을 제안하고자 한다. 원영상 복원에 사용하기 위하여 비디오 사전 정보(장면 전환 정보, 카메라 모션 정보, 캡션 영역 정보)를 추출한다. 추출된 캡션 영역 정보를 이용하여 캡션 문자의 구성 요소 정보를 추출한다. 추출된 비디오 사전 정보를 이용하여 복원의 방향성을 결정하고, 복원의 방향성에 따라 문자의 구성 요소 단위로 확장적 블록 정합 방법과 영역 보상법을 이용하여 원영상 복원을 수행한다. 실험결과 확장적 블록 정합 방법은 빠른 물체의 움직임이나 복잡한 배경에 영향을 받지 않고 복원이 잘 되는 것을 알 수 있었다. 참조할 원영상이 없이 원영상 복원을 수행하는 영역 보상법의 복원 결과 또한 좋음을 볼 수 있었다.

코로나 19에 따른 프로야구 무관중 시청품질요인의 중요도, 만족도 분석 (Analysis of the Importance and Satisfaction of Viewing Quality Factors among Non-Audience in Professional Baseball According to Corona 19)

  • 백승헌;김기탁
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권2호
    • /
    • pp.123-135
    • /
    • 2021
  • 본 연구의 자료처리는 '코로나 19와 프로야구', '코로나 19와 프로야구 무관중'과 관련된 키워드를 중심으로 텍스톰(textom)프로그램의 텍스트마이닝과 소셜네트워크 분석을 활용해 문제점 도출 및 시청품질의 변인을 설정하는데 활용하였다. 정량적 분석을 위해 시청품질에 관한 설문지를 구성하였으며, 270부의 설문응답자 중 250부의 설문을 최종연구에 사용하였다. 설문지의 타당도와 신뢰도를 확보하기 위한 도구로 탐색적 요인 분석과 신뢰도 분석을 실시하였으며, 타당도와 신뢰도가 확보된 설문을 바탕으로 IPA분석(중요도-만족도)을 실시하여 결과 및 전략을 제시하였다. IPA분석을 실시한 결과 1사분면에 영상과 관련된 요인(영상구성, 영상배색, 영상 선명도, 영상 확대 및 구도, 고음질 영상)이 나타났고 2사분면은 경기상황(응원 팀 경기수준, 응원 선수 경기수준, 스타선수 발굴, 라이벌 팀과의 경기)과 경기정보(경기일정 안내, 선수정보 확인, 팀 성적 및 선수성적, 경기정보), 상호작용(응원팀과의 공감대) 일부의 요인이 나타났으며, 3사분면은 해설자(야구관련 지식, 의사전달 능력, 발음과 목소리, 표준어 사용, 경기관련 정보 소개)와 상호작용(프런트와 실시간 소통, 시청자와의 공감대, 채팅 등의 정보교환)의 요인이 나타났다.