• 제목/요약/키워드: 정보필터링

검색결과 1,884건 처리시간 0.031초

텍스트 분석 기술 및 활용 동향 (Investigations on Techniques and Applications of Text Analytics)

  • 김남규;이동훈;최호창
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.471-492
    • /
    • 2017
  • 최근 데이터의 양 자체가 해결해야 할 문제의 일부분이 되는 빅데이터(Big Data) 분석에 대한 수요와 관심이 급증하고 있다. 빅데이터는 기존의 정형 데이터 뿐 아니라 이미지, 동영상, 로그 등 다양한 형태의 비정형 데이터 또한 포함하는 개념으로 사용되고 있으며, 다양한 유형의 데이터 중 특히 정보의 표현 및 전달을 위한 대표적 수단인 텍스트(Text) 분석에 대한 연구가 활발하게 이루어지고 있다. 텍스트 분석은 일반적으로 문서 수집, 파싱(Parsing) 및 필터링(Filtering), 구조화, 빈도 분석 및 유사도 분석의 순서로 수행되며, 분석의 결과는 워드 클라우드(Word Cloud), 워드 네트워크(Word Network), 토픽 모델링(Topic Modeling), 문서 분류, 감성 분석 등의 형태로 나타나게 된다. 특히 최근 다양한 소셜미디어(Social Media)를 통해 급증하고 있는 텍스트 데이터로부터 주요 토픽을 파악하기 위한 수요가 증가함에 따라, 방대한 양의 비정형 텍스트 문서로부터 주요 토픽을 추출하고 각 토픽별 해당 문서를 묶어서 제공하는 토픽 모델링에 대한 연구 및 적용 사례가 다양한 분야에서 생성되고 있다. 이에 본 논문에서는 텍스트 분석 관련 주요 기술 및 연구 동향을 살펴보고, 토픽 모델링을 활용하여 다양한 분야의 문제를 해결한 연구 사례를 소개한다.

무선 센서 네트워크에서 효율적인 집계 질의 처리 (Efficient Processing of Aggregate Queries in Wireless Sensor Networks)

  • 김정준;신인수;이기영;한기준
    • Spatial Information Research
    • /
    • 제19권3호
    • /
    • pp.95-106
    • /
    • 2011
  • 최근 무선 센서 네트워크에서 센서로부터 원하는 데이타를 가져오는 네트워크 내 집계 질의처리 기법에 대한 연구가 활발히 진행되고 있다. 기존의 대표적인 네트워크 내 집계 질의 처리 기법들은 집계 질의 처리를 위해 라우팅 알고리즘과 데이타 구조를 제안하고 있다. 그러나 이러한 기법들은 센서 노드들의 에너지 소모가 크고, 질의 처리 결과 정확도가 떨어지고, 또한 질의 처리 시간이 오래 걸리는 문제점들을 가지고 있다. 본 논문에서는 이러한 기존 집계 질의 처리 기법들의 문제점을 해결하고 무선 센서 네트워크에서 보다 효율적인 집계 질의 처리를 위해 BPA(Bucket-based Parallel Aggregation)를 제시하였다. BPA는 질의 영역을 센서 노드 분포에 따라 쿼드 트리로 구성하여 집계 질의를 병렬로 처리하고, 각 센서 노드로 하여금 데이타를 이중 전송하게 함으로써 전송 오류로 인한 데이타 손실을 줄인다. 또한, BPA는 집계 질의 처리시 버켓 기반의 데이타 구조를 이용하고 이러한 버켓 데이타 구조를 버켓내 데이타 개수에 따라 적응적으로 분할 및 합병한다. 특히 버켓내 데이타 크기를 줄이기 위해 데이타를 압축하고 데이타 전송 횟수를 줄이기 위해 필터링을 수행한다. 마지막으로 센서 데이타를 이용한 다양한 실험을 통해 본 논문에서 제안하는 BPA의 우수성을 입증하였다.

Word2Vec 기반의 의미적 유사도를 고려한 웹사이트 키워드 선택 기법 (Web Site Keyword Selection Method by Considering Semantic Similarity Based on Word2Vec)

  • 이동훈;김관호
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.83-96
    • /
    • 2018
  • 문서를 대표하는 키워드를 추출하는 것은 문서의 정보를 빠르게 전달할 수 있을 뿐만 아니라 문서의 검색, 분류, 추천시스템 등의 자동화서비스에 유용하게 사용 될 수 있어 매우 중요하다. 그러나 웹사이트 문서에서 출현하는 단어의 빈도수, 단어의 동시출현관계를 통한 그래프 알고리즘 등의 기반으로 키워드를 추출할 경우 웹페이지 구조상 잠재적으로 주제와 관련이 없는 다양한 단어를 포함하고 있는 문제점과 한국어 형태소 분석의 정확성이 떨어지는 형태소 분석기 성능의 한계점 때문에 의미적인 키워드를 추출하는데 어려움이 존재한다. 따라서 본 논문에서는 의미적 단어 위주로 구축된 후보키워드들의 집합과 의미적 유사도 기반의 후보 키워드를 선택하는 방법으로써 의미적 키워드를 추출하지 못하는 문제점과 형태소 분석의 정확성이 떨어지는 문제점을 해결하고 일관성 없는 키워드를 제거하는 필터링 과정을 통해 최종 의미적 키워드를 추출하는 기법을 제안한다. 실 중소기업 웹페이지를 통한 실험 결과, 본 연구에서 제안한 기법의 성능이 통계적 유사도 기반의 키워드 선택기법보다 34.52% 향상된 것을 확인하였다. 따라서 단어 간의 의미적 유사성을 고려하고 일관성 없는 키워드를 제거함으로써 문서에서 키워드를 추출하는 성능을 향상시켰음을 확인하였다.

딥 러닝을 이용한 실감형 콘텐츠 특징점 추출 및 식별 방법 (A Feature Point Extraction and Identification Technique for Immersive Contents Using Deep Learning)

  • 박병찬;장세영;유인재;이재청;김석윤;김영모
    • 전기전자학회논문지
    • /
    • 제24권2호
    • /
    • pp.529-535
    • /
    • 2020
  • 4차 산업의 주요 기술로 실감형 360도 영상 콘텐츠가 주목받고 있다. 전 세계 실감형 360도 영상 콘텐츠의 시장 규모는 2018년 67억 달러에서 2020년 약 700억 달러까지 증가될 것이라고 전망하고 있다. 하지만 대부분 실감형 360도 영상 콘텐츠가 웹하드, 토렌트 등의 불법 유통망을 통해 유통되고 있어 불법복제로 인한 피해가 증가하고 있다. 이러한 불법 유통을 막기 위하여 기존 2D 영상은 불법저작물 필터링 기술을 사용하고 있다. 그러나 초고화질을 지원하고 두 대 이상의 카메라를 통해 촬영된 영상을 하나의 영상에 담는 실감형 360도 영상 콘텐츠의 특징 때문에 왜곡 영역이 존재하여 기존 2D 영상에 적용된 기술을 그대로 사용하기엔 다소 무리가 있다. 또한, 초고화질에 따른 특징점 데이터량 증가와 이에 따른 처리 속도 문제와 같은 기술적 한계가 존재한다. 본 논문에서는 이러한 문제를 해결하기 위하여 왜곡이 심한 영역을 제외한 객체 식별 영역을 선정하고, 식별 영역에서 딥 러닝 기술을 이용하여 객체를 인식하고 인식된 객체의 정보를 이용하여 특징 벡터를 추출하는 특징점 추출 및 식별 방법을 제안한다. 제안한 방법은 기존에 제안 되었던 스티칭 영역을 이용한 실감형 콘텐츠 특징점 추출방법과 비교하여 성능의 우수성을 보였다.

비행장애물 회피를 위한 라이다 기반 송전선 고속탐지 및 적용가능성 분석 (Fast Detection of Power Lines Using LIDAR for Flight Obstacle Avoidance and Its Applicability Analysis)

  • 이미진;이임평
    • Spatial Information Research
    • /
    • 제22권1호
    • /
    • pp.75-84
    • /
    • 2014
  • 송전선은 항공사고를 야기하는 대표적인 장애물로써 인지되며, 비행 중 충돌회피를 위해 송전선의 실시간 탐지는 아주 중요하다. 최근 들어 이러한 비행장애물 회피를 위해 기상조건에 영향을 덜 받으며 주야에 관계없이 데이터 획득이 가능한 라이다의 활용이 증가하고 있다. 이에 본 연구에서는 라이다 데이터를 이용하여 비행장애물 회피를 위해 송전선을 고속으로 탐지하는 방법을 개발하였다. 제안된 방법은 먼저 지표면에서 반사된 점을 필터링 과정을 통해 제거하여 비지면점을 추출하고, 이중에서 분산 행렬의 고유값 비율을 이용하여 선형적으로 분포하는 점들을 추출하고, 마지막으로 송전탑(기둥)이나 굴뚝같이 수직방향으로 선형적으로 분포하는 점들이나 길이가 작은 선형점들을 제거한다. 구현된 알고리즘의 성능을 검증하기 위해 송전선이 포함된 영역에서 취득된 실측 및 시뮬레이션 데이터에 적용하였다. 탐지성능은 약 80%정도로 분석되었고, 처리시간은 평균 0.2초가 소요되었다. 향후 제시된 방법을 다양한 시험환경에 대해 실험을 수행하여 개선한다면, 비행장애물 회피용 시스템에 효과적으로 활용될 것을 판단된다.

움직임과 영상 패턴 서술자를 이용한 중복 동영상 검출 (Detecting near-duplication Video Using Motion and Image Pattern Descriptor)

  • 진주경;나상일;정동석
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.107-115
    • /
    • 2011
  • 본 논문은 대용량 동영상을 관리하기 위한 빠르고 효율적인 내용기반 중복 동영상 검출 알고리즘을 제안한다. 효율적인 중복 동영상 검출을 위해 대용량의 동영상을 처리하기 쉬운 작은 단위로 나누는 동영상 장면 전환 기반 분할 기술을 적용하였다. 동영상 서비스 및 저작권 보호 관련 사업모델의 경우, 필요한 기술은 아주 작은 구간의 동영상이나 한 장의 영상 을 검색하기보다는 상당한 길이 이상 일치하는 동영상을 파악하는 기술이 필요하다. 이러한 중복 동영상 검출을 위해 본 논문에서 동영상을 장면 전환을 기준으로 분할하여, 나누어진 장면 내에서 움직임 분포 서술자와 대표 프레임을 선택하여 프레임 서술자를 추출한다. 움직임 분포 서술자는 동영상 디코딩 과정에서 얻어지는 매크로 블록의 움직임 벡터를 이용한 장면 내 움직임 분포 히스토그램을 구성하였다. 움직임 분포 서술자는 정합시 고속 정합이 가능하도록 필터링 역할을 한다. 반면 움직임 정보만는 낮은 변별력을 가진다. 이를 높이기 위해 움직임 분포 서술자를 이용하여 정합된 장면간에 선택된 대표 프레임의 패턴 서술자를 이용하여 동영상의 중복 여부를 최종 판단한다. 제안된 방법은 실제 동영상 서비스 환경에서 우수한 인식률과 낮은 오인식률을 가질 뿐만아니라 실제 적용이 가능할 정도의 빠른 정합 속도를 얻을 수 있었다.

Wiener Filtering 기법을 적용한 홈헬스케어용 심전도 신호 모니터링 시스템 구현 (Implementation of the ECG Monitoring System for Home Health Care Using Wiener Filtering Method)

  • 정도운;김세진
    • 융합신호처리학회논문지
    • /
    • 제9권2호
    • /
    • pp.104-111
    • /
    • 2008
  • 심전도(electrocardiogram, ECG)는 심장의 수축과 이완에 따라 체표면에서 측정 가능한 생체전기신호이며, 환자의 심장 상태와 일반적인 건강 정보를 제공하므로 건강모니터링을 위한 중요한 지표로서 인식된다. 심전도신호에는 전원잡음, 근잡음 등과 같은 고주파잡음과 동잡음과 같은 저주파 잡음이 포함되는 경우가 많다. 하지만 심전도로부터 잡음을 제거하는 것은 쉽지 않으며, 필터링 결과는 심전도신호의 외곡을 초래할 수도 있다. 본 연구에서는 일상생활 중 건강모니터링용으로 사용하기 위해 동잡음에 강인한 소형의 저전력 심전도측정 시스템을 구현하였다. 심전도 모니터링 시스템은 심전도 증폭기, 마이크로프로세서, 블루투스모듈, 모니터링 프로그램등으로 구성하였다. 심전도증폭기는 저전력 계측용 증폭기를 이용하여 설계 및 구현하였으며, 증폭기로부터 데이터를 수집하여 신호처리하고 무선전송하기 위해 마이크로프로세서를 사용하였다. 그리고 마이크로프로세서로부터 PC로 데이터를 전송하기 위해 블루투스 모듈을 사용하였다. 구현된 시스템의 성능 평가를 위하여 적응필터 성능평가 시뮬레이션을 수행하였으며, 실제 동잡음 환경에서 신호측정 및 잡음제거 실험을 수행하여 잡음제거 특성을 평가하였다.

  • PDF

추천기법별 고객 선호도 및 영향요인에 대한 분석: 전자제품과 의류군에 대한 비교연구 (An Analysis of Customer Preferences of Recommendation Techniques and Influencing Factors: A Comparative Study of Electronic Goods and Apparel Products)

  • 박윤주
    • 경영정보학연구
    • /
    • 제18권2호
    • /
    • pp.59-77
    • /
    • 2016
  • 전자상거래 시장에서는 점차 다양한 추천기법들이 적용되고 있으나, 고객 관점에서 이에 대한 사용의도를 비교 분석한 연구는 매우 드물다. 본 연구는, 온라인 쇼핑몰에서 널리 활용되고 있는 베스트셀러 추천, MD(Merchandiser)추천, 내용기반 추천, 협업필터링 추천, 그리고 지인추천 등의 다섯 가지 추천기법들에 대한 고객의 사용의도를, 전자제품군 구매 시와 의류군 구매 시에 대해서 비교 분석하였다. 이와 더불어, 어떠한 요소들이 고객의 추천서비스 사용의도에 영향을 미치는지에 대한 연구를 수행하였다. 이를 위해, 추천서비스 사용경험이 있는 전자상거래 사용자 총 220명을 대상으로 설문조사를 수행한 후, 분산분석(ANOVA), 회귀분석 등을 사용하여 데이터 분석을 수행하였다. 본 연구결과, 추천기법에 따른 고객의 추천서비스 사용의도에는 통계적으로 유의한 차이가 있으며, 특히 전자제품군 구매 시에는 베스트셀러 추천기법이, 의류군 구매 시에는 내용기반의 추천기법이 가장 선호되는 것으로 나타났다. 또한, 고객의 인물특성, 성격요인, 구매성향, 구매하려는 제품에 대한 인식 및 추천서비스에 대한 인식 등이 추천서비스 사용의도에 영향을 미치는 것으로 나타났으나, 세부적인 영향요소들은 추천기법별로 상이하게 도출되었다. 이러한 연구는 기업들에게 제품군 및 개인의 성향에 적합한 기법을 채택하여 추천서비스를 수행할 수 있도록 하는 가이드라인(guideline)을 제시해 줄 수 있을 것으로 기대된다.

축구 경기 분석 I : 영상 모자익을 통한 축구 선수의 운동장 궤적 추출 (Soccer Game Analysis I : Extraction of Soccer Players' ground traces using Image Mosaic)

  • 김태원;홍기상
    • 전자공학회논문지S
    • /
    • 제36S권1호
    • /
    • pp.51-59
    • /
    • 1999
  • 본 논문에서는 축구 경기 자동 분석을 위한 첫걸음으로 일반적인 축구 경기 영상열에서 선수 및 공을 추적하고 영상 모자의 기법을 이용해서 운동장 모델 상에서 선수가 움직인 궤적을 알아내는 기법을 제시한다. 여기서 일반걱인 축구 경기 영상열이란 극도의 zoom-in 또는 zoom-out 아닌 경우로 TV 카메라가 공을 쫓아 자연스럽게 움직이는 상황의 영상을 말한다. 이러한 영상열로부터 선수의 궤적을 구하기 위해선 다음과 같이 크게 세 가지 문제를 해결해야한다. 첫째로 입력 영상에서 운동장 부분을 추출하는 문제, 둘째로 선수 및 공을 추적하고 선수들의 팀을 구분하는 문제, 마지막으로 영상에서의 선수의 위치를 실제 운동장 좌표로의 변환을 통해 선수가 움직인 자취를 운동장 모델 상에서 구하는 문제가 그것이다. 운동장의 추출은 칼라 정보를 이용하였고 이 추출된 운동장 영역 하에서 템플릿 매칭과 Kalman 필터링을 이용하여 선수와 공을 추적했다. 선수간 겹침 문제에 대해서는 CHBP(Color Histogram Back-Projection) 기법을 적용했다. 특히 선수가 운동장에서 움직인 궤적을 구하기 구하기 위해서 입력 영상에서 보이는 특징점들을 이용하여 운동장 모델 좌표와 입력 영상 좌표간의 변환을 구하고 이를 통해 운동장 모델에서의 선수의 위치를 구했다. 이때에 입력 영상에서 특징점이 충분치 않을 경우 영상 모자익 기법을 이용하여 특징점이 보이는 영상과의 좌표 변환 관계를 구함으로써 해결하였다. 실험적으로 실제 TV에서 방영된 축구 경기 영상열에 제안된 방법을 적용하여 얻어진 결과를 보인다.

  • PDF

물리탐사를 이용한 국내 유류오염지역 조사 사례 (A geophysical survey result over a hydrocarbon contaminated site)

  • 송윤호;박삼규;설순지;조성준;정승환
    • 한국지구물리탐사학회:학술대회논문집
    • /
    • 한국지구물리탐사학회 2001년도 정기총회 및 제3회 특별지포지움
    • /
    • pp.122-140
    • /
    • 2001
  • 유류오염물질의 매립 및 국부적인 유류누출에 의한 토양오염지역에서 시험탐사구역을 설정하고 전기, 전자탐사 기술을 위주로 물리탐사 기술을 적용하여 매설물 탐지 및 오염범위 규명 가능성을 시험하였다. 먼저 매설관로 및 매립지역의 탐지에는 GPR 탐사와 더불어 다중주파수 이동송수신 전자탐사가 매우 효과적인 것으로 판명되었다 한편 수직 및 수평구배 측정방식 자력탐사의 경우 지표에 많이 존재하는 금속 파편 등에 의한 반응이 우세하여 매설관로 등의 탐지는 어려웠다. 유류오염 범위의 규명을 위해서는 전기비저항 탐사와 전자탐사, GPR 탐사가 적용되었다. 먼저 전기비저항 탐사자료의 2차원 역산 결과 및 공간 필터링을 적용한 후의 전자탐사 자료의 1차원 역산 결과로부터 각각 심도별 전기비저항 분포 영상을 작성하였다. 유류오염대가 주변 실트층에 비해 전기비저항이 높다는 가정하에 고비저항 이상대의 분포범위를 해석하였는데, 전기비저항 탐사와 전자탐사자료가 서로 잘 일치하였으며, 시료분석에 의한 오염범위와 대체적으로 일치하였다. GPR 탐사에서는 이 지역의 오염 특성상 유류오염 Plume에 의한 반사신호 등은 기록되지 않았으며, 단지 신호 에너지의 투과심도로부터 오염지역을 추정하였는데, 전기 및 전자탐사자료 해석의 보조적인 정보 제공 수준이었다 이러한 결과로부터 유류오염부지 조사를 위한 물리탐사기술의 적용성을 정리하였고 효과적인 탐사 흐름도를 제시하였다.

  • PDF