• 제목/요약/키워드: User Generated Text

검색결과 65건 처리시간 0.024초

거북목 자세를 예방하기 위한 목 건강 경고 알고리즘 (A neck healthy warning algorithm for identifying text neck posture prevention)

  • 이재은;김종남;최홍석;김영봉
    • 융합신호처리학회논문지
    • /
    • 제23권3호
    • /
    • pp.115-122
    • /
    • 2022
  • 몇 년 전 코로나가 발병하면서 화상 회의, 전자 문서 작업이 많아지게 되었고 이 때문에 현대인들의 하루 일과 중에서 컴퓨터 작업을 하는 비중이 증가하고 있다. 하지만 오랜 시간 동안 잘못된 자세로 컴퓨터 작업을 하는 사람들이 많아지게 되면서 시력 저하, 거북목증후군 환자들이 늘고 있다. 최근까지도 자세 교정을 위한 연구들이 많이 발표되고 있지만 대부분은 사용자가 장비를 착용하여 자세 교정을 해야 하므로 사용자가 불편함을 겪을 수 있다는 한계가 있다. 본 논문에서는 초음파 센서 장치를 이용하여 컴퓨터 모니터와 사람 사이의 최소 거리 접근을 방지하기 위한 자세 교정 센서 시스템을 제안한다. 그리고 이때 최소 거리 시 울리는 경고 알람 중 오류 알람을 최소화하는 알고리즘도 함께 제안한다. 이는 초음파 센서 장치를 이용하기 때문에 몸에 기기를 부착하지 않고도 자세 교정을 할 수 있으며 사용자의 불편함을 해소할 수 있다는 장점이 있다. 또한, 실험 결과에서 거리 측정 시 발생한 잡음을 제거하여 오류 알람을 줄임으로써 정확도를 높일 수 있음을 보였다.

정보추출결과의 시각화 표현방법에 관한 이용성 평가 연구 (A Usability Evaluation on the Visualization of Information Extraction Output)

  • 이지연
    • 한국문헌정보학회지
    • /
    • 제39권2호
    • /
    • pp.287-304
    • /
    • 2005
  • 이 연구의 목적은 자동적으로 추출된 정보를 시각화 브라우저를 통해 표현하고 접근하는 방법에 대해 이용성평가를 수행하는 것이다. 특정 주제 분야에 국한되지 않는 정보추출시스템을 사용하여 신문기사에서 의미정보를 자동 추출하였고, 그 결과로 시각적으로 브라우저 할 수 있는 지식베이스를 구축하였다. 이 연구에 이용된 정보추출시스템은 신문기사의 텍스트정보로부터 다양한 자연언어처리 기술을 적용하여 개념-관계-개념의 형태로 표현되는 정보를 자동적으로 추출하였다. 지식베이스에 저장된 정보를 시각적으로 표현하는 시각화 브라우저를 구현하였는데, 이때 인터페이스 부분은 쌍곡면형 정보시각화 시스템의 하나인 PersonalBrain을 이용하여 개발하였다. PersonalBrain을 이용하면 표현하고자 하는 정보를 논리관계의 네트워크 형태로 연결할 수 있다. 지식베이스 정보의 시각화 접근방법에 대하여 15명의 이용자를 대상으로 질적 평가를 수행하였다. IS명의 연구대상자로 하여금 시각화 브라우저를 이용하도록 하고 관찰과 인터뷰를 통하여 이용성평가 데이터를 수집하였다. 내용분석결과, 이용자들은 정보추출결과의 시각화 브라우저 이용가능성에 대해 긍정적인 반응을 보인 동시에 몇 가지 이용성 관련 문제점을 지적하였다.

레이더강우 자료 활용 증진을 위한 표출 및 분석 프로그램 구현 (Implementation of a Display and Analysis Program to improve the Utilization of Radar Rainfall)

  • 노희성
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권7호
    • /
    • pp.1333-1339
    • /
    • 2018
  • 최근 집중호우 등 기상으로 인한 재해가 증가함에 따라 수문기상, 방재분야에서 레이더를 이용한 기상 및 재해예측에 대한 관심이 증대되고 관련연구가 활발히 이루어지고 있다. 환경부 등에서는 레이더 네트워크를 전국적으로 구축 운영함에 따라 레이더의 활용성이 강조되고 있지만, 레이더자료를 활용하고자 하는 실무자 및 연구자들은 레이더자료의 특성을 이해해야하고 레이더자료 형식(UF)의 변환과 보정에 시행착오를 경험하고 있다. 이에 본 연구에서는 UF형식의 레이더자료를 이미지 및 텍스트파일(ASCII file)로 생성할 수 있도록 JAVA 언어를 이용한 GUI방식의 레이더자료를 표출 및 분석 프로그램(RaDAP; Radar Display and Analysis Program)을 개발하였다. 본 프로그램을 이용하여 원하는 레이더강우 자료를 도출하고 이를 이용한 분석을 수행하는데 필요한 소요시간을 최소화 할 수 있어 다양한 분야에서 레이더자료의 활용성을 높이는데 기여할 것으로 예상된다.

경로 공유 채팅 시스템의 설계 및 구현 (The Design and Implementation of a Chatting System Sharing Paths)

  • 김동현;이한빈;반재훈
    • 한국전자통신학회논문지
    • /
    • 제12권2호
    • /
    • pp.281-286
    • /
    • 2017
  • 사회관계망서비스(Social Network Service, SNS)는 사용자들 간에 관계를 형성하고 의견과 정보를 공유하기 위한 플랫폼이다. 이를 위하여 텍스트 데이터와 함께 이미지, 동영상 데이터를 교환할 수 있게 지원한다. 스마트기기의 위치 데이터를 지원함에 따라 SNS에서 위치 데이터를 사용하기 위한 시도가 있었다. 그러나 SNS가 좌표 데이터를 지원하지 않기 때문에 이미지화된 지도를 교환하는 제한적인 기능만을 제공하였다. 이 논문에서는 전통적인 SNS인 채팅 시스템에서 좌표 데이터를 지원한기 위한 경로 공유 채팅 시스템을 제안한다. 제안한 시스템은 사용자가 방에 참여하면 참여한 사용자간에 텍스트 교환과 함께 동일한 영역의 지도를 볼 수 있게 한다. 만약 한 사용자가 지도에서 경로를 작성하면 경로의 좌표 데이터를 다른 사용자들에게 실시간으로 전파하여 볼 수 있게 한다. 구현한 시스템은 사용자간에 좌표 데이터를 이용하여 쉽게 지도 관련 정보를 교환할 수 있는 장점이 있다.

Spark 프레임워크 기반 비정형 빅데이터 토픽 추출 시스템 설계 (A Design on Informal Big Data Topic Extraction System Based on Spark Framework)

  • 박기진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.521-526
    • /
    • 2016
  • 온라인상에서 다루어지는 비정형 텍스트 데이터는 대용량이면서 비구조적 형태의 특성을 가지고 있기 때문에, 기존 관계형 데이터 모델의 저장 방식과 분석 방법만으로는 한계가 있다. 더군다나, 동적으로 발생하는 대량의 소셜 데이터를 활용하여 이용자의 반응을 실시간으로 분석하기란 어려운 상황이다. 이에 본 논문에서는 대용량 비정형 데이터(문서)의 의미를 빠르고, 용이하게 파악하기 위하여 데이터 셋에 대한 사전학습 없이, 문서 내 단어 비중에 따라 자동으로 토픽(주제)이 추출되는 시스템을 설계 및 구현하였다. 제안된 시스템의 토픽 모델링에 사용될 입력 단어는 N-gram 알고리즘에 의하여 도출되어 복수 개의 단어도 묶음 처리할 수 있게 했으며, 또한, 대용량 비정형 데이터 저장 및 연산을 위하여 Hadoop과 분산 인메모리 처리 프레임워크인 Spark 기반 클러스터를 구성하여, 토픽 모델 연산을 수행하였다. 성능 실험에서는 TB급의 소셜 댓글 데이터를 읽어 들여, 전체 데이터에 대한 전처리 과정과 특정 항목의 토픽 추출 작업을 수행하였으며, 대용량 데이터를 클러스터의 디스크가 아닌 메모리에 바로 적재 후, 처리함으로써 토픽 추출 성능의 우수성을 확인할 수 있었다.

온라인 지식공유의 참여정도: 위키피디아에 대한 행태적 접근 (Participation Level in Online Knowledge Sharing: Behavioral Approach on Wikipedia)

  • 박현정;이홍주;김종우
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.97-121
    • /
    • 2013
  • 급변하는 환경 속에서 지속적인 경쟁우위와 혁신을 위한 지식의 중요성이 증대되면서, 그 동안 지식공유에 관한 많은 연구들이 있었다. 그런데, 이러한 연구들의 대부분이 응답자의 인지오차가 내재된 서베이에 의존해왔다. 본 연구는 대표적인 온라인 지식협업 커뮤니티인 위키피디아 유저들의 온라인 행위만을 토대로 지식공유 참여정도에 대한 행위 특성들간의 관계를 도출하였다. 그런데, 유저들의 편집 참여 패턴이 서로 다르기 때문에 편집횟수는 같아도 재방문기간은 달라질 수 있고 이에 따라 지식공유 결과가 달라질 수 있으므로, 지식공유 참여정도를 아티클 편집 참여횟수와 재방문기간의 두 가지 관점에서 접근하였다. 지식공유 참여정도에 영향을 미치는 행위특성으로는 위키 플랫폼에서 관찰이 가능한, 공적인 토론툴인 아티클 톡과 사적인 메시징 툴인 유저 톡 참여여부 및 정도, 그리고 커뮤니티 등록여부를 사용하였다. 행위 분석은 먼저, 행위특성 차원에 의한 유저 카테고리별 참여정도를 비교하였고, 행위 특성의 정도를 반영하는 독립변수들과 참여정도를 나타내는 종속변수간의 관계에 대한 로버스트 회귀분석을 수행하였다. 특히, 연구가설을 설정하는 단계에서 온라인 환경에 적합한 모티베이션 이론을 도입함으로써, 온라인 지식공유 참여정도에 관한 이론적인 설명 모델을 제시하였다. 결론적으로, 본 연구는 이론적인 시사점 외에 다음과 같은 실제적인 행위 결과를 얻었다. 첫째, 공적인 토론 및 사적인 메시징 참여와 지식공유 참여정도간에는 양의 관계가 성립한다. 둘째, 공적인 토론이 사적인 메시징 보다 지식공유 참여정도에 더 큰 영향력을 미친다. 셋째, 아티클 편집 참여횟수에 대해서는 공적인 토론과 사적인 메시징의 시너지 효과가 존재하는 반면에, 재방문기간에 대해서는 아주 약한 음의 상호작용효과를 나타낸다. 넷째, 커뮤니티 등록 여부는 재방문기간에 대해서는 절대적인 양의 영향력을 미치지만, 실질적인 편집 참여횟수에 대해서는 유의한 영향력을 나타내지 않는다. 다섯째, 사적인 메시징에 의한 관계성을 고려할 때, 관계의 범위보다는 빈도 또는 깊이가 더 중요한 것으로 보인다.

영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축 (A Study on Analyzing Sentiments on Movie Reviews by Multi-Level Sentiment Classifier)

  • 김유영;송민
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.71-89
    • /
    • 2016
  • 누구나 본인이 사용한 제품이나, 이용한 서비스에 대한 후기를 자유롭게 인터넷에 작성할 수 있고, 이러한 데이터의 양은 점점 더 많아지고 있다. 감성분석은 사용자가 생성한 온라인 텍스트 속에 내포된 감성 및 감정을 식별하기 위해 사용된다. 본 연구는 다양한 데이터 도메인 중 영화 리뷰를 분석 대상으로 한다. 영화 리뷰를 이용한 기존 연구에서는 종종 리뷰 평점을 관객의 감성으로 동일시하여 감성분석에 이용한다. 그러나 리뷰 내용과 평점의 실제적 극성 정도가 항상 일치하는 것은 아니기 때문에 연구의 정확성에 한계가 발생할 수 있다. 이에 본 연구에서는 기계학습 기반의 감성 분류기를 구축하고, 이를 통해 리뷰의 감성점수를 산출하여 리뷰에서 나타나는 감성의 수치화를 목표로 한다. 나아가 산출된 감성점수를 이용하여 리뷰와 영화 흥행 간의 연관성을 살펴보았다. 감성분석 모델은 지지벡터 분류기와 신경망을 이용해 구축되었고, 총 1만 건의 영화 리뷰를 학습용 데이터로 하였다. 감성분석은 총 175편의 영화에 대한 1,258,538개의 리뷰에 적용하였다. 리뷰의 평점과 흥행, 그리고 감성점수와 흥행과의 연관성은 상관분석을 통해 살펴보았고, t-검정으로 두 지표의 평균차를 비교하여 감성점수의 활용성을 검증하였다. 연구 결과, 본 연구에서 제시하는 모델 구축 방법은 나이브 베이즈 분류기로 구축한 모델보다 높은 정확성을 보였다. 상관분석 결과로는, 영화의 주간 평균 평점과 관객 수 간의 유의미한 양의 상관관계가 나타났고, 감성점수와 관객 수 간의 상관분석에서도 유사한 결과가 도출되었다. 이에 두 지표간의 평균을 이용한 t-검정을 수행하고, 이를 바탕으로 산출한 감성점수를 리뷰 평점의 역할을 할 수 있는 지표로써 활용 가능함을 검증하였다. 나아가 검증된 결론을 근거로, 트위터에서 영화를 언급한 트윗을 수집하여 감성분석을 적용한 결과를 살펴봄으로써 감성분석 모델의 활용 방안을 모색하였다. 전체적 실험 및 검증의 과정을 통해 본 연구는 감성분석 연구에 있어 개선된 감성 분류 방법을 제시할 수 있음을 보였고, 이러한 점에서 연구의 의의가 있다.

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.

내용기반의 인쇄체 영문 문서 영상 검색을 위한 특징 기반 단어 검색 (A Feature -Based Word Spotting for Content-Based Retrieval of Machine-Printed English Document Images)

  • 정규식;권희웅
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1204-1218
    • /
    • 1999
  • 문서영상 검색을 위한 디지털도서관의 대부분은 논문제목과/또는 논문요약으로부터 만들어진 색인에 근거한 제한적인 검색기능을 제공하고 있다. 본 논문에서는 영문 문서영상전체에 대한 검색을 위한 단어 영상 형태 특징기반의 단어검색시스템을 제안한다. 본 논문에서는 검색의 효율성과 정확도를 높이기 위해 1) 기존의 단어검색시스템에서 사용된 특징들을 조합하여 사용하며, 2) 특징의 개수 및 위치뿐만 아니라 특징들의 순서를 포함하여 매칭하는 방법을 사용하며, 3) 특징비교에 의해 검색결과를 얻은 후에 여과목적으로 문자인식을 부분적으로 적용하는 2단계의 검색방법을 사용한다. 제안된 시스템의 동작은 다음과 같다. 문서 영상이 주어지면, 문서 영상 구조가 분석되고 단어 영역들의 조합으로 분할된다. 단어 영상의 특징들이 추출되어 저장된다. 사용자의 텍스트 질의가 주어지면 이에 대응되는 단어 영상이 만들어지며 이로부터 영상특징이 추출된다. 이 참조 특징과 저장된 특징들과 비교하여 유사한 단어를 검색하게 된다. 제안된 시스템은 IBM-PC를 이용한 웹 환경에서 구축되었으며, 영문 문서영상을 이용하여 실험이 수행되었다. 실험결과는 본 논문에서 제안하는 방법들의 유효성을 보여주고 있다. Abstract Most existing digital libraries for document image retrieval provide a limited retrieval service due to their indexing from document titles and/or the content of document abstracts. This paper proposes a word spotting system for full English document image retrieval based on word image shape features. In order to improve not only the efficiency but also the precision of a retrieval system, we develop the system by 1) using a combination of the holistic features which have been used in the existing word spotting systems, 2) performing image matching by comparing the order of features in a word in addition to the number of features and their positions, and 3) adopting 2 stage retrieval strategies by obtaining retrieval results by image feature matching and applying OCR(Optical Charater Recognition) partly to the results for filtering purpose. The proposed system operates as follows: given a document image, its structure is analyzed and is segmented into a set of word regions. Then, word shape features are extracted and stored. Given a user's query with text, features are extracted after its corresponding word image is generated. This reference model is compared with the stored features to find out similar words. The proposed system is implemented with IBM-PC in a web environment and its experiments are performed with English document images. Experimental results show the effectiveness of the proposed methods.